兩種探知路徑,200億美元的廣闊市場(chǎng)
人類(lèi)對于情緒的研究由來(lái)已久,目前已有百年歷史。從“6種情緒分類(lèi)”到“27種情緒分類(lèi)”,情緒的概念定義以及狀態(tài)分類(lèi)正在逐漸完善延伸。在人工智能熱潮的影響下,AI情緒識別開(kāi)始逐漸成為新秀力量,并逐漸邁向商業(yè)化進(jìn)程。
目前AI情緒識別已有的兩種探知模式為視覺(jué)情緒識別以及語(yǔ)音情緒識別。
視覺(jué)情緒識別主要以計算機視覺(jué)技術(shù)依托,能夠精準識別面部表情,想讓機器根據面部表情識別人類(lèi)情緒還稍有欠缺,還需要通過(guò)傳感器、攝像頭等外部硬件進(jìn)行支撐。另一種方式主要是對面部情緒相關(guān)數據集進(jìn)行標簽化分類(lèi),通過(guò)機器學(xué)習算法進(jìn)行針對性訓練,從而實(shí)現精準情緒分類(lèi)。
情緒不只能被“看”見(jiàn),還能被“聽(tīng)”見(jiàn),憤怒時(shí)語(yǔ)調高昂,悲傷時(shí)語(yǔ)調低沉,語(yǔ)音情緒識別主要從語(yǔ)音、語(yǔ)調、音高等多個(gè)維度對用戶(hù)的情緒加以判定。這種形式大多作為智能語(yǔ)音技術(shù)應用的輔助性技術(shù)出現,主要應用于智能客服領(lǐng)域。一項技術(shù)的出現并不代表技術(shù)的成熟度、應用廣泛度、應用深度就達到了可觀(guān)的水平,這還需要技術(shù)的打磨以及應用場(chǎng)景的正確選擇包括具備將AI產(chǎn)品快速復制的能力。智能客服領(lǐng)域能將情緒識別技術(shù)快速嫁接到應用場(chǎng)景的還在少數,但是不乏垂直領(lǐng)域內的頭部企業(yè),例如竹間智能、意能通、硅基等等。意能通融合聲紋識別、情緒識別技術(shù)推出智能反欺詐業(yè)務(wù),有效提高銀行的風(fēng)控水平,有效促進(jìn)銀行征信體系的完善構建。與意能通不一樣,竹間智能則是將融合了語(yǔ)音、圖像等多模態(tài)的情緒識別技術(shù)嫁接進(jìn)自身的智能客服業(yè)務(wù)中,以更完善的情感反饋強化智能客服機器人的情感認知,促進(jìn)人機交互趨向情感化、智慧化。
最近有消息稱(chēng),亞馬遜正在研發(fā)搭載情緒識別技術(shù)的可穿戴設備,后期還會(huì )接入APP轉化為產(chǎn)品推薦或銷(xiāo)售。亞馬遜、微軟等巨頭入局,曠世、竹間智能、意能通等垂直領(lǐng)域AI企業(yè)跟進(jìn),AI情緒識別產(chǎn)業(yè)規模和市場(chǎng)份額正在持續擴大,技術(shù)應用也逐漸向多領(lǐng)域、多場(chǎng)景擴散,包括招聘、智能客服、健康評估、疲勞駕駛檢測等等。
情緒是心理性名詞,AI是技術(shù)性名詞
情緒百科百科給出的解釋是:情緒對一系列主觀(guān)認知經(jīng)驗的通稱(chēng),是多種感覺(jué)、思想和行為綜合產(chǎn)生的心理和生理狀態(tài)。情緒的外在表現形式多樣,但情緒歸根結底是一種心理行為,傷心時(shí)是微笑而不是哭泣,生氣憤怒時(shí)是面無(wú)表情而不是大吼大叫,這種情況并不少見(jiàn),這是因為個(gè)體差異造成的情緒表現形式不同。
不同于情緒的心理化,AI作為一種技術(shù)性工具缺少了情緒具備的靈活性。AI與生俱來(lái)的“刻板印象”讓情緒識別的識別結果缺乏全面性與精準性,對于情緒的深層認知以及對人性化行為的探索是AI已有的弊病,在語(yǔ)音交互等方面可見(jiàn)一斑。
AI情緒識別不是將情緒與AI判定結果“連線(xiàn)配對”的行為,而是盡可能地挖掘AI的能力,增強AI的情緒理解能力,逐漸消除情緒與人工智能技術(shù)之間的本質(zhì)性差異,以此在人類(lèi)與更多的智能設備間建立起緊密的聯(lián)系,使人機關(guān)系更融洽,人機交互更人性。
雖說(shuō)AI情緒識別技術(shù)應用的深度和廣度有待強化,但是科學(xué)技術(shù)就是一個(gè)廣種薄收的過(guò)程,隨著(zhù)技術(shù)的持續開(kāi)拓以及優(yōu)化升級,情緒識別技術(shù)的潛力被釋放,情緒識別或將迎來(lái)深度應用時(shí)代,收獲技術(shù)的果實(shí)。
人性化:機器智能的終極目標?
AI情緒識別作為提升人機交互流暢度的重要技術(shù),已經(jīng)逐漸滲透進(jìn)AI各項應用中,使具體業(yè)務(wù)場(chǎng)景中的人機對話(huà)更具情感化、人性化。算法模型的提出、現有模型的優(yōu)化、深入鉆研的學(xué)術(shù)研究等環(huán)環(huán)相扣,努力追尋人機交互高人性化的目標。
智能客服采用先進(jìn)的語(yǔ)音合成技術(shù),訓練甜美音、大叔音等多種人聲,有效避免了機械化;智能音箱借由語(yǔ)音識別、自然語(yǔ)義理解等技術(shù)構建“人設”、推進(jìn)類(lèi)人交流,有效提升情感認知以及品牌溢價(jià);谷歌助手能夠發(fā)信息、接電話(huà)、定餐廳。顯然,人工智能應用正朝著(zhù)人性化邁進(jìn),然而并不是所有機器都應該將其視為最終目標。在技術(shù)匹配不上場(chǎng)景的時(shí)候,在宣傳的AI能力匹配不上用戶(hù)認知的時(shí)候,務(wù)實(shí)或許會(huì )更容易提高用戶(hù)接受度,強化用戶(hù)的期待值管理,消弭理想與現實(shí)之間落差,有更多空間以待進(jìn)步。
在A(yíng)I科技賦能各行各業(yè)的今天,情緒識別作為一個(gè)關(guān)口讓人們探知到了機器與人之間的微妙聯(lián)系。隨著(zhù)創(chuàng )新性AI技術(shù)逐漸涌現,全行業(yè)乃至全社會(huì )都能對AI有更加明確的認知,機器與人之間的聯(lián)系也將更加緊密,人機耦合也許才是人工智能新時(shí)代的主題。