古有聽(tīng)聲辨位,今有聽(tīng)聲"識"人。說(shuō)到聲音,其本質(zhì)是不同頻率聲音的集合,以波的形式振動(dòng)(震動(dòng))傳播。由于每個(gè)人的發(fā)聲器官(口腔、鼻腔、聲帶)各不相同,因此每個(gè)人的聲音也不一樣。因而,你的聲音代表了個(gè)人很多關(guān)鍵信息,例如,性別、年齡、音色等特征。
前幾年,韓國大熱的刑偵劇《Voice》里,女主是一個(gè)報警中心電話(huà)接聽(tīng)員,天生聽(tīng)力過(guò)人,不僅能聽(tīng)到很多常人聽(tīng)不到的細小微弱的聲音,還能分辨出人講話(huà)的聲音、物體碰撞的聲音、環(huán)境背景音等,靠著(zhù)這個(gè)聽(tīng)聲辨物的"超能力",女主通過(guò)現場(chǎng)聲音,準確的分辨人、物、地點(diǎn),幫助組員破獲了很多案件和解救人質(zhì)。
如今,這種通過(guò)解讀聲音來(lái)識人辨物,已經(jīng)完全能靠人工智能來(lái)實(shí)現了,即眾所周知的聲音識別。
在我們日常生活當中,聲音識別已經(jīng)應用得非常廣泛了。比如說(shuō)我們平時(shí)使用一些智能家居設備時(shí),通過(guò)語(yǔ)音進(jìn)行指令操控;在不方便進(jìn)行手動(dòng)輸入的場(chǎng)景下,可以通過(guò)語(yǔ)音輸入,進(jìn)行網(wǎng)頁(yè)搜索、導航設定、文本錄入,動(dòng)嘴不動(dòng)手,方便快捷。
但僅僅是這樣還不夠。在實(shí)際的應用場(chǎng)景里,用戶(hù)的說(shuō)話(huà)環(huán)境往往包含各種各樣的噪聲,會(huì )在一定程度上污染說(shuō)話(huà)人的聲音信號,使算法無(wú)法準確獲取說(shuō)話(huà)人的聲紋特征;甚至由于說(shuō)話(huà)人過(guò)多,無(wú)法準確分離出目標人的聲音,提取不到準確的聲紋特征等因素,都會(huì )對識別效果有影響。
標貝科技立足于對AI的理解,依托先進(jìn)的語(yǔ)音交互技術(shù),以語(yǔ)言和語(yǔ)音為入口,持續研發(fā)全新的AI語(yǔ)音能力,打造更懂用戶(hù)的語(yǔ)音服務(wù)和更接地氣的語(yǔ)音產(chǎn)品,目前已經(jīng)推出中英文語(yǔ)音識別、多語(yǔ)種語(yǔ)音合成、聲音轉換和聲紋識別服務(wù),均得到落地應用。與此同時(shí),標貝科技持續深挖細分領(lǐng)域,全新上線(xiàn)聲音理解功能,不僅能聽(tīng)懂用戶(hù)說(shuō)什么,還能鑒定用戶(hù)身份。
標貝科技聲音理解,即通過(guò)聲音識別基本算法,自動(dòng)對說(shuō)話(huà)人的語(yǔ)音信號進(jìn)行特征提取,構建聲音分析框架,由機器進(jìn)行語(yǔ)音數據分析,快速區分噪音與人聲,并判定發(fā)音人性別和年齡段,進(jìn)行更加精準化的信息匹配。
在應用場(chǎng)景上,聲音理解功能尤為有意義。在人機交互系統中,可以通過(guò)說(shuō)話(huà)人的性別和年齡確定說(shuō)話(huà)人所屬的特定人群,從而更有針對性的進(jìn)行交互。
在智能家居領(lǐng)域,智能音箱、智能語(yǔ)音助手可以利用聲音理解的"辨認"技術(shù),得出其性別、年齡、歷史偏好等信息,提供個(gè)性化服務(wù),如針對老年人、兒童等年齡段用戶(hù),按照興趣推薦不同的歌曲、新聞,對設備控制權限進(jìn)行安全控制,讓機器更智能。
在智能客服場(chǎng)景里,基于語(yǔ)義的自動(dòng)電話(huà)銷(xiāo)售已經(jīng)成為行業(yè)常態(tài),而通過(guò)聲音理解功能對語(yǔ)音客服的音頻數據進(jìn)行分析,構造實(shí)時(shí)準確的用戶(hù)畫(huà)像,能做到對不同電銷(xiāo)客戶(hù)的精準推送,大大降低獲客成本,提升用戶(hù)活躍度,增強變現能力。
在刑事偵查中,警方可以根據用戶(hù)的年齡和性別進(jìn)行訪(fǎng)問(wèn)授權,快速確定說(shuō)話(huà)人的性別和年齡,有助于縮小搜索范圍,并為分析犯罪心理和行為分析提供依據。
總的來(lái)說(shuō),聲音作為人們進(jìn)行信息交流最方便、有效的方式,未來(lái)必然也是人機交互的不可或缺的載體。隨著(zhù)多種語(yǔ)音交互技術(shù)的不斷成熟和融合,語(yǔ)音交互越來(lái)越多的轉向個(gè)性化需求,結合語(yǔ)音識別、聲紋識別等多元技術(shù),聲音理解能力將逐漸融入人們的日常生活,產(chǎn)生巨大的應用價(jià)值。標貝科技也將持續推動(dòng)AI語(yǔ)音技術(shù)創(chuàng )新研發(fā),助力企業(yè)與開(kāi)發(fā)者實(shí)現更多個(gè)性化語(yǔ)音解決方案的落地。

標貝科技【聲音理解】服務(wù)已于12月16日在標貝科技官網(wǎng)與標貝開(kāi)放平臺同步上線(xiàn)公測,免費體驗地址:
(1)標貝科技官網(wǎng):https://www.data-baker.com/
(2)標貝開(kāi)放平臺:https://ai.data-baker.com/#/index?source=gzh001