
盡管市面上的語(yǔ)音識別系統已經(jīng)非常多了,但是由于人們講話(huà)時(shí)用詞和口音的問(wèn)題,幾乎沒(méi)有任何一款產(chǎn)品可以完全做到精準識別。雖然這項不完全成熟的技術(shù)以后的運用空間廣泛,但是競爭卻也很激烈。
Tetra聯(lián)合創(chuàng )始人Jon Goldsmith認為,語(yǔ)音識別市場(chǎng)競爭確實(shí)非常激烈,Tetra自己本身的技術(shù)也還未達到100%成熟,然而語(yǔ)音識別技術(shù)還是需要通過(guò)深度學(xué)習來(lái)解決用詞和口音的識別問(wèn)題。
手機安裝Tetra后,在接打電話(huà)時(shí),其語(yǔ)音識別和深度學(xué)習系統會(huì )在后臺自動(dòng)運行,做實(shí)時(shí)的語(yǔ)音記錄和文字翻譯。用戶(hù)可以在系統中搜索關(guān)鍵字來(lái)查找語(yǔ)音和文字通話(huà)記錄。
然而根據語(yǔ)速、口音和用詞的不同,Tetra的識別并不完美。因此Tetra設置了24小時(shí)的人工付費翻譯服務(wù),來(lái)滿(mǎn)足用戶(hù)對高精確性的需求。這項服務(wù)既可以滿(mǎn)足用戶(hù)的精準化需求,也可以為T(mén)etra的深度學(xué)習系統提供學(xué)習數據。
Jon Goldsmith表示,目前Tetra的目標客戶(hù)是那些每天電話(huà)很繁忙的人。這些客戶(hù)希望自己和行業(yè)專(zhuān)家們的通話(huà)記錄永遠被保存。同時(shí)傳統的企業(yè)也是Tetra的服務(wù)對象,很多企業(yè)級的服務(wù)比如銷(xiāo)售相關(guān)的電話(huà)也可以通過(guò)Tetra完成記錄和識別。
在工程方面,Tetra提供現成的API來(lái)強化手機上的一些基礎設施。對于通話(huà)識別系統的收費如下圖所示:

通過(guò)這種方法,Tetra可以獲得高頻大量的學(xué)習數據,從而通過(guò)深度學(xué)習繼續優(yōu)化語(yǔ)音識別系統。相較于單純的企業(yè)級語(yǔ)音識別服務(wù),這種數據獲取方法成本相對更低,獲得的數據也相對更加多元。
同時(shí),這項技術(shù)的進(jìn)展和使用哪個(gè)云端API有著(zhù)緊密的聯(lián)系。比如一些NPL(自然語(yǔ)言處理)服務(wù)運營(yíng)商對演講的處理能力較強,有些對數字的處理能力較強等。選擇不同的NPL也許對于通話(huà)語(yǔ)音的處理效果會(huì )出現很大的不同。
對于語(yǔ)音識別領(lǐng)域,國外的諸如谷歌、亞馬遜,國內的諸如百度、阿里和騰訊等巨頭都有涉及。這塊市場(chǎng)的應用場(chǎng)景廣泛,技術(shù)還未成熟,蘊藏的投資和創(chuàng )業(yè)空間自然很大。在企業(yè)服務(wù)領(lǐng)域,搜狗、科大訊飛等企業(yè)也都推出了其語(yǔ)音速記系統。
然而目前在語(yǔ)音識別領(lǐng)域還未有公司可以完全解決上文中所述的人類(lèi)語(yǔ)言多樣化的問(wèn)題,這個(gè)問(wèn)題如何得到解決,深度學(xué)習究竟是不是答案,還需要時(shí)間來(lái)驗證。
這次種子輪融資是Tetra第一輪融資。