由CTI論壇(www.yshhuang.com)主辦的2021中國呼叫中心及企業(yè)通信大會(huì ) (http://www.yshhuang.com/expo/2021/ccec2021spring/index.html)于4月15日在北京遼寧大廈成功召開(kāi)。本次會(huì )議以“5G時(shí)代 共筑企業(yè)通信云生態(tài)”為主題。深圳黃鸝智能科技有限公司CEO劉志受邀接受了CTI論壇的專(zhuān)訪(fǎng)。

深圳黃鸝智能科技有限公司CEO劉志
CTI論壇:各位朋友,各位嘉賓,這里是2021中國呼叫中心及企業(yè)通信大會(huì )的視頻采訪(fǎng)現場(chǎng)。今天我們有幸請到了深圳黃鸝智能科技有限公司CEO劉志先生。現在先請劉總跟大家打聲招呼。
劉志:hello, 各位CTI論壇的朋友們,大家好,我是深圳黃鸝智能科技有限公司的劉志。在這里很榮幸能夠接受我們這次大會(huì )的專(zhuān)訪(fǎng)。
CTI論壇:劉總,非常高興您接受我們的現場(chǎng)專(zhuān)訪(fǎng)。我現在有幾個(gè)問(wèn)題,請您跟我們的觀(guān)眾朋友們交流一下。我的第一個(gè)問(wèn)題是這樣的,黃鸝智聲這個(gè)品牌相信對于很多人還很陌生,這是一個(gè)新興的品牌,這家成立于2019年的人工智能技術(shù)企業(yè),但是來(lái)頭一點(diǎn)都不小,他們的研發(fā)團隊都是清華大學(xué)的背景。請劉總介紹下成立黃鸝智聲的初衷是什么。
劉志:這個(gè)說(shuō)來(lái)就有點(diǎn)話(huà)長(cháng),剛才跟秦總聊,咱們CTI論壇是2000年就成立了,那個(gè)時(shí)候我剛好步入聲音這個(gè)領(lǐng)域。那剛好是我在讀研究生的階段,就接觸到了和聲音相關(guān)的各種技術(shù)。畢業(yè)之后,我就開(kāi)始了創(chuàng )業(yè)旅程,最早是做語(yǔ)音識別,在05年左右的時(shí)候的語(yǔ)音識別還不像現在這么火,那個(gè)時(shí)候連蘋(píng)果的siri還沒(méi)出來(lái)。實(shí)際上蘋(píng)果手機上的第一款語(yǔ)音撥號軟件就是我們團隊做的,我們當時(shí)針對歐美市場(chǎng)做了一款語(yǔ)音撥號軟件,叫voicedialler,把電話(huà)簿導入進(jìn)去之后,就直接說(shuō)一聲,我要call somebody,就把電話(huà)給打出去了,當時(shí)就做的這樣一個(gè)產(chǎn)品,市場(chǎng)的反應非常好。后來(lái)我們又做了口語(yǔ)測評類(lèi)的產(chǎn)品,就是教學(xué)生學(xué)英語(yǔ),我們用機器來(lái)評判學(xué)生的口語(yǔ)發(fā)音到底是不是準確。但是在做這幾件事情的過(guò)程中,我就發(fā)現一個(gè)我們怎么也繞不開(kāi)的一個(gè)問(wèn)題,那就是噪聲問(wèn)題。即使到今天,噪聲問(wèn)題也依然是我們聲音通信行業(yè)以及智能交互行業(yè)里面,大家最頭疼的問(wèn)題,也是繞不開(kāi)的一個(gè)問(wèn)題。我的印象非常深刻,我們的識別系統在安靜環(huán)境下識別率做的很好,但是在很多實(shí)際應用場(chǎng)景,比如說(shuō)開(kāi)車(chē)啊,戶(hù)外啊,識別率就直線(xiàn)下降。我還有印象,我們的系統中有一個(gè)識別詞叫“清華大學(xué)電子工程系”,平時(shí)在安靜環(huán)境下識別非常準確,一到車(chē)上結果變成了“清華大型電子對撞機”,結果就完全不對了,這件事情就促使我們在聲音前端處理這個(gè)方向開(kāi)始了研究。經(jīng)過(guò)十多年的研發(fā)的積累,我們找到了一條路徑。因為降噪這件事情說(shuō)起來(lái),大家一聽(tīng)都能理解,但是想做好非常困難。我們也是經(jīng)過(guò)十多年的演化之后才找到了一套獨有方式,能夠很好的去解決降噪當中一個(gè)最主要的矛盾,就是既要降噪降的好,又要保證聲音低失真,所以我們十幾年來(lái)就一直圍繞這個(gè)點(diǎn),因為很多時(shí)候我們人耳和這個(gè)機器啊,它對聲音的敏感度還不一樣。我們人耳對噪聲的容忍度是相對比較好的,但是機器因為很多是在安靜環(huán)境下訓練出來(lái)的,噪聲和失真對它的影響就比較大。未來(lái)的時(shí)代是人機交互的時(shí)代,我們的聲音發(fā)揮的作用越來(lái)越多的不光是在人和人之間通信,還包括人機交互。咱們的論壇上很多嘉賓都在討論這個(gè)問(wèn)題,對吧?所以說(shuō)聲音的降噪、語(yǔ)音的增強,作為產(chǎn)業(yè)鏈條上的前端技術(shù),是大家都繞不開(kāi)的一個(gè)問(wèn)題。我們看到這個(gè)技術(shù)巨大的市場(chǎng)應用價(jià)值,所以經(jīng)過(guò)前面的這些積淀之后,我們決定把這一塊的技術(shù)獨立出來(lái),專(zhuān)門(mén)圍繞著(zhù)拾音降噪,我們通過(guò)這種人工智能和信號處理相結合的這種方式,來(lái)解決這個(gè)降噪難題。然后我們就是圍繞著(zhù)幾個(gè)大的應用場(chǎng)景,或者說(shuō)幾個(gè)未來(lái)大的趨勢:第一個(gè)就是人和人之間通信,需要拾取清晰干凈的聲音;第二是人機交互,讓機器能夠聽(tīng)懂人;第三是未來(lái)需要讓人能聽(tīng)懂機器,因為機器也會(huì )發(fā)出聲音,要想聽(tīng)懂機器的語(yǔ)言同樣需要降噪處理。在這三個(gè)大的場(chǎng)景當中,我們認為降噪都能夠發(fā)揮作用。這個(gè)就是我們黃鸝智聲成立的初衷,我們的使命叫做“用聲音智能改善人類(lèi)生活與工作品質(zhì)”。因為聲音在我們生活工作當中方方面面都能起到作用,但是今天我們覺(jué)得聲音的價(jià)值還是很多時(shí)候沒(méi)有發(fā)揮出來(lái)。所以我們是希望能夠通過(guò)我們所做的這些工作,真正的把聲音的價(jià)值給發(fā)揮出來(lái),能夠讓整個(gè)行業(yè)更好的給我們人類(lèi)去提供更多的便利,這是我們的初衷。
CTI論壇:好的,謝謝劉總。這個(gè)聲音對于我們人類(lèi)生活的和工作這種價(jià)值,也是黃鸝成立的初衷。劉總,我的第二個(gè)問(wèn)題是隨著(zhù)5G和AI的發(fā)展,聲音通信和智能化處理存在巨大需求。但噪聲干擾和器件限制,極大降低了聲音采集的精度和范圍,嚴重制約著(zhù)通信質(zhì)量和聲音智能處理效果。聲請您談一下聲音前端處理的這種技術(shù)發(fā)展的方向和趨勢。
劉志:好的, 這是一個(gè)比較專(zhuān)業(yè)一點(diǎn)的問(wèn)題了。我就先盡我的所能做一些介紹,談?wù)勎易约旱睦斫狻?/div>
剛才其實(shí)說(shuō)到,聲音有非常大的作用。我們每天都在跟人打電話(huà),對吧?這是聲音的傳輸,那在傳輸之前呢?我們要把聲音先采集下來(lái)。有了傳輸,這就是我們所說(shuō)的通信。那么人機交互是什么呢?聲音首先采集下來(lái),之后交給機器去做識別。現在有語(yǔ)音識別,有聲紋識別等等的智能化處理。現在甚至可以通過(guò)聲音來(lái)判別情緒,未來(lái)還有很多很多聲音里面可以傳遞出的信息。那我們通常來(lái)說(shuō)把這個(gè)前面采音的部分叫做聲音的前端處理,后面做識別也好、做通信也好,我們把它叫做后端。簡(jiǎn)單來(lái)說(shuō)就是說(shuō)我先得把聲音采集下來(lái),而且在這個(gè)采的這個(gè)過(guò)程中,我們希望這個(gè)聲音盡可能采的清晰,盡可能把我想要的有用的聲音給抓取,把噪聲盡可能給屏蔽掉,這個(gè)我們廣義的把它叫做聲音的前端處理。您剛才也提到前端處理有幾種大的手段,一種是靠聲學(xué)的器件,就是麥克風(fēng)。好的麥克風(fēng)很貴的,有的甚至上百萬(wàn)一只,它的動(dòng)態(tài)范圍、保真度都有差異。另一種手段就是做信號處理,就是麥克風(fēng)采集進(jìn)來(lái)之后,怎么樣去把這個(gè)聲音的降噪這個(gè)問(wèn)題,把語(yǔ)音的增強這個(gè)問(wèn)題給解決。我們就是站在這個(gè)角度去研究,著(zhù)眼點(diǎn)是在算法層面。降噪又有很多具體的細分的點(diǎn),比如回聲就是一種噪聲。回聲是什么呢?比如說(shuō)我有個(gè)音箱,它放出來(lái)的聲音被麥克風(fēng)又采集進(jìn)去了,這個(gè)就叫回聲。還有混響,房間中的反射,會(huì )非常嚴重的影響我們的聽(tīng)感,我們聽(tīng)著(zhù)就是感覺(jué)嗡嗡嗡嗡的不清楚;然后還有噪聲,比如說(shuō)我在家辦公呢,旁邊有人在裝修,打電鉆;或者我在這說(shuō)話(huà)呢,我孩子在旁邊喊一嗓子,這都是噪聲。噪聲還分穩態(tài)和非穩態(tài)的等等。這些對于我們的有用聲音來(lái)說(shuō),它都屬于噪聲。我們的目的就是要把他們都消除掉,而且還要保證我的這個(gè)聲音盡量的少受損傷。這就是前端要做的事情,那從技術(shù)手段上來(lái)說(shuō)呢,又分為很多信號處理的手段,以及深度學(xué)習的手段,AI的算法。具體到每一種手段的話(huà),他又有各自的優(yōu)點(diǎn)和缺點(diǎn)。那么對于我們黃鸝智聲來(lái)說(shuō),我們所做的是一種融合性的手段,是一種創(chuàng )新性的融合,是把信號處理和AI的算法綜合在一起,取長(cháng)補短,這樣能夠達到的一個(gè)效果就是剛才說(shuō)的最難辦的問(wèn)題--高降噪的同時(shí)還要保證低失真這一點(diǎn)。這是我們團隊在聲音前端處理這個(gè)技術(shù)上取得的一個(gè)相比于其他方法更加有價(jià)值的一個(gè)成果。
CTI論壇:聽(tīng)劉總這一段解釋?zhuān)缓笳娴淖屛矣X(jué)得自己也得到了一個(gè)知識的普及。觀(guān)眾可能也會(huì )是對于這個(gè)行業(yè)可能會(huì )理解得更深一些。
那么第三問(wèn)題是黃鸝精巧C101u單耳專(zhuān)業(yè)降噪話(huà)務(wù)耳機榮獲CTI論壇2020編輯推薦獎,與市面上大部分降噪耳機不同,黃鸝主攻“通話(huà)降噪”,請介紹此款耳機的創(chuàng )新具體表現在哪里?
劉志:其實(shí)如果單純從外觀(guān)和基本的功能上來(lái)說(shuō)的話(huà),和市面上所有的這種單耳的話(huà)務(wù)耳機基本沒(méi)有區別。我們自己找了點(diǎn)區別,比如說(shuō)我們做了一個(gè)防止夾發(fā)的設計,我們還有一個(gè)波浪型的設計,讓佩戴舒適性更高一些;當然還有輕巧,我們做到四十幾克。但是這些坦率來(lái)說(shuō),不是我們最核心的創(chuàng )新。我們的最核心的創(chuàng )新還是集中在我們的拾音降噪性能。因為我們發(fā)現,今天在呼叫中心,企業(yè)的通訊辦公這個(gè)領(lǐng)域,噪音是一個(gè)大家都很頭疼的問(wèn)題。但是之前也沒(méi)有好的解決方案,我走訪(fǎng)了一些客戶(hù),他們的坐席距離比今天我跟秦總要近多了,最多的就是胳膊挨著(zhù)胳膊,中間都沒(méi)有隔板,在他們業(yè)務(wù)最高峰的時(shí)候啊,使用我們的這款耳機去和客戶(hù)溝通,把這個(gè)聲音錄下來(lái),回放回聽(tīng)的時(shí)候,客戶(hù)都是非常驚訝的,就是完全沒(méi)有周邊的聲音干擾,每個(gè)接線(xiàn)員的聲音就是他自己的聲音,清晰可聞。這樣的客戶(hù)體驗我相信是我們很多企業(yè)都希望能夠達到。其次我們跟后端做語(yǔ)音識別的一些伙伴做了測試,那我們可以看到今天的安靜環(huán)境下,語(yǔ)音識別的系統識別率可以到90%以上。但是真到了這個(gè)實(shí)際的噪聲場(chǎng)景,一旦大家都坐下來(lái),都開(kāi)始嘰嘰喳喳說(shuō)話(huà)的時(shí)候,那個(gè)識別率下降非常嚴重,掉到了70%甚至以下。這個(gè)時(shí)候把我們的這個(gè)耳機用上之后,識別率就一下回到了接近安靜環(huán)境下的水平,所以針對呼叫中心語(yǔ)音質(zhì)檢,智能客服的應用,可以輔助語(yǔ)音識別,讓語(yǔ)音識別能夠在這種嘈雜環(huán)境下依然可以保持一個(gè)健壯穩定,高識別率、高水準的輸出。所以說(shuō)這樣一款產(chǎn)品,它搭載了我們的核心技術(shù)之后,能夠產(chǎn)生的兩大優(yōu)點(diǎn):一個(gè)是讓我通話(huà)的對方,讓我們的客戶(hù)體驗度提升。第二個(gè)是讓機器也能聽(tīng)明白,讓今天的很多智能化場(chǎng)景真正能夠落地。我們能夠做到的就是用一款產(chǎn)品可以同時(shí)滿(mǎn)足這兩點(diǎn),這個(gè)恰恰是今天很多其他技術(shù)做不到的。這是我們這款耳機最核心的亮點(diǎn),也是我們給客戶(hù)真真實(shí)實(shí)帶來(lái)的價(jià)值。我們的團隊做事情的一個(gè)原則,就是一定是真真實(shí)實(shí)的要給大家帶來(lái)價(jià)值,聽(tīng)得見(jiàn),聽(tīng)得清,聽(tīng)得懂,能夠感受體會(huì )的到。
CTI論壇:謝謝劉總精彩的分享。我想在這里說(shuō)一下,就是說(shuō)我跟劉總的初次見(jiàn)面應該是在2019年的10月份啊,在深圳的一個(gè)大會(huì )上,然后呢。我們在行業(yè)有個(gè)老專(zhuān)家胡志明先生介紹的。然后當時(shí)因為畢竟也沒(méi)有體驗過(guò),然后我們就邀請他參加我們2019年12月年底的編輯推薦活動(dòng),然后劉總就帶來(lái)了一款他們的這個(gè)產(chǎn)品的一個(gè)功能的現場(chǎng)演示。我跟大家介紹一下當時(shí)在座的近100位的行業(yè)的專(zhuān)家們真的在聽(tīng)完劉總的這個(gè)演示以后,真的我覺(jué)得那個(gè)掌聲是我最近幾年聽(tīng)到最熱烈的,真的是因為他確實(shí)是就如同剛才劉總介紹。在呼叫中心里頭,就是說(shuō)他們那耳機上完了以后,人家說(shuō)就完全的就是說(shuō)真的當時(shí)的現場(chǎng)的這些,近百位的專(zhuān)家們真的都有那種感覺(jué),哇,就是說(shuō)在噪音的情況下,完了以后,他們再把重新時(shí)間和降噪之后的呈現了以后,真的很震驚,因為劉總當時(shí)也是就是說(shuō)你們你們這些人隨便鼓掌,說(shuō)話(huà)呀,然后唱歌什么都行。然后劉總在那說(shuō),然后居然就把其他人的聲音都給屏蔽了。真的我非常感謝劉總,感謝黃鸝智聲給行業(yè)帶來(lái)這么一個(gè)新鮮的一個(gè)震撼的一個(gè)產(chǎn)品和技術(shù)。謝謝謝謝。
劉志:也特別感謝CTI論壇。其實(shí)您說(shuō)的這個(gè)場(chǎng)景我歷歷在目啊,那個(gè)時(shí)候我拿的還是一個(gè)非常粗糙的demo,當時(shí)心里也非常忐忑啊。但恰恰是這次機會(huì ),把我們引入到了這個(gè)行業(yè),帶我們走出了第一步。所以真的是也是非常感謝秦總,包括我們整個(gè)cti論壇所有的同仁,也希望把更多更好的產(chǎn)品帶給我們行業(yè),帶給我們所有的客戶(hù),以及未來(lái)進(jìn)入到千家萬(wàn)戶(hù)!
CTI論壇:謝謝劉總,謝謝。我們在這里頭也預祝黃鸝智聲一個(gè)年輕的公司,在今后真的未來(lái)可期取得更大的成績(jì)。謝謝大家,。
劉志:感謝大家!
采訪(fǎng)嘉賓介紹:

劉志:深圳黃鸝智能科技有限公司CEO,兼任清華大學(xué)電子工程系企業(yè)導師、經(jīng)管學(xué)院GTE項目導師,中國教育學(xué)會(huì )智能語(yǔ)言教學(xué)研究中心研究員。清華大學(xué)工學(xué)碩士,高級工程師,擁有近20年人工智能領(lǐng)域創(chuàng )新創(chuàng )業(yè)經(jīng)驗。曾獲北京市科技進(jìn)步獎、中國電子學(xué)會(huì )科技進(jìn)步獎等多項榮譽(yù),擁有專(zhuān)利數十項。中國語(yǔ)音環(huán)境降噪處理專(zhuān)家。
【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。
相關(guān)閱讀:
- ·黃鸝智聲CEO劉志:后疫情時(shí)代語(yǔ)音降噪對于客戶(hù)體驗的重要性2020-09-21 10:35:18
- ·黃鸝智能劉志:智能化背景下語(yǔ)音前端技術(shù)的新挑戰2021-04-16 09:49:03
- ·深圳黃鸝智能科技有限公司總經(jīng)理劉志:機遇2020-12-21 11:36:57
- ·專(zhuān)訪(fǎng)深圳黃鸝智能科技有限公司CEO劉志2020-09-21 14:10:16
- ·深圳黃鸝智能科技劉志:極致2019-12-24 09:16:24