• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    黃鸝智聲CEO劉志:后疫情時(shí)代語(yǔ)音降噪對于客戶(hù)體驗的重要性

    2020-09-21 10:35:18   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      由CTI論壇(www.ctiforumcom)主辦的2020中國呼叫中心及企業(yè)通信大會(huì )(http://www.ctiforumcom/expo/2020/ccec2020spring/indexhtml)于9月18日在北京遼寧大廈盛大開(kāi)幕。本次會(huì )議以“‘新基建’背景下ICT行業(yè)發(fā)展機遇與挑戰”為主題。深圳黃鸝智能科技有限公司CEO劉志應邀出席此次會(huì )議并發(fā)表題為《后疫情時(shí)代語(yǔ)音降噪對于客戶(hù)體驗的重要性》的主題演講。隨著(zhù)數字渠道的發(fā)展和人工智能的到來(lái),一個(gè)普遍的誤解是傳統的人與人之間的語(yǔ)音交互已經(jīng)過(guò)時(shí)。但實(shí)際上并非如此,語(yǔ)音交互的目的已經(jīng)改變,從之前處理所有的咨詢(xún)業(yè)務(wù)轉變?yōu)樘幚砥髽I(yè)與其客戶(hù)之間最復雜,最有價(jià)值的交互。自從本次冠狀病毒大流行以來(lái),語(yǔ)音交互的重要性更是不斷提升。在此背景下,如何提升語(yǔ)音交互的體驗?黃鸝智聲的演講為大家帶來(lái)新的視角。

    圖:深圳黃鸝智能科技有限公司CEO劉志
    ▲演講PPT下載,pdf格式
      劉志:感謝CTI論壇,我在呼叫中心和企業(yè)通信領(lǐng)域是個(gè)新人,我們公司也很新,去年8月份剛剛成立。但是疫情讓我對這個(gè)領(lǐng)域所做的事情有更新的認識,首先我認識到呼叫中心也好、企業(yè)通信也好,是服務(wù)于全行業(yè)的。有一個(gè)笑話(huà),說(shuō)疫情當中三個(gè)月沒(méi)有接到推銷(xiāo)電話(huà)感覺(jué)整個(gè)人都不好了,終于盼來(lái)了一通推銷(xiāo)電話(huà),瞬間點(diǎn)燃了自己。我也有這樣的感受,我接到的外呼電話(huà)和我打出去的客服電話(huà),經(jīng)常會(huì )遇到這樣的場(chǎng)景,我給大家演示一下,就是這樣嘈雜的環(huán)境。這樣的場(chǎng)景大家并不陌生,不僅是在呼叫中心,在企業(yè)辦公中,整個(gè)疫情期間我參加的不下一百場(chǎng)的各種各樣的線(xiàn)上宣講、會(huì )議等等,才意識到一個(gè)問(wèn)題,我們大部分人不知道通話(huà)的對方聽(tīng)到我的聲音是怎樣的。而我聽(tīng)到同事們家里面狗叫貓叫的聲音,我意識到我也可能給對方帶來(lái)了不好的體驗。
      實(shí)驗心理學(xué)有這樣的數據,說(shuō)明聲音有多重要,在人類(lèi)獲取的信息當中有20%是直接來(lái)自于聲音,還有25%是聲音和視覺(jué)的結合,今天在現場(chǎng)能夠面對面的交流是對于信息交互是非常難得的,因為既有聲音又有視覺(jué),大家可以看到我的表情、形態(tài)和肢體語(yǔ)言,但是一旦到了線(xiàn)上看不到對方,這種情況下聲音是不是就是我們獲取信息的唯一來(lái)源呢?從人類(lèi)表達信息的手段來(lái)看,有聲語(yǔ)言更是占據了絕大多數的比例。可是聲音這么重要,我們卻常常忽略了噪聲的影響。
      我們可以看到疫情的影響下,越來(lái)越多的企業(yè)已經(jīng)在選擇在家辦公了,包括Facebook、推特,疫情前美國有5%的企業(yè)辦公選擇在家或者是比較自由的方式。我相信疫情終將過(guò)去,但是就像03年非典之后電商發(fā)展起來(lái)了,這次的疫情后我相信線(xiàn)上辦公、學(xué)習、娛樂(lè )等等很多新的生活工作方式會(huì )變成常態(tài),但這里面有個(gè)非常重要的問(wèn)題,就像電商普及那樣,就是體驗非常重要。對于在線(xiàn)辦公和呼叫中心來(lái)說(shuō),語(yǔ)音降噪對于客戶(hù)體驗就是非常重要的。
      呼叫中心大家也都知道,今天數字化越來(lái)越成為潮流,今天下午的演講中五個(gè)同行,有四家都是在講人工智能,怎么樣用人工智能來(lái)讓客戶(hù)的體驗更好,但同時(shí)也要看到,今天在這種數字化變革下,今年85%呼叫中心也要做數字化變革,但是對于數字渠道滿(mǎn)意客戶(hù)只有21%,我自己就對很多數字渠道很不滿(mǎn)意,還有1/3通過(guò)數字渠道發(fā)起的客戶(hù)服務(wù)最終還是轉到了人工,這不是代表智能化不是趨勢,實(shí)際上智能化一定是趨勢,但是今天怎么樣去提升客戶(hù)的體驗,語(yǔ)音降噪在智能化當中也有非常多重要的價(jià)值。
      我們看到語(yǔ)音雖然是個(gè)非常古老的手段,但是不管是在呼叫中心還是在企業(yè)辦公中今天發(fā)揮的作用是不但沒(méi)有減小而且是越來(lái)越大的。拿呼叫中心來(lái)說(shuō),作為問(wèn)題解決中心我們觀(guān)察到,雖然人工智能數字化渠道有很多好的提升效率的手段,但是總有一些查詢(xún)最終要到人這里,而且要看到一旦到了人這里的問(wèn)題,一定是最有價(jià)值的問(wèn)題,也是最難解答的問(wèn)題,機器人搞不定的問(wèn)題最終交給了人。我也是做人工智能的,人工智能今天只能解決相對簡(jiǎn)單的有邏輯問(wèn)題,畢竟人工智能沒(méi)有認知,也無(wú)法體察我的情感。
      語(yǔ)音到人工一定是處理的最有價(jià)值的交互,呼叫中心也是價(jià)值創(chuàng )造中心,今天獲取客戶(hù)的成本越來(lái)越高,我以前所在的教育培訓行業(yè)在今年疫情影響下是突飛猛進(jìn)的增長(cháng),但是所有的從業(yè)者都有一個(gè)非常擔憂(yōu)的事情就是獲客成本越來(lái)越高,這種情況下怎么能夠保留現有客戶(hù),讓現有客戶(hù)為我們帶來(lái)更多的價(jià)值等等,這些都是企業(yè)必須要思考的問(wèn)題,而這種保留客戶(hù)的發(fā)掘客戶(hù)價(jià)值的渠道、這樣的交互,人工智能只能作為輔助手段,一定需要通過(guò)人與人之間情感的交互。
      今天呼叫中心行業(yè)中語(yǔ)音渠道的目的改變了,已經(jīng)不是處理簡(jiǎn)單查詢(xún)的問(wèn)題,而更多的是解決復雜但是有價(jià)值的交互。優(yōu)化語(yǔ)音渠道,讓語(yǔ)音渠道給用戶(hù)帶來(lái)的體驗更好,這一點(diǎn)在后疫情時(shí)代越發(fā)有必要。
      我最開(kāi)始演示的一樣,今天很多語(yǔ)音渠道連最基本的讓對方聽(tīng)清楚這一點(diǎn)都有差距,這是什么原因呢?核心問(wèn)題就是噪聲。我們通常大家會(huì )有個(gè)感受,我面對面交互的時(shí)候有噪聲影響也不大,為什么到了坐席這里、線(xiàn)上交互的時(shí)候噪聲難道就發(fā)生了質(zhì)的變化嗎?我研究聲音接近20年的時(shí)間,可以很明確的告訴大家線(xiàn)上和線(xiàn)下的語(yǔ)音交互是完全不一樣的體驗。兩點(diǎn):一是我們在面對面交流的時(shí)候除了聲音以外,我們也有眼神的交互、肢體的語(yǔ)言,通過(guò)視覺(jué)那25%大量獲取輔助的信息,信息傳輸手段是綜合多維的,一旦變到只有單一的語(yǔ)音途徑的時(shí)候,對于聲音質(zhì)量的依賴(lài)性極大的加強了;二是人是非常智能的智能體,我們在面對面交流的時(shí)候不是一只耳在聽(tīng),而是兩只耳朵,這是雙耳效應,雙耳效應可以自動(dòng)幫助抑制噪聲、定位聲源方向,一旦錄下來(lái)再播出來(lái)相當于是一只耳朵在聽(tīng)聲音,這種人類(lèi)自身降噪機制發(fā)揮不了作用,這也就是為什么降噪這件事非常重要,但是又很困難。
      上世紀50年代很多人研究相關(guān)課題,直到今天我們看到了很多降噪的方法依然有各自缺陷。傳統的方法是預測噪聲的走向,知道下一個(gè)時(shí)刻噪聲是怎樣,從帶噪語(yǔ)音中把噪聲減去,但是只對穩態(tài)的噪聲,比如空調的噪聲有預判,對穩態(tài)噪聲效果非常好,但是實(shí)際上今天噪聲環(huán)境越來(lái)越復雜,傳統的方法很難解決。
      陣列方法模擬人耳雙耳效應,也有更多的四個(gè)麥克風(fēng)、八個(gè)甚至更多,它的思路是模擬人耳,但是首先對麥克風(fēng)的品質(zhì)一致性要求非常高,其次這種方法的邊界效應比較明顯。最新2011年興起的深度學(xué)習降噪方法取得很好效果,但是也有兩個(gè)問(wèn)題,首先是模型結構非常復雜,算法復雜度非常高,很難滿(mǎn)足通信實(shí)時(shí)性的要求,其次是這一輪人工智能深度學(xué)習方法是黑盒,訓練出來(lái)的模型、模型參數什么樣很難搞清楚,我們也無(wú)法知道到底是怎么訓練的,有些時(shí)候用了這個(gè)方法之后中間聲音聽(tīng)不到了,也不知道發(fā)生了什么、也無(wú)法進(jìn)行修正。
      黃鸝智聲在降噪方面研究了15年以上的時(shí)間,發(fā)現前面的方法有些是從人耳的特性出發(fā)的,有些是從大腦特性出發(fā),比如深度學(xué)習是模擬大腦,前面說(shuō)的陣列、傳統降噪方法是模擬人耳,而我們做的是把二者統一起來(lái),聽(tīng)覺(jué)智能是耳朵和大腦中樞一起作用的結果,把信號處理的方法和深度學(xué)習的方法進(jìn)行融合,取長(cháng)補短把它們當中優(yōu)點(diǎn)發(fā)揮出來(lái)。從而在降噪問(wèn)題上解決了以下難題,既要高降噪又要低失真,很多降噪可以把噪聲降得比較好,但是要的聲音也有丟失,要么是聲音聽(tīng)著(zhù)還可以,但是一直聽(tīng)到噪聲。高可靠低延時(shí),我們方案最低8毫秒的延時(shí),這是通信系統里面是完全可以被忽略的,同時(shí)高可靠,不會(huì )丟數據,不會(huì )聽(tīng)到中間斷斷續續的,三是高性能低成本,這樣的技術(shù)可以達到參數指標,可以做到降噪40DB以上,今天在飛機發(fā)動(dòng)機尾部地方,十幾架直升機一起轟鳴,走出去感覺(jué)聲浪很厲害,直升機去感受一下,都可以感覺(jué)把人振起來(lái),我對著(zhù)別人耳朵大聲喊人家不知道我在說(shuō)什么,但是用我們的技術(shù),帶上我們耳麥后可以實(shí)現清晰的聲音傳輸,也可以用它去進(jìn)行語(yǔ)音識別,40db是對噪聲能量降低一萬(wàn)倍以上,我們還可以讓語(yǔ)音質(zhì)量保持在3.5分以上滿(mǎn)分是5分,最終可以呈現出高質(zhì)量、高性?xún)r(jià)比的產(chǎn)品。
      基于這樣的技術(shù),我們也給呼叫中心和企業(yè)通信領(lǐng)域帶來(lái)了四款產(chǎn)品,自適應通話(huà)降噪盒是去年11月份出來(lái)的產(chǎn)品,可以接固定電話(huà),傳統的固定電話(huà)接上我們的降噪盒以后變成專(zhuān)門(mén)降噪的電話(huà),第二款產(chǎn)品G100U,今年4月份剛剛出來(lái)的,主要定位教育培訓行業(yè),看著(zhù)比較大一些。4月份剛剛出來(lái)5月份就在教育行業(yè)拿到了數十K的訂單,現在交付達到幾十K。第三、第四款產(chǎn)品是CTI論壇平臺上首次發(fā)布的,E100U,精英系列產(chǎn)品,主要目標人群是辦公人群,是可以接typecC接口,主流安卓手機,也可以接電話(huà)。C101是精巧系列,是給呼叫中心和坐席人員準備的,剛才我在剛開(kāi)始的時(shí)候請老師給我播放了一個(gè)噪音我也戴著(zhù)我的C101耳麥同步做了錄音,大家聽(tīng)聽(tīng)剛才用這樣的耳麥錄下來(lái)的剛才聲音。
      (播放聲音)
      同時(shí)播放了噪聲,大家聽(tīng)聽(tīng)用C101耳麥錄音是不是完全聽(tīng)不到任何噪聲也沒(méi)有任何失真?這是技術(shù)所體現出來(lái)的實(shí)際的效果,不用建專(zhuān)業(yè)隔音室,只需要戴一個(gè)耳麥就相當于給每一個(gè)坐席、每一個(gè)辦公人員建立了一個(gè)專(zhuān)用虛擬的辦公室。
      智能化是方向,但是今天其實(shí)包括剛才云趣提到的問(wèn)題,今天語(yǔ)音識別的識別準確率會(huì )非常受到環(huán)境噪聲的影響,實(shí)測安靜環(huán)境下95%的識別率,真的在噪聲環(huán)境下,噪聲環(huán)境相對比較惡劣的話(huà)可能會(huì )掉到70%以下,我們的設備還可以來(lái)支持數字渠道和智能化的渠道,合作伙伴只需要關(guān)注后端的質(zhì)檢、客服助手等技術(shù)的準確率以及效果,完全可以把前端怎么讓聲音更加干凈、更加清晰這樣的事情交給我們。
      我們公司是非常年輕的一家公司,去年剛剛成立,但是在聲音領(lǐng)域的研究有超過(guò)20年的歷史,我本人清華電子系畢業(yè)后一直從事聲音相關(guān)的工作,做過(guò)語(yǔ)音識別、做過(guò)口語(yǔ)測評、做過(guò)語(yǔ)音編解碼,和聲音相關(guān)方方面面很多我是非常非常清楚的,當時(shí)做語(yǔ)音識別的時(shí)候特別有感受,我的碩士課題是車(chē)載環(huán)境下語(yǔ)音識別,在實(shí)驗室里面調得非常好的設備拿到車(chē)上后馬達一響、車(chē)一開(kāi),完全報廢了。噪聲的影響也是我們團隊一直想去克服的,而且我們認為它對于人類(lèi)生活工作品質(zhì)真的有非常大的幫助。
      我們企業(yè)的使命是用聲音智能來(lái)改善人類(lèi)生活與工作品質(zhì),聲音作為人最重要的信息交互手段之一,實(shí)際上今天它的價(jià)值遠遠沒(méi)有被發(fā)掘,就拿它和視覺(jué)去對比,可以看到今天很多視覺(jué)的設備已經(jīng)非常多的應用,但是語(yǔ)音始終感覺(jué)還是欠了點(diǎn)火候,在我們看來(lái),噪音是其中一個(gè)非常重要的障礙,我們希望把我們的技術(shù)和更多的伙伴們一起合作,因為我們是前端技術(shù),是相對底層的技術(shù),所有需要噪聲環(huán)境下進(jìn)行采集、通信、識別等聲音能夠發(fā)揮價(jià)值的地方都希望和大家一起攜手合作。我們有一個(gè)愿景,我們認為今天聲音更多的是人與人之間的交互,而未來(lái)它可能成為萬(wàn)物互聯(lián)的手段,我們把我們的技術(shù)和大家的結合在一起,構建這樣一個(gè)萬(wàn)物交互的世界,我們認為這樣的一天不是那么的遙遠。
      謝謝大家!
     
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    相關(guān)閱讀:

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 宜章县| 新乡县| 莎车县| 大埔区| 万宁市| 诏安县| 金川县| 延长县| 青河县| 视频| 沈阳市| 北安市| 香河县| 昌平区| 平潭县| 霍城县| 衢州市| 沙坪坝区| 土默特右旗| 吐鲁番市| 科技| 庄河市| 温宿县| 涞水县| 鞍山市| 和田县| 恩平市| 万宁市| 怀远县| 新竹县| 武山县| 贡觉县| 九龙县| 漳州市| 泸定县| 河南省| 文安县| 濮阳县| 寻甸| 深圳市| 石景山区| http://444 http://444 http://444 http://444 http://444 http://444