9月9日,以“共驅AI,賦能未來(lái)”為主題的第一屆中國—東盟人工智能峰會(huì )在南寧成功舉辦。捷通華聲作為人工智能技術(shù)產(chǎn)業(yè)化的開(kāi)拓者和領(lǐng)先者,受邀出席中國-東盟(華為)人工智能及軟件開(kāi)發(fā)技術(shù)交流會(huì )。

捷通華聲副總經(jīng)理于智彬發(fā)表“5G+AI:共建智能化產(chǎn)業(yè)互聯(lián)網(wǎng)”主旨演講,以下為演講內容:
現在A(yíng)I已成為家喻戶(hù)曉的名詞,大家都知道人工智能,就是模仿人的各種能力的技術(shù)。讓機器“能說(shuō)會(huì )聽(tīng)、能看會(huì )認,能思考、會(huì )判斷,能行動(dòng)”是AI追求的目標,也是我們捷通華聲2000年建立時(shí)的初衷和愿望。

在2010年前,人工智能已經(jīng)過(guò)幾起幾落。1950年,AT&T推出Audry,實(shí)現首個(gè)可以識別10個(gè)英文數字的系統;1997年IBM推出VIAVOICE——首個(gè)語(yǔ)音識別產(chǎn)品。當時(shí)大家很興奮,大呼語(yǔ)音識別時(shí)代到來(lái)了,但當試用之后發(fā)現識別效果不好,又大失所望。此后,直至2010年前,因為計算力有限、數據量不足、算法演進(jìn)緩慢等原因,導致語(yǔ)音識別、圖像識別等AI技術(shù)一直未能產(chǎn)業(yè)化。
2000年成立之初,我們主要是做TTS和手寫(xiě)識別技術(shù)。當時(shí)的TTS有些機械音,但它能代替人日日夜夜的辛苦重復工作。例如,全國各地高鐵站廣播、汽車(chē)站廣播、醫院叫號廣播等,都用了捷通華聲的TTS產(chǎn)品。手寫(xiě)識別技術(shù)效果比較好,用在很多手機輸入法上,還賣(mài)給了日本的手寫(xiě)板生產(chǎn)廠(chǎng)商,歐美的各種高端轎車(chē)車(chē)機。
2008年,個(gè)人電腦開(kāi)始大規模應用,2010年,互聯(lián)網(wǎng)快速發(fā)展,隨之產(chǎn)生了大量的數據。此時(shí),高性能計算、機器學(xué)習也發(fā)展到了新的水平,開(kāi)始可以支撐語(yǔ)音識別、圖像識別等人工智能技術(shù)的發(fā)展了。
第一次轉型:抓住機遇,發(fā)展全方位AI技術(shù)
當發(fā)覺(jué)到這個(gè)機遇時(shí),捷通華聲下定決心,果斷轉型,準備發(fā)展全方位AI技術(shù)。
2011年,捷通華聲推出國內外首個(gè)全方位AI開(kāi)放平臺—靈云,致力于讓機器“能說(shuō)會(huì )聽(tīng)、能寫(xiě)會(huì )看、能辨音會(huì )認人、能思考會(huì )判斷”。

在發(fā)展AI技術(shù)的路上,很多前沿計算理論,需要與學(xué)術(shù)界共同研究。2012年,我們開(kāi)始與清華大學(xué)聯(lián)合研發(fā)AI算法。我們應用AI技術(shù),對接市場(chǎng)需求,開(kāi)發(fā)產(chǎn)品,并用產(chǎn)業(yè)應用中產(chǎn)生的數據,去訓練提升AI水平,形成產(chǎn)學(xué)研用的良性循環(huán)。
隨著(zhù)與清華大學(xué)AI技術(shù)聯(lián)合研究的深入,2013年,清華大學(xué)產(chǎn)業(yè)基金入資捷通華聲,成為捷通華聲第二大股東,并共同確立“靈云科技源自清華”的戰略合作。2014年,捷通華聲與清華大學(xué)共同創(chuàng )建清華靈云人工智能研究中心,中國科學(xué)院院士、清華大學(xué)人工智能研究院院長(cháng),張鈸院士擔任研究中心首席科學(xué)家。2015年,捷通華聲與清華大學(xué)海峽研究院在廈門(mén)共同創(chuàng )建清華靈云人工智能研究中心。通過(guò)與清華大學(xué)的科研合作,靈云AI技術(shù)學(xué)術(shù)研究保持全球領(lǐng)先,各項技術(shù)快速進(jìn)步。
靈云AI技術(shù),快速產(chǎn)業(yè)化應用
隨著(zhù)AI技術(shù)的不斷提升,各種產(chǎn)業(yè)需求爆發(fā)式增加,AI技術(shù)開(kāi)始快速產(chǎn)業(yè)化。
最經(jīng)典的一個(gè)應用場(chǎng)景,就是客服中心。銀行、保險、航空等大型企業(yè),有海量的客戶(hù),需要建立大型客服中心來(lái)提供業(yè)務(wù)咨詢(xún)、業(yè)務(wù)辦理等服務(wù)。為了控制客服中心人力成本,減少客戶(hù)咨詢(xún)長(cháng)時(shí)間排隊等情況,農行、中信銀行、郵儲銀行、太平洋保險、國航、深航等,紛紛引進(jìn)捷通華聲的智能客服。
以中信銀行為例,在微信公號、和官網(wǎng)接入智能客服,可以為用戶(hù)提供借記卡、信用卡、養老金等全業(yè)務(wù)的智能咨詢(xún)、辦理服務(wù)。智能客服問(wèn)答準確率超90%,從2014年上線(xiàn)至今,日均訪(fǎng)問(wèn)量50萬(wàn)+,人工坐席節省125人/年。
此外,客服中心的電話(huà)服務(wù)熱線(xiàn),承載著(zhù)大量用戶(hù)咨詢(xún),人工服務(wù)壓力和成本巨大,客戶(hù)打電話(huà)經(jīng)常打不進(jìn)來(lái)、或長(cháng)時(shí)間等待。
北京國稅當時(shí)找到我們,看如何在不增加坐席人數的情況下,提供通暢的稅務(wù)咨詢(xún)服務(wù)。捷通華聲給稅務(wù)局開(kāi)發(fā)了電話(huà)客服機器人、微信智能客服,和營(yíng)業(yè)廳實(shí)體服務(wù)機器人。稅收政策、稅務(wù)登記、一證通、優(yōu)惠政策、營(yíng)改增問(wèn)題、三證合一等問(wèn)題都可以向機器人咨詢(xún),為納稅人提供永不占線(xiàn)、方便快捷的稅務(wù)咨詢(xún)服務(wù)。
銀行、電信公司的服務(wù)熱線(xiàn),剛打進(jìn)去是IVR按鍵導航,層級深,選項多,很多人進(jìn)去直接按0轉人工,導致人工服務(wù)壓力巨大,而85%的客戶(hù)咨詢(xún),都是常見(jiàn)問(wèn)題。我們給光大銀行95595熱線(xiàn)做的智能語(yǔ)音導航,客戶(hù)打電話(huà)進(jìn)去后,常見(jiàn)的業(yè)務(wù)問(wèn)題,機器人可以直接回答;需要轉人工的咨詢(xún),機器人會(huì )反問(wèn)補全,確認好業(yè)務(wù)種類(lèi)后,精準轉接給對應的坐席組。目前光大銀行智能語(yǔ)音導航,日接聽(tīng)量20萬(wàn)通,回答準確率91%,轉人工比例下降至20%,轉人工等待時(shí)長(cháng)下降30%,轉人工坐席接起率提升至99.78%,取得了良好的業(yè)務(wù)效果。
類(lèi)似地,手機銀行APP,也有很多功能項,菜單層級深。為了方便用戶(hù)使用,招商銀行引進(jìn)捷通華聲智能語(yǔ)音技術(shù),為招商銀行掌上生活APP打造智能語(yǔ)音助手,查賬單、轉賬、買(mǎi)理財,說(shuō)出來(lái)即可,還可以咨詢(xún)金融知識。這在提升用戶(hù)使用體驗和粘度的同時(shí),大幅降低了中老年人等群體使用APP難度。
除了承接用戶(hù)咨詢(xún),客服中心還有大量的外呼工作。例如銀行的信用卡逾期催繳、貸款業(yè)務(wù)推廣等。2016年,我們做了國內第一個(gè)智能語(yǔ)音外呼機器人產(chǎn)品,某大型股份制銀行信用卡催收智能外呼機器人:2016年上線(xiàn),成都分公司率先使用機器人,催收回款率提高30%,排名全國第一。月均節約人力成本120萬(wàn),截止2018年12月底,累計節約人力成本4500萬(wàn),節省了巨大的人力成本。
在近期給某知名互金公司上線(xiàn)的催收機器人,上線(xiàn)30天后,外呼回款率與純人工催收效果一致,即機器人催收達到真人水平。
隨著(zhù)AI的深入應用,客服中心想用AI技術(shù)來(lái)督促坐席提升服務(wù)質(zhì)量。某大型國企,引進(jìn)捷通華聲智能語(yǔ)音分析系統,將通話(huà)全量轉寫(xiě)為文字并用規則進(jìn)行自動(dòng)打分,質(zhì)檢覆蓋率從3%提升至100%,全面督促坐席提升服務(wù)質(zhì)量,有效提升客戶(hù)服務(wù)滿(mǎn)意度。與此同時(shí),對客服大數據進(jìn)行挖掘與分析:業(yè)務(wù)熱點(diǎn)、業(yè)務(wù)發(fā)展趨勢,可視化展現;通過(guò)重復來(lái)電分析、關(guān)聯(lián)分析、異常分析等,挖掘客戶(hù)投訴、多次來(lái)電原因。
在質(zhì)檢客服的同時(shí),靈云智能語(yǔ)音分析系統還可以輔助坐席的實(shí)時(shí)通話(huà)。2016年,捷通華聲為某大型保險公司做了國內首款實(shí)時(shí)智能語(yǔ)音分析系統。近萬(wàn)名坐席,通話(huà)實(shí)時(shí)語(yǔ)音轉寫(xiě),坐席側語(yǔ)音識別率超90%;如果坐席出現未按流程對話(huà)、保單免責條款未說(shuō)明、詆毀同業(yè)、假冒促銷(xiāo)等情況,系統會(huì )實(shí)時(shí)發(fā)出違規提醒;系統也會(huì )實(shí)時(shí)分析客戶(hù)說(shuō)話(huà)內容,給予坐席產(chǎn)品類(lèi)型建議、險種內容、挽回話(huà)術(shù)、常見(jiàn)業(yè)務(wù)知識等話(huà)術(shù)輔助。
系統上線(xiàn)后,有效規范了保險電銷(xiāo)服務(wù),降低了新人成單難度,提升了整體電銷(xiāo)成單率。
除了客服中心,物聯(lián)網(wǎng)場(chǎng)景也對智能語(yǔ)音交互技術(shù)有巨大的需求,如大家熟知的智能音箱、兒童智能陪伴機器人等。我們給機頂盒廠(chǎng)商做智能語(yǔ)音助手,換頻道、搜電影,可以直接說(shuō)出來(lái),為用戶(hù)創(chuàng )造體驗更友好、更高效的人機交互方式。
在提供方案產(chǎn)品的同時(shí),我們給眾多合作伙伴、政企客戶(hù)提供基礎人工智能能力平臺,助力其打造智能化的業(yè)務(wù)應用。靈云全智能能力平臺-AICP,提供語(yǔ)音識別、語(yǔ)音合成、聲紋識別、OCR、人臉識別、視頻分析、語(yǔ)義理解、機器翻譯、數據挖掘等全方位AI技術(shù)能力,是靈云AI技術(shù)賦能百業(yè)的關(guān)鍵。
AI技術(shù)產(chǎn)業(yè)應用,給企業(yè)減少了巨大的人力成本,實(shí)現了業(yè)務(wù)的跨越式升級。AI已成為推動(dòng)產(chǎn)業(yè)智能化升級的關(guān)鍵動(dòng)力。
AI技術(shù)產(chǎn)業(yè)化的思考
下面分享一些我們捷通華聲在A(yíng)I技術(shù)產(chǎn)業(yè)化中的思考:
第一,AI技術(shù)的發(fā)展,計算理論的演進(jìn),算法的升級是關(guān)鍵;體量大、分布合理、干凈的數據模型是基礎;給客戶(hù)提供學(xué)習訓練,例如NLU、ASR等的數據訓練,能有效提升AI技術(shù)在產(chǎn)業(yè)內的應用效果。另外,AI技術(shù)的發(fā)展,離不開(kāi)產(chǎn)業(yè)界的包容,即客戶(hù)對技術(shù)發(fā)展階段性水平的理解,這為AI公司的成長(cháng)進(jìn)步提供了土壤。
第二,AI技術(shù)融合應用趨勢已非常明顯。例如我們推出的車(chē)載輸入法,用戶(hù)可以用語(yǔ)音、手寫(xiě)、鍵盤(pán)輸入,讓車(chē)載輸入更安全快捷;我們的靈云手機輸入法,支持語(yǔ)音、手寫(xiě)、鍵盤(pán)輸入,中英、中維翻譯,OCR拍照輸入、跨屏輸入、語(yǔ)音速記等功能,滿(mǎn)足用戶(hù)多種場(chǎng)景的輸入需求。
語(yǔ)音互譯軟件,除了綜合應用語(yǔ)音識別、機器翻譯、語(yǔ)音合成、OCR技術(shù),各項技術(shù)還要求是支持多種語(yǔ)言的。銀行大廳服務(wù)機器人,要求功能更廣泛,智能語(yǔ)音交互,人臉識別、指紋識別驗證,OCR拍照錄入材料等,各項技術(shù)融合應用,為用戶(hù)提供更便捷的服務(wù)。
同樣的,我們在做的辦案智能化筆錄(中維雙語(yǔ))場(chǎng)景,需要語(yǔ)音識別(普通話(huà)、維吾爾語(yǔ))、機器翻譯(中翻維、維翻中)、語(yǔ)音合成(普通話(huà)、維吾爾語(yǔ))、OCR拍照識別(中文、維吾爾文)融合應用,才能提供完整的服務(wù)。
AI技術(shù)融合應用的背后,就是人工智能的本質(zhì)——模仿人的能力。從感知、認知、到行動(dòng),越多AI技術(shù)融合應用,發(fā)揮威力越強大。
第三,AI產(chǎn)品也趨于融合服務(wù)。例如,我們在客服中心推的靈云全智能客服解決方案(AICC),基于靈云全智能能力平臺(AICP),運用行業(yè)領(lǐng)先的語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解以及大數據分析等AI技術(shù),為客服中心提供一站式的智能客服、智能語(yǔ)音導航、智能語(yǔ)音外呼、語(yǔ)音質(zhì)檢分析等智能解決方案。

- 智能客戶(hù)服務(wù):智能客服、智能語(yǔ)音導航在微信、網(wǎng)頁(yè)、APP、電話(huà)等多種渠道,為用戶(hù)解答咨詢(xún)、辦理業(yè)務(wù)
- 智能語(yǔ)音外呼:外呼機器人,快速完成海量電話(huà)的外呼,高效完成客戶(hù)回訪(fǎng)、金融催收、營(yíng)銷(xiāo)推廣等工作
- 智能語(yǔ)音分析:實(shí)現100%全覆蓋的智能語(yǔ)音質(zhì)檢,督促坐席提升服務(wù)質(zhì)量;對坐席通話(huà)進(jìn)行實(shí)時(shí)話(huà)術(shù)輔助,助力提升電銷(xiāo)成單率;對客服大數據進(jìn)行挖掘分析,助力業(yè)務(wù)決策。
同樣,在公檢法辦案語(yǔ)音筆錄場(chǎng)景,通過(guò)共用基礎AI能力平臺,支撐多場(chǎng)景業(yè)務(wù)應用:為詢(xún)問(wèn)室提供訊問(wèn)智錄系統,實(shí)現雙人對話(huà)轉寫(xiě);為會(huì )場(chǎng)提供智會(huì )系統,實(shí)現多人會(huì )議轉寫(xiě),和講話(huà)實(shí)時(shí)上屏;在辦公室,提供PC語(yǔ)音輸入法,用語(yǔ)音快速錄入文字信息;在外出執勤現場(chǎng),用便攜式訊問(wèn)筆錄一體機,快速生成訊問(wèn)筆錄,多項AI產(chǎn)品融合應用。
下一次轉型:AI云服務(wù)
展望未來(lái),下一次轉型是什么?5G、云計算快速發(fā)展,政企單位接受公有云服務(wù)的意愿度漸漸提升。下一次轉型,AI云服務(wù),將是巨大的機遇。
之前做項目有很多難點(diǎn)。對供應商來(lái)說(shuō),大量POC、交付項目,在全國各地大量部署,部署、對接調試時(shí)間長(cháng),人力、差旅成本巨大,散點(diǎn)運維,無(wú)法統一;對需求方來(lái)說(shuō),需要準備硬件環(huán)境(如ASR用的大內存服務(wù)器,機器翻譯用的GPU),需要投入人力配合部署、調試,部署拖長(cháng)了項目周期,也間接性增加了采購成本。
2018年,靈云AI入駐華為云,為產(chǎn)業(yè)界提供AI技術(shù)能力與產(chǎn)品方案云服務(wù)。
我們開(kāi)始了一個(gè)轉變,從部署各種能力、系統產(chǎn)品,轉為向客戶(hù)提供AI能力與產(chǎn)品服務(wù)的快速調用,讓每一家企業(yè)都能快速接入人工智能。

5G+云計算,天生助力AI云服務(wù)發(fā)展。5G傳輸,滿(mǎn)足音頻、圖像、視頻等傳輸量大,實(shí)時(shí)語(yǔ)音識別、OCR、視頻識別等要求低時(shí)延的要求;云計算,更能好的運行深度學(xué)習算法,滿(mǎn)足語(yǔ)音識別等模型庫巨大,圖像識別、機器翻譯等需要GPU計算的需求。
例如,某大型保險公司項目,之前由于網(wǎng)絡(luò )傳輸速率、延時(shí),不能滿(mǎn)足通話(huà)實(shí)時(shí)語(yǔ)音識別需求,超百臺服務(wù)器,進(jìn)行異地多活部署。有了5G后,可以轉變?yōu)榧薪y一部署,這可以減少硬件計算資源空置,減少運維管理投入,降低整體建設成本。
某警務(wù)外出辦案語(yǔ)音轉寫(xiě)項目,以前都是需要大內存筆記本電腦,或便攜式服務(wù)器部署ASR,成本高。換5G后,可以用5G調用公安云語(yǔ)音識別能力,普通筆記本聯(lián)網(wǎng)即可應用。
某政府大規模翻譯項目,5G,帶寬大、低延時(shí),滿(mǎn)足辦公實(shí)時(shí)傳輸大量語(yǔ)音、圖像等數據需求;機器翻譯、圖像識別等需要的GPU計算資源,由云平臺統一提供,提高硬件資源利用率。相較多點(diǎn)部署GPU服務(wù)器,大幅降低成本。
整體來(lái)說(shuō),用5G+云平臺方式提供AI服務(wù),具備諸多優(yōu)勢:客戶(hù)接入快、成本低,計算資源利用率高、運維統一,供應商成本低,AI更易推廣。

AI應用+云計算+5G,將構建一個(gè)更智能、更高速、算力更強大的智能化產(chǎn)業(yè)互聯(lián)網(wǎng),服務(wù)各行各業(yè)。
感謝大家的聆聽(tīng),歡迎學(xué)習交流!