AI技術(shù),是近年來(lái)最火熱的前沿技術(shù)之一。在企業(yè)通信領(lǐng)域,人工智能可以簡(jiǎn)化企業(yè)日常交流和協(xié)作的多個(gè)要素,這不僅可以提升員工對公司業(yè)務(wù)的參與度,而且可以提高協(xié)作效率和生產(chǎn)力。
本期「億聯(lián)大咖說(shuō)」,就帶你與億聯(lián)產(chǎn)品副總廖昀近距離接觸,了解他對AI技術(shù)在企業(yè)通信領(lǐng)域發(fā)展的前沿觀(guān)點(diǎn)。

億聯(lián)產(chǎn)品副總 廖昀
01小編:請問(wèn)廖總,最開(kāi)始是什么契機導致AI技術(shù)引入企業(yè)通信領(lǐng)域?
廖昀:AI人工智能本身是一種模擬、延伸和擴展人類(lèi)智能的一種技術(shù),本質(zhì)上是希望能通過(guò)這一技術(shù),讓計算機算法代替人完成數據的分析思考,然后進(jìn)行各類(lèi)操作,改善和提升我們進(jìn)行各項活動(dòng)時(shí)的體驗。企業(yè)通信領(lǐng)域引入人工智能也是基于這樣的目的,是用戶(hù)需求驅動(dòng)的結果。
語(yǔ)音、圖像等各類(lèi)AI技術(shù)很好地解決了企業(yè)通信應用中的一些用戶(hù)體驗痛點(diǎn),當我將這些技術(shù)應用到日常通信場(chǎng)景中時(shí),我們發(fā)現這與我們一直倡導的“易用易部署”的產(chǎn)品設計理念不謀而合,也讓我們堅定了要運用AI技術(shù)升級企業(yè)通信方案的想法。
02小編:在企業(yè)通信領(lǐng)域,AI技術(shù)的發(fā)展涉及哪些技術(shù)領(lǐng)域?具體發(fā)展和應用如何?
廖昀:在企業(yè)通信領(lǐng)域,契合用戶(hù)場(chǎng)景需求、能產(chǎn)生較大價(jià)值的AI技術(shù)主要包括語(yǔ)音識別、多語(yǔ)言翻譯、人臉和人體檢測識別等幾個(gè)方面。在通信系統或終端中,通過(guò)引入AI技術(shù),對改善人機交互體驗,提升溝通協(xié)作效率,以及簡(jiǎn)化會(huì )議內容的跟進(jìn)處理,這些方面都存在很大的應用價(jià)值。
目前業(yè)內發(fā)展比較成熟,已經(jīng)得到普遍應用或者正在落地的AI技術(shù)應用主要有以下幾個(gè):
人像識別自動(dòng)取景及演講者跟蹤
這項功能主要體現在視頻會(huì )議過(guò)程中,集成人像檢測、聲源定位、語(yǔ)音追蹤等多項AI技術(shù),能根據參會(huì )人數與位置變化自動(dòng)調整畫(huà)面大小,呈現最佳取景。此外,還能實(shí)時(shí)檢測發(fā)言者位置,呈現特寫(xiě),免去手動(dòng)調節攝像機操作,像是有一個(gè)自動(dòng)導播員,讓與會(huì )人員更專(zhuān)注于會(huì )議內容。

億聯(lián)終端自動(dòng)取景功能
基于人臉識別的參會(huì )人自動(dòng)識別或自動(dòng)簽到
在會(huì )議開(kāi)始前提前錄入人像及相關(guān)信息,在視頻會(huì )議中,系統若識別到與人像匹配的與會(huì )者,將自動(dòng)標記相關(guān)信息,避免會(huì )議中詢(xún)問(wèn)或確認對方名字和身份的尷尬,也可以進(jìn)行會(huì )議的自動(dòng)簽到,以及結合演講者跟蹤、語(yǔ)音識別技術(shù)實(shí)現按發(fā)言人分類(lèi)的發(fā)言文字記錄功能。
智能語(yǔ)音增強
通過(guò)人工智能語(yǔ)音識別技術(shù),并利用麥克風(fēng)陣列的空間選擇性,對目標說(shuō)話(huà)人語(yǔ)音進(jìn)行增強,同時(shí)抑制或消除噪聲、混響等無(wú)效語(yǔ)音的干擾。

億聯(lián)話(huà)機“隔音罩”功能
實(shí)時(shí)語(yǔ)音轉寫(xiě)及多語(yǔ)言翻譯
將發(fā)言語(yǔ)音實(shí)時(shí)轉寫(xiě)為字幕,進(jìn)一步地可翻譯為多語(yǔ)言字幕,會(huì )后還可以將會(huì )議發(fā)言、音視頻直播內容等音頻轉寫(xiě)為文字,并進(jìn)行分類(lèi)歸納整理為會(huì )議紀要。
虛擬場(chǎng)景、背景替換
當前基于摳圖和背景虛化、背景替換的AI應用得到了用戶(hù)的普遍喜愛(ài),這是一個(gè)很典型的用戶(hù)需求驅動(dòng)的應用案例,既降低了會(huì )議過(guò)程中干擾,提升了溝通效率,又打破了用戶(hù)參與會(huì )議的地點(diǎn)場(chǎng)景限制。
這些AI應用在億聯(lián)網(wǎng)絡(luò )推出的企業(yè)通信解決方案中,有些已經(jīng)得到了很好的應用,有些正在完善中,即將在后續的版本中得到體現。未來(lái)的遠程溝通協(xié)作體驗將更加智能和高效。
03小編:未來(lái),還會(huì )有哪些AI功能陸續應用在企業(yè)通信領(lǐng)域?
廖昀:企業(yè)通信領(lǐng)域近些年一直在A(yíng)I技術(shù)應用上不斷突破,始終圍繞提升溝通效率這一根本目的展開(kāi)。
下個(gè)階段,在語(yǔ)音識別方面,多語(yǔ)言翻譯將會(huì )是下一個(gè)存在巨大應用潛力的AI技術(shù)。這項技術(shù)主要應用于遠程會(huì )議中跨語(yǔ)言的溝通交流,實(shí)時(shí)會(huì )議中的多語(yǔ)言翻譯對翻譯的準確性和實(shí)時(shí)性要求很高,面臨著(zhù)很大的挑戰,目前這項技術(shù)在業(yè)內還處于完善階段,還有不少問(wèn)題要解決或性能指標的提升。
實(shí)時(shí)會(huì )議的多語(yǔ)言翻譯這項技術(shù)的落地應用,需要平臺端和終端共同努力,在提升平臺端翻譯準確度和實(shí)時(shí)性的同時(shí),終端也要提升前端采集的語(yǔ)音質(zhì)量。技術(shù)的進(jìn)步和發(fā)展常常超出我們的預期,現在的技術(shù)困難和障礙都將是暫時(shí)的,現在看似不可能的AI功能應用,只要用戶(hù)有強烈的需求在驅動(dòng),未來(lái)終將得到實(shí)現和普及應用。

億聯(lián)語(yǔ)音轉寫(xiě)功能
在企業(yè)通信中,除了語(yǔ)音和圖像的基本AI應用,提升遠程溝通交流的效率,橫向地,也可以將這些AI技術(shù)與各類(lèi)企業(yè)數據平臺打通,實(shí)現更智能、更高效的辦公協(xié)作體驗。比如根據語(yǔ)音識別到的會(huì )議話(huà)題內容,自動(dòng)調取各項業(yè)務(wù)流數據,或者自動(dòng)對接和處理郵件、日歷、OA、項目管理等各項業(yè)務(wù)流程,就像是有一個(gè)全能型的會(huì )議秘書(shū)可以隨時(shí)幫你提供業(yè)務(wù)數據和內容,并自動(dòng)跟進(jìn)會(huì )議的待跟蹤事項,通過(guò)高效的數據分析和智能的業(yè)務(wù)判斷,讓我們的辦公和溝通協(xié)作非常地順暢。
未來(lái),億聯(lián)網(wǎng)絡(luò )將持續加碼AI智能在企業(yè)通信領(lǐng)域的應用,讓我們的企業(yè)通信產(chǎn)品更加簡(jiǎn)便易用,為我們的用戶(hù)帶來(lái)更加智能的通信體驗。我們也將始終關(guān)注AI技術(shù)的前沿應用,分享未來(lái)人類(lèi)便捷生活的美好圖景。