這種緊迫性源于這樣一個(gè)事實(shí):數據量正以令人難以置信的速度增長(cháng)。國際數據公司(IDC)的數據顯示,全球數據總量預計將從2018年的33zettabyte字節(1zettabyte字節相當于1萬(wàn)億千兆字節--trillion gigabytes)增長(cháng)到2025年的175zettabyte字節,復合年增長(cháng)率(CAGR)為61%。
自然,公司正在努力處理、存儲和保護其不斷擴大的信息池,而不斷增長(cháng)的數據量正在推動(dòng)邊緣計算業(yè)務(wù)案例。在較高的層次上,邊緣計算是一種架構,它將位于數據中心(通常稱(chēng)為核心)的云服務(wù)與靠近最終用戶(hù)的邊緣計算設備相結合,這些設備可以自主地滿(mǎn)足部分應用程序功能。最近兩方面都發(fā)生了變化。
云計算為企業(yè)提供了一種比傳統系統更簡(jiǎn)單的部署和管理計算機基礎設施的方法,但這種差距一直在擴大。云將計算機處理集中在海量數據中心。據Gartner統計,2018年,90%的企業(yè)數據是在云端創(chuàng )建的,只有10%是在邊緣中創(chuàng )建的。
然而,到2025年,邊緣計算將占75%,云計算僅占25%。因此,一些云基礎設施的缺陷正在顯現。“專(zhuān)門(mén)的語(yǔ)音應用程序,比如互聯(lián)汽車(chē),需要將大量數據傳送到云端,但網(wǎng)絡(luò )可用性和質(zhì)量并不總是有保證,”Conversational Technologies的負責人Deborah Dahl解釋道。
隱私是另一個(gè)問(wèn)題。“Dahl補充說(shuō):“人們越來(lái)越懷疑供應商的動(dòng)機,不喜歡他們的個(gè)人信息進(jìn)入云端,因為他們無(wú)法控制這些信息,也無(wú)法知道這些信息會(huì )發(fā)生什么。”這種不安在醫療保健和金融服務(wù)等垂直行業(yè)尤其普遍,但很少有行業(yè)能完全幸免。此外,消費者還擔心黑客可能會(huì )利用語(yǔ)音系統進(jìn)入自己家中。家長(cháng)們尤其擔心從孩子身上收集到什么信息以及如何使用這些信息。
“因此,語(yǔ)音行業(yè)一直在尋求將計算能力和存儲能力推向網(wǎng)絡(luò )邊緣。語(yǔ)音平臺,如Amazon Alexa、Google Assistant、Microsoft Cortana和Nuance Communications的Dragon,從提供解決方案的一開(kāi)始就基本上部署了邊緣技術(shù)。”Opus Research的創(chuàng )始人兼首席分析師Dan Miller解釋說(shuō):“有很多智能終端,比如揚聲器、自動(dòng)信息娛樂(lè )系統、信息亭和智能手機,都有語(yǔ)音用戶(hù)界面。”
然而,本地發(fā)生的計算和分析量很小,主要由喚醒系統的命令組成。一個(gè)原因是他們的設計是幾年前開(kāi)發(fā)的,當時(shí)邊緣設備缺乏本地處理能力和電池電源。
隨著(zhù)行業(yè)的發(fā)展,這些障礙已經(jīng)被清除,云計算的局限性已經(jīng)明確化。將大部分會(huì )話(huà)發(fā)送到云端進(jìn)行解碼、解釋和響應,會(huì )降低響應時(shí)間,增加網(wǎng)絡(luò )基礎設施需求(及其成本),并引發(fā)安全問(wèn)題。
邊緣計算對語(yǔ)音技術(shù)的許多好處
邊緣計算正在發(fā)展成為一種更具吸引力的選擇,因為它分析數據時(shí)更接近數據的創(chuàng )建位置,并將信息從終端設備到語(yǔ)音識別系統的移動(dòng)最小化。更智能的邊緣系統可以支持音頻捕獲等功能;壓縮;傳輸;語(yǔ)言處理;還有語(yǔ)音追蹤。此外,將更大的單詞子集和自然語(yǔ)言處理功能放在更接近用戶(hù)的位置會(huì )帶來(lái)許多好處,包括:- 它增強了應用程序的響應能力,因為系統不會(huì )受到網(wǎng)絡(luò )或云數據中心速度減慢的阻礙。
- 它減少了互聯(lián)網(wǎng)帶寬的使用,向云發(fā)送簡(jiǎn)單的文本消息,而不是復雜的語(yǔ)音記錄。
- 它降低了成本,使公司能夠削減網(wǎng)絡(luò )成本,因為它們傳輸的信息較少。
- 減少延遲。延遲是有問(wèn)題的,數據從設備傳輸到執行分析并返回結果所需的時(shí)間。將數據移近終點(diǎn)會(huì )縮短響應時(shí)間,并允許在后臺處理選定的任務(wù),如將項目添加到購物列表或創(chuàng )建提醒。
- 它更好地支持任務(wù)關(guān)鍵型應用程序。處理速度如此之快,以至于公司可以部署需要即時(shí)數據處理的實(shí)時(shí)應用程序。
- 提供離線(xiàn)可用性。有了云,就不能保證網(wǎng)絡(luò )始終可用或可靠。通過(guò)邊緣計算,語(yǔ)音助手處理某些命令并執行選擇功能,例如自動(dòng)發(fā)出警報和發(fā)送提醒,即使設備處于飛行模式或超出覆蓋范圍。
- 它保持數據的私有性,因為供應商可以進(jìn)行檢查,這樣用戶(hù)數據就保持在本地,而不會(huì )發(fā)送到云。
- 它符合隱私要求,如歐盟的一般數據保護條例(GDPR),該條例限制了信息的存儲位置;更少的移動(dòng)意味著(zhù)更少的潛在問(wèn)題。
- 它提高了安全性,因為邊緣系統越來(lái)越善于區分和識別用戶(hù)聲音。本地處理可以通過(guò)重置系統配置文件快速阻止試圖闖入的人。
但要使邊緣計算全面運行,還需要進(jìn)行一些基礎設施升級。一個(gè)好的起點(diǎn)是硬件。“圍繞本地自然語(yǔ)言處理這類(lèi)事情的最大挑戰是將應用程序和數據模型限制在便攜式設備上的小腳印上,”Miller解釋說(shuō)。
供應商必須升級他們的邊緣硬件,使其更強大。例如,亞馬遜的Echo設備使用該公司的AZ1神經(jīng)邊緣處理器,它需要的功耗減少20倍,內存使用率降低85%,但語(yǔ)音處理能力卻翻了一番。此外,CEVA、Fluent。ai、NVIDIA、Intel和Syntiant等半導體供應商正在開(kāi)發(fā)專(zhuān)用中央處理單元、圖形處理單元、數字信號處理器和系統芯片語(yǔ)音處理解決方案,旨在以小型、節能的形式提供所需的處理能力。
傳統的無(wú)線(xiàn)廣域網(wǎng)(WAN)技術(shù)不適合邊緣計算。認識到這些局限性,國際電信聯(lián)盟(International Telecommunications Union)、3GPP和互聯(lián)網(wǎng)工程任務(wù)組(Internet Engineering Task Force(IETF))開(kāi)發(fā)了IMT-2020,即5G。它提供了許多增強功能,包括:
支持更多設備:新標準是為邊緣設計的。4G網(wǎng)絡(luò )支持每平方公里最多約4000臺設備;5G與100萬(wàn)人合作。
減少延遲:4G延遲通常在20毫秒到30毫秒之間;5G是1毫秒到10毫秒。
更快的速度:4G以每秒1G的速度運行;5G的最高速度高達每秒20G。
人工智能和機器學(xué)習的進(jìn)步使得語(yǔ)音系統變得更加復雜。檢測到關(guān)鍵字后,設備開(kāi)始主動(dòng)偵聽(tīng)。更多的智能可以放在本地,因此邊緣系統可以在嘈雜的環(huán)境中更好地處理信息,例如繁忙的辦公室。新興的技術(shù)將用戶(hù)的聲音與周?chē)穆曇舴珠_(kāi)。
例如,波束形成處理來(lái)自多個(gè)麥克風(fēng)的音頻,以便將注意力集中在用戶(hù)所在的方向。如果員工從一個(gè)地方移動(dòng)到另一個(gè)地方,語(yǔ)音跟蹤算法會(huì )調整麥克風(fēng)信號之間的平衡,這樣系統就能知道說(shuō)話(huà)者在哪里,并能聽(tīng)到他們在說(shuō)什么。
軟件還可以抑制會(huì )話(huà)干擾。與消除噪音耳機的工作方式類(lèi)似,該設備負責抑制干擾和音樂(lè ),即使在大聲播放時(shí)也是如此。
先進(jìn)的邊緣計算能力支持語(yǔ)音生物識別,防止未經(jīng)授權的用戶(hù)輸入信息,進(jìn)行購買(mǎi),或更改關(guān)鍵系統設置。在處理敏感客戶(hù)或員工信息(如人力資源數據或帳單)的部門(mén)中,這些功能非常重要。
設備上的人工智能語(yǔ)音識別可以執行高級安全功能。一種裝置探測到玻璃破碎的聲音并觸發(fā)警報。當連接到攝像頭時(shí),聲音會(huì )觸發(fā)對視頻的特寫(xiě)錄制事件。
邊緣計算功能正在被添加到智能設備、計算機、打印機、家用電器、燈具、辦公設備和玩具中。用戶(hù)可以輸入命令來(lái)執行任務(wù),比如打印文檔,或者幫助員工閱讀重要文檔。
邊緣計算提供了潛在的成本節約。供應商語(yǔ)音識別的應用程序編程接口(API)調用通常每1000個(gè)APIs調用花費4美元。將智能放在離設備更近的地方可以消除它們并降低系統開(kāi)銷(xiāo)。
邊緣計算是一項正在進(jìn)行的工作
然而,邊緣應用程序開(kāi)發(fā)工作非常復雜,處于開(kāi)發(fā)的初級階段,需要一個(gè)更加健壯的生態(tài)系統。隨著(zhù)數據從云端移動(dòng)到邊緣,軟件復雜性增加。
IDC邊緣策略研究總監Dave McCarthy表示,硬件平臺及其支持的通信協(xié)議日益多樣化也帶來(lái)了挑戰。將這些信息保存在一個(gè)地方,云計算比在多個(gè)地方協(xié)調信息要簡(jiǎn)單得多。
規模也是一個(gè)問(wèn)題。“邊緣適用于只有少量設備的應用程序,但隨著(zhù)供應商規模擴大到數百或數千臺,這種模式往往會(huì )崩潰,”Mc Carthy說(shuō)。
缺乏標準使這一挑戰雪上加霜。目前,供應商正在以自己的方式解決這些問(wèn)題,因此軟件的可移植性和開(kāi)發(fā)的一致性受到限制。
軟件更新和維護變得更加復雜,因為數據必須在多個(gè)位置同步。“如果有一小部分可能的功能,比如說(shuō)對于一個(gè)玩具,更新應該是簡(jiǎn)單的;如果一個(gè)應用程序很復雜,比如說(shuō)庫存,那么工作就會(huì )變得更麻煩。”
隨著(zhù)數據從數據中心轉移到邊緣,公司也需要新的管理工具。如果沒(méi)有它們,他們可能無(wú)法監視事務(wù)中每個(gè)步驟發(fā)生的情況,識別潛在的瓶頸,并在問(wèn)題對性能產(chǎn)生負面影響之前理想地解決問(wèn)題。
最后,請注意,這一領(lǐng)域是新的,因此基本上缺少所需的支持基礎設施和技能。很少有開(kāi)發(fā)人員了解新的體系結構,而最佳實(shí)踐的開(kāi)發(fā)才剛剛起步。總之,生態(tài)系統需要做很多工作。
邊緣計算找到了一個(gè)利基市場(chǎng)
由于邊緣語(yǔ)音系統的雛形,它們是例外而不是規則。它們存在于選擇性用例中,包括需要以下條件的用例:
速度,當系統需要以難以置信的速度處理數據時(shí),比如實(shí)時(shí)解決方案;
缺乏可用帶寬,當機器生成大量數據時(shí),將無(wú)法有效地發(fā)送到遠程數據中心;
自治,解決方案需要能夠在沒(méi)有網(wǎng)絡(luò )連接的情況下運行;和遵守,當信息必須保持在特定區域內以遵守法規時(shí)。
因此,專(zhuān)注于這一領(lǐng)域的供應商數量很小。2019年11月,Nuance Communications剝離了Cerence,該公司成為一家獨立的汽車(chē)軟件公司。Cerence Drive語(yǔ)音識別系統用于3.5億輛汽車(chē),其虛擬助手功能可執行諸如打開(kāi)空調和找到最近的Wi-Fi咖啡館等任務(wù)。
Sensor的邊緣解決方案嵌入了來(lái)自ATT、Hasbro、華為、谷歌、亞馬遜、三星、LG、摩托羅拉、GoPro、索尼、騰訊、Garmin、LG、Microsoft和聯(lián)想等數百家消費電子廠(chǎng)商的30多億個(gè)產(chǎn)品中。
那么未來(lái)會(huì )怎樣呢?“我沒(méi)有看到大多數語(yǔ)音應用程序使用邊緣技術(shù),但是那些需要低延遲、隱私和安全性的應用程序會(huì )發(fā)現它很有吸引力,”Dahl總結道。
聲明:版權所有 非合作媒體謝絕轉載
作者:Paul Korzeniowski
原文網(wǎng)址:
https://www.speechtechmag.com/Articles/Editorial/Features/Speech-Technology-Inches-Closer-to-the-Edge--146809.aspx