• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    標貝科技CEO劉博:5G時(shí)代,如何打造“聲入人心”的AI語(yǔ)音交互體驗

    2020-04-03 09:41:35   作者:   來(lái)源:騰訊5G生態(tài)計劃    評論:0  點(diǎn)擊:


      2020這個(gè)看似艱難的開(kāi)年,事實(shí)上成為了數字化生活的加速助推器。
      5G已經(jīng)是人們眼前可見(jiàn)的未來(lái),更美好的數字化場(chǎng)景觸手可及。在無(wú)論多艱難的環(huán)境里,我們希望從身邊每一個(gè)看似平凡的創(chuàng )新者身上,依然能看見(jiàn)光,依然能勇敢的去做一個(gè)追光者。
      5G作為全面“重造連接”的基石,所引發(fā)變革的廣度和深度,都將遠超4G。在新的變革時(shí)代,改變世界,并不是大企業(yè)的專(zhuān)屬,它同樣屬于那些遍布不同行業(yè)的創(chuàng )新者。
      5G時(shí)代的序幕已經(jīng)拉開(kāi),騰訊5G生態(tài)計劃將與創(chuàng )新者同行,為追光者助力,實(shí)現“所見(jiàn)即未來(lái)”。
      通過(guò)「追光者-5G引領(lǐng)數字化」欄目,我們將邀請10個(gè)領(lǐng)域的5G創(chuàng )新者,講述他們的探索、行動(dòng)、思考和預測,開(kāi)啟5G引領(lǐng)下的數字化變革暢想。
      機器學(xué)習以及自然語(yǔ)言處理技術(shù)的進(jìn)步,開(kāi)啟了基于先進(jìn)AI技術(shù)的人機語(yǔ)音交互,人們透過(guò)對話(huà)的方式獲取信息、與機器進(jìn)行交互,將不再只是存在科幻情結當中。
      AI語(yǔ)音交互正在進(jìn)入每個(gè)人的日常生活,娛樂(lè )、工作、社交各個(gè)場(chǎng)景都已經(jīng)出現了“它”的身影。隨著(zhù)5G翩然而至,高帶寬、低時(shí)延、廣連接“三大特性”將進(jìn)一步突破AI語(yǔ)音瓶頸,或許會(huì )給出更豐富的應用場(chǎng)景和更完善的解決方案。
      本期「追光者-5G引領(lǐng)數字化」欄目,我們邀請到標貝科技創(chuàng )始人兼CEO劉博,共同走進(jìn)智能語(yǔ)音的世界,一探5G時(shí)代的AI語(yǔ)音交互,將如何變化升級?哪些AI語(yǔ)音應用場(chǎng)景將成為下一個(gè)風(fēng)口?
    劉博
    標貝科技創(chuàng )始人兼CEO
      智能語(yǔ)音如何發(fā)展至今?
      回顧智能語(yǔ)音的發(fā)展歷程,大致分為五個(gè)階段。
      第一個(gè)階段是萌芽期,在1952年,貝爾實(shí)驗室研制出首個(gè)語(yǔ)音識別系統Audry,但當時(shí)的語(yǔ)音識別系統非常粗糙,基本上停留在實(shí)驗室階段。
      第二個(gè)階段,在1984年,語(yǔ)音技術(shù)取得了真正的突破。IBM發(fā)布一款大詞匯量識別系統,涵蓋5000多個(gè)詞匯,識別率達到95%。除此之外,美國卡內基梅隆大學(xué)開(kāi)發(fā)出一套名叫SPHINX的語(yǔ)音識別引擎,為后期語(yǔ)音識別技術(shù)走向商業(yè)化起到了重要的推動(dòng)作用。
      第三個(gè)階段,我們將其定義為產(chǎn)業(yè)化階段。在1997年,第一款語(yǔ)音聽(tīng)寫(xiě)產(chǎn)品誕生了。2002年,美國啟動(dòng)“全球自主語(yǔ)音”GALE項目,研發(fā)實(shí)時(shí)翻譯印刷品、網(wǎng)頁(yè)、新聞及電視廣播技術(shù)。2009年,微軟發(fā)布的Win7也集成了語(yǔ)音識別的功能。
      在第四個(gè)階段,語(yǔ)音技術(shù)迎來(lái)了快速應用。蘋(píng)果推出首個(gè)語(yǔ)音助手Siri,谷歌相繼發(fā)布了首個(gè)手機語(yǔ)音搜素引擎GoogleNow。在技術(shù)具體落地的同時(shí)也解決了一些實(shí)際問(wèn)題,比如2015年,我國誕生了首個(gè)可打斷糾錯的語(yǔ)音系統,極大提升了語(yǔ)音交互體驗,對后續的應用化落地起到很大作用。
      在第五個(gè)階段,我認為是語(yǔ)音產(chǎn)品的爆發(fā)期。國內我們能看到像騰訊、百度、小米、阿里等互聯(lián)網(wǎng)大廠(chǎng),都推出了自家的智能語(yǔ)音產(chǎn)品。所以我相信,隨著(zhù)AI語(yǔ)音識別應用領(lǐng)域的不斷擴展,我們的技術(shù)將獲得更多普及。
      與4G相比,5G將會(huì )對AI語(yǔ)音交互有哪些影響?
      4G連接了人與人,更強調以“人”為核心的交互過(guò)程。由于5G對邊緣計算和網(wǎng)絡(luò )切片能力的提升,未來(lái)會(huì )有更多設備接入5G網(wǎng)絡(luò ),因此AI語(yǔ)音交互將經(jīng)歷從“人”到“人和設備”的核心轉變。那么5G將在哪些方面提升AI語(yǔ)音交互技術(shù)呢?
      首先,5G提升語(yǔ)音采樣率,打造更接近人聲的合成聲音。
      當我們在打電話(huà)溝通交流時(shí),經(jīng)常會(huì )產(chǎn)生很多問(wèn)題。比如在電話(huà)中會(huì )發(fā)現對方的聲音可能不太友好,抑或是表達的意思不夠清晰。這也是為什么人們更喜歡面對面溝通重要的事情。
      在4G的時(shí)候,語(yǔ)音采樣率的指標是16K,隨著(zhù)5G不斷成熟應用,語(yǔ)音采樣率將會(huì )提升至44K。兩者本質(zhì)上是信息密度傳輸的區別。隨著(zhù)采樣率的提升,語(yǔ)音將承載的交流信息會(huì )更強,我們可以更多地感受到對方表達的意思和溫度。同時(shí),可以獲取更保真、音質(zhì)更好的的效果,所以我們期待借助5G技術(shù),打造更接近人聲效果的合成語(yǔ)音。
      其次,5G提升泛在線(xiàn)設備能力,覆蓋連接更多設備,延展AI語(yǔ)音交互場(chǎng)景。
      盡管當前的4G網(wǎng)絡(luò )每平方公里可以容納數千臺設備,但同樣范圍內5G可以為百萬(wàn)臺設備提供高速網(wǎng)絡(luò )連接。因此在5G時(shí)代,泛在線(xiàn)的能力將得到極大提升,當設備接入5G網(wǎng)絡(luò )體系之后,更多應用將融進(jìn)場(chǎng)景,形成交互的多元化應用。隨著(zhù)交互形態(tài)和交互能力提升,用戶(hù)的交互意愿將達到質(zhì)的變化。
      據艾瑞咨詢(xún)發(fā)布《2020中國智能物聯(lián)網(wǎng)AloT白皮書(shū)》顯示,至2025年,65%以上中國家庭擁有AI管家包括智能音箱、智能機器人、智能面板等形態(tài)的產(chǎn)品,且一戶(hù)家庭可以擁有10臺以上具備AI感知能力的設備,從而形成智能家居交互方式無(wú)感化。不僅僅是家居生活,未來(lái)的AI語(yǔ)音交互將轉向多場(chǎng)景切換、多交互形式,最終形成跨終端的無(wú)縫體驗。
      再者,5G豐富AI語(yǔ)音交互形式,向“千人千面”轉型。
      4G時(shí)代,由于帶寬壓力和計算能力限制,很多人機交互還停留在單一的語(yǔ)音對話(huà)形式,比如人機智能問(wèn)答。但隨著(zhù)5G基礎建設的不斷提升,人機交互將融入更多的AI技術(shù),包括手勢、人臉、視覺(jué)、語(yǔ)音等,形成多維度、多層次立體化的交互體系。
      記得之前很多人問(wèn)我,語(yǔ)音是不是獨立存在的單個(gè)場(chǎng)景或板塊?其實(shí)不然。語(yǔ)音作為交互能力的基礎,通過(guò)整合更多的場(chǎng)景形態(tài)和先進(jìn)技術(shù),打造沉浸式的交互體驗。在未來(lái),我們可能將更多的技術(shù)融入相應的設備里,形成多元化的產(chǎn)品體系。由于受限于4G速度,以前沒(méi)辦法真正做到語(yǔ)音交互的個(gè)性化、定制化、差異化,如今基于5G的特性,可以增加個(gè)性化定制的交互場(chǎng)景,實(shí)現“千人千面”的體驗。
      AI語(yǔ)音技術(shù)應用在哪些重要的5G場(chǎng)景?
      5G+融媒體場(chǎng)景
      現在,視頻領(lǐng)域正成為大廠(chǎng)們競相追逐的熱點(diǎn),因為內容創(chuàng )造對于任何廠(chǎng)家而言都是瓶頸。但我們在做制作內容的時(shí)候,通過(guò)5G與AI語(yǔ)音技術(shù)的結合,將大大提高產(chǎn)出效率。
      AI語(yǔ)音不僅能夠推動(dòng)數字技術(shù)的內容創(chuàng )作,還提高了媒體制作的效率。比如融媒體超高清視頻的制作主要分成三個(gè)部分:采集回傳、視頻素材的云端制作、最后形成高清視頻節目播出。5G+AI語(yǔ)音技術(shù)將整個(gè)“采-編-傳”的過(guò)程音頻化、高清化、云端化,極大解放了內容創(chuàng )作者的雙手。
    來(lái)源:IMT-2020(5G)推進(jìn)組5G新媒體行業(yè)白皮書(shū)
      5G+泛娛樂(lè )場(chǎng)景
      當AI語(yǔ)音交互技術(shù)應用在泛娛樂(lè )場(chǎng)景時(shí),比如云游戲、高清視頻、VR、AR直播等等,將帶來(lái)更清晰的交互流程和更優(yōu)質(zhì)的交互體驗,實(shí)現定制化、智能化和場(chǎng)景化的高度滲透與融合。我觀(guān)察到云游戲的體驗形式正在發(fā)生本質(zhì)變化,市面上有部分廠(chǎng)商已經(jīng)實(shí)現了一些智能化體驗,游戲中的NPC(非玩家角色)可以直接跟用戶(hù)進(jìn)行對話(huà)和交流。
      5G+智慧生活
      5G重構設備的連接方式,而AI語(yǔ)音讓設備自身、設備與設備之間更懂人,實(shí)現個(gè)性化的人機交互體驗,從萬(wàn)物連接走向萬(wàn)物智能。
      據相關(guān)白皮書(shū)指出,受益于城市端AIoT業(yè)務(wù)的規模化落地及邊緣計算的初步普及,2019年中國AIoT市場(chǎng)規模突破3000億大關(guān),直指4000億量級。由于A(yíng)IoT在落地過(guò)程中需要重構傳統產(chǎn)業(yè)價(jià)值鏈,未來(lái)幾年將會(huì )迎來(lái)較快的發(fā)展節奏,包括智能家居、車(chē)聯(lián)網(wǎng)、無(wú)人駕駛、智慧醫療等領(lǐng)域都將與AI語(yǔ)音交互緊密結合,從實(shí)驗室專(zhuān)有領(lǐng)域進(jìn)入尋常百姓的生活。
      隨著(zhù)5G與AI語(yǔ)音交互的不斷融合,語(yǔ)音技術(shù)與場(chǎng)景結合度更加緊密,個(gè)性化語(yǔ)音交互是必然趨勢。我們希望把技術(shù)、情感與用戶(hù)串聯(lián)一起,將AI語(yǔ)音技術(shù)應用到更多場(chǎng)景中,帶來(lái)“聲入人心”的語(yǔ)音交互體驗。
    (掃描二維碼,觀(guān)看直播回放)
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 武邑县| 张掖市| 资中县| 庄河市| 石狮市| 东兰县| 介休市| 磴口县| 井陉县| 申扎县| 克拉玛依市| 磐安县| 隆德县| 潜江市| 浑源县| 墨竹工卡县| 雅江县| 慈溪市| 广安市| 绥中县| 资阳市| 威信县| 徐水县| 泗洪县| 会同县| 清水县| 剑川县| 万州区| 宁南县| 德格县| 祁门县| 永春县| 上高县| 绥中县| 札达县| 紫金县| 桐庐县| 兴安县| 滨海县| 台中市| 荣成市| http://444 http://444 http://444 http://444 http://444 http://444