日前,亞馬遜云科技宣布通過(guò)與光環(huán)新網(wǎng)和西云數據的緊密合作,在北京區域和寧夏區域正式上線(xiàn)Amazon Transcribe Streaming實(shí)時(shí)流式語(yǔ)音轉錄功能。Amazon Transcribe是一項自動(dòng)語(yǔ)音識別(ASR)服務(wù),可為用戶(hù)提供方便快捷的語(yǔ)音轉文本服務(wù),使用場(chǎng)景包括轉錄客服電話(huà)、自動(dòng)添加字幕、生成會(huì )議紀要,以及為媒體資產(chǎn)生成元數據、創(chuàng )建完全可搜索的存檔等。Amazon Transcribe根據轉錄的音頻時(shí)長(cháng)、按實(shí)際使用量付費,客戶(hù)無(wú)需花費昂貴的轉錄費用,便能讓開(kāi)發(fā)人員輕松地為其應用程序添加語(yǔ)音轉文本功能。
Amazon Transcribe能夠快速準確地將語(yǔ)音轉換為文本,用戶(hù)只需投入很少的時(shí)間和費用,便可以達到幾乎與手動(dòng)轉錄相媲美的轉錄效果。用戶(hù)可以將它應用于實(shí)時(shí)音頻流或批量音頻內容,創(chuàng )建包含音頻文件內容的應用程序。Amazon Transcribe采用深度學(xué)習功能自動(dòng)添加標點(diǎn)符號和格式,生成時(shí)間戳;并且,用戶(hù)可以通過(guò)轉錄控制臺自定義詞匯列表和語(yǔ)言模型,從而為特定領(lǐng)域的詞和詞組生成更準確的轉錄,例如產(chǎn)品名稱(chēng)、技術(shù)術(shù)語(yǔ)等。此外,Amazon Transcribe可以識別和修訂敏感的個(gè)人身份信息來(lái)保護用戶(hù)隱私安全,并通過(guò)詞匯表篩選掩蔽或刪除轉錄結果中不文明用語(yǔ),為客戶(hù)提供更好的轉錄效果和用戶(hù)體驗。
目前,Amazon Transcribe支持多種語(yǔ)言,在批量音頻內容處理中支持多達31種語(yǔ)言,在實(shí)時(shí)流失轉錄場(chǎng)景下支持包括中文普通話(huà)、澳大利亞英語(yǔ)、英國英語(yǔ)、美國英語(yǔ)、法語(yǔ)、加拿大法語(yǔ)、德語(yǔ)、意大利語(yǔ)、日語(yǔ)、韓語(yǔ)、巴西葡萄牙語(yǔ)和美國西班牙語(yǔ)等在內的12種語(yǔ)言。
首汽約車(chē)是首汽集團為推動(dòng)傳統出租車(chē)行業(yè)轉型升級而打造的網(wǎng)約車(chē)出行平臺。在首汽約車(chē)的“智能語(yǔ)音解決方案”項目中,亞馬遜云科技幫助客戶(hù)一起建立了語(yǔ)音降噪和導航音分離算法模型,先是利用Amazon SageMaker機器學(xué)習服務(wù)進(jìn)行模型構建、訓練、調優(yōu)和部署,再利用Amazon Transcribe人工智能語(yǔ)音服務(wù)將行程錄音自動(dòng)轉化為文字,從而實(shí)現通過(guò)場(chǎng)景化的關(guān)鍵詞識別分析觸發(fā)安全預警,結合后臺安全監控人員的人工判斷,讓實(shí)時(shí)的行程安全監控從“可能”變成“現實(shí)”。首汽約車(chē)副總裁閆磊表示“我們與亞馬遜云科技技術(shù)團隊緊密合作,利用Amazon SageMaker、Amazon Transcribe等服務(wù),實(shí)現了智能語(yǔ)音解決方案,將客服人工審核工作量降低了35%、客服人工聽(tīng)音審核時(shí)長(cháng)縮短了20%,且智能客戶(hù)投訴處理的準確率達90%以上,改善了司乘體驗和滿(mǎn)意度,提高了企業(yè)運營(yíng)效率。”
美國全國運動(dòng)汽車(chē)競賽協(xié)會(huì ) (NASCAR) 是一家美國汽車(chē)競賽審批和運營(yíng)公司,以賽車(chē)而聞名。NASCAR 發(fā)展部高級總監Patrick Carroll表示:“我們選擇使用 Amazon Transcribe,在我們覆蓋195個(gè)國家或地區以及29 種語(yǔ)言的多站點(diǎn)網(wǎng)站上為 NASCAR 的點(diǎn)播內容提供字幕。利用 Amazon Transcribe,我們建立了一個(gè)自動(dòng)化的系統,這個(gè)系統幾乎不需要我們的團隊進(jìn)行操作,同時(shí)讓我們能夠自定義自己需要的語(yǔ)音識別功能。應用了 Amazon Transcribe 之后,我們?yōu)?99% 的點(diǎn)播內容自動(dòng)添加了字幕,并且費用比我們最初的估計少97%。”
Audioburst 是一家擁有超前思維,極富創(chuàng )新力的技術(shù)提供商,他們讓談話(huà)音頻的發(fā)現、分發(fā)和個(gè)性化發(fā)生了轉變,Audioburst 聯(lián)合創(chuàng )始人兼首席技術(shù)官Gal Klein說(shuō):“每天,我們分析225,000 分鐘的實(shí)時(shí)電臺訪(fǎng)談,以形成數以千計的關(guān)于播放列表和搜索的短主題片段。我們選擇 Amazon Transcribe 是因為它作為出色的語(yǔ)音識別引擎,可幫助我們轉錄實(shí)時(shí)視頻內容,用于下游內容制作工作流。”
欲了解更多Amazon Transcribe信息,可訪(fǎng)問(wèn): https://www.amazonaws.cn/transcribe/ 。
關(guān)于亞馬遜云科技
15年多以來(lái),亞馬遜云科技 (Amazon Web Services)一直以技術(shù)創(chuàng )新、服務(wù)豐富、應用廣泛而享譽(yù)業(yè)界。亞馬遜云科技一直不斷擴展其服務(wù)組合以支持幾乎云上任意工作負載,目前提供超過(guò)200項全功能的服務(wù),涵蓋計算、存儲、數據庫、網(wǎng)絡(luò )、數據分析、機器學(xué)習與人工智能、物聯(lián)網(wǎng)、移動(dòng)、安全、混合云、虛擬現實(shí)與增強現實(shí)、媒體,以及應用開(kāi)發(fā)、部署與管理等方面;基礎設施遍及25個(gè)地理區域的81個(gè)可用區(AZ),并已公布計劃在澳大利亞、印度、印度尼西亞、以色列、西班牙、瑞士和阿聯(lián)酋新建7個(gè)區域、21個(gè)可用區。全球數百萬(wàn)客戶(hù),包括發(fā)展迅速的初創(chuàng )公司、大型企業(yè)和領(lǐng)先的政府機構,都信賴(lài)亞馬遜云科技,通過(guò)亞馬遜云科技的服務(wù)支撐其基礎設施,提高敏捷性,降低成本。
消息來(lái)源:AWS