
近日,標貝科技全新推出英語(yǔ)語(yǔ)音識別能力,得益于海量的數據基礎及深度學(xué)習平臺,英語(yǔ)語(yǔ)音識別的準確率得到全面提升,助推語(yǔ)音交互技術(shù)在更多場(chǎng)景的落地應用。
標貝英語(yǔ)語(yǔ)音識別詞準率達95%
人機交互主要解決如何讓機器聽(tīng)得懂,并作出正確的回應,因而語(yǔ)言識別和自然語(yǔ)言處理能力尤為重要。標貝科技此次推出的英語(yǔ)語(yǔ)音識別功能完全基于標貝自研的深度神經(jīng)網(wǎng)絡(luò )訓練聲學(xué)模型進(jìn)行研發(fā),通過(guò)大量英語(yǔ)語(yǔ)料數據,不斷對識別模型進(jìn)行優(yōu)化訓練,從而讓語(yǔ)音識別準確率獲得大幅提升,英語(yǔ)語(yǔ)音識別詞準率高達95%。
此外,標貝英語(yǔ)語(yǔ)音識別可以支持一句話(huà)、長(cháng)語(yǔ)音、錄音文件三種形式的識別轉寫(xiě),同時(shí)還能根據應用場(chǎng)景需要,針對特定詞匯識別效果進(jìn)行優(yōu)化定制,適用于不同場(chǎng)景下的美式英語(yǔ)、英式英語(yǔ)、中英文混合識別,提升用戶(hù)交互體驗。
打造數據工場(chǎng)構建10萬(wàn)小時(shí)自有數據庫
眾所周知,基于機器學(xué)習的各種技術(shù),往往都需要使用大量的數據來(lái)訓練,語(yǔ)音識別的準確率更是離不開(kāi)算法和數據的積累。實(shí)際應用中,數據作為機器學(xué)習的基礎,很多時(shí)候數據質(zhì)量的好壞對總體性能的影響甚至超過(guò)了算法本身。斯坦福大學(xué)副教授、Coursera聯(lián)合創(chuàng )始人吳恩達,曾經(jīng)強調數據質(zhì)量對于A(yíng)I的重要性:80%的數據+20%的模型=更好的AI。

因此,在當前人工智能產(chǎn)業(yè)發(fā)展進(jìn)入場(chǎng)景應用的關(guān)鍵時(shí)期,對數據質(zhì)量提出了更高的要求。自成立起,標貝科技扎根AI數據服務(wù)領(lǐng)域,自研一站式數據采標平臺-數據工場(chǎng),全方位支持文本、語(yǔ)音、圖像、視頻等各類(lèi)型數據的處理,為企業(yè)客戶(hù)提供數據采集、標注等定制化數據解決方案,滿(mǎn)足不同行業(yè)、多類(lèi)型的場(chǎng)景化數據需求,持續提升數據產(chǎn)能和效率。
目前,標貝科技構建了大規模、多語(yǔ)種的AI語(yǔ)音數據庫,總時(shí)長(cháng)超過(guò)10萬(wàn)小時(shí)。其中,自有語(yǔ)音識別庫超過(guò)50余種,覆蓋智能硬件、智能客服、AI教育、有聲閱讀、車(chē)載交互等多個(gè)應用場(chǎng)景。

*以上數據庫列表僅為部分內容,如需完整數據庫請聯(lián)系我們
據了解,本次標貝科技推出的英語(yǔ)語(yǔ)音識別系統基于自有的兒童英文數據庫、美式英文朗讀與對話(huà)數據庫、英式英語(yǔ)數據庫、中國成人說(shuō)英文數據庫、中國青少年英文數據等近萬(wàn)小時(shí)的優(yōu)質(zhì)英語(yǔ)語(yǔ)音數據進(jìn)行模型訓練,在深度學(xué)習神經(jīng)網(wǎng)絡(luò )算法加持下,能夠保證系統可以快速的輸出高準確率的識別結果。
標貝科技數據業(yè)務(wù)相關(guān)負責人表示,數據標注行業(yè)的發(fā)展已經(jīng)越來(lái)越趨向于專(zhuān)業(yè)化,客戶(hù)需求已經(jīng)從早期較簡(jiǎn)單的、通用的數據過(guò)渡到更復雜的多語(yǔ)種、個(gè)性化的、場(chǎng)景化的數據,對于很多細分領(lǐng)域,需要大量真實(shí)的模型進(jìn)行標注去迭代優(yōu)化。而標貝科技基于自研的一體化采標平臺,采用人機協(xié)作的方式,推出場(chǎng)景化的英語(yǔ)語(yǔ)音識別能力,目的就是為了滿(mǎn)足不同的應用場(chǎng)景,讓用戶(hù)享受到更快速、更準確的英語(yǔ)語(yǔ)音識別服務(wù)。
立足業(yè)務(wù)場(chǎng)景 深挖A(yíng)I數據應用價(jià)值
多年行業(yè)深耕,標貝科技積累了豐富的行業(yè)經(jīng)驗和案例,連續兩年入選年度數據標注公司排行榜單TOP10,助力自動(dòng)駕駛、電商、智能客服、智能家居、社交娛樂(lè )、融媒體等領(lǐng)域頭部企業(yè)客戶(hù)智能語(yǔ)音交互業(yè)務(wù)上線(xiàn),并獲得眾多用戶(hù)的信賴(lài)與認可。
未來(lái),隨著(zhù)人工智能、5G、IOT等技術(shù)的成熟,作為聯(lián)動(dòng)各智能設備終端的關(guān)鍵通道,語(yǔ)音識別、語(yǔ)音合成等智能語(yǔ)音交互技術(shù)將得到更廣泛的落地應用。標貝科技將持續聚焦場(chǎng)景化的數據服務(wù),在技術(shù)創(chuàng )新和場(chǎng)景應用的雙輪驅動(dòng)之下,進(jìn)一步提升人機協(xié)同的準確率和效率,為AI產(chǎn)業(yè)發(fā)展提供更多種類(lèi)、更大規模、更高價(jià)值的數據服務(wù),助力人工智能產(chǎn)業(yè)生態(tài)鏈進(jìn)一步完善。
