常有人戲稱(chēng)廣東人是羊,因為他們無(wú)論講什么,似乎都會(huì )用"咩--咩--咩--"作句尾語(yǔ)氣詞:
"有咩搞作?"(有什么做法、計劃?)
"系度做緊咩呀"(現在在做什么呢?)
"系咩?"(是嗎?)
這些地道的粵語(yǔ)仿佛自帶音效,你即使不精通粵語(yǔ),看到這幾句話(huà)都能像模像樣地說(shuō)出來(lái)。粵語(yǔ)就像一種流傳千年的文化符號,一旦你深入了解粵語(yǔ),必會(huì )佩服它的古樸有趣、博大精深,承載了廣府文化強烈的情感認同。
粵語(yǔ),又稱(chēng)廣東話(huà),是中國漢語(yǔ)七大方言之一,全球將近有1.2億人口使用,在國際影響力和語(yǔ)言的韻味方面,粵語(yǔ)的地位絕對是重量級的老大。
隨著(zhù)AI的飛速發(fā)展,應用場(chǎng)景不斷擴展,智能語(yǔ)音設備無(wú)處不在,對于多語(yǔ)種多口音語(yǔ)音識別的需求也在日漸增加。其中,作為擁有強大號召力的粵語(yǔ),已成為眾多人工智能廠(chǎng)商關(guān)注的重點(diǎn)。
雖然粵語(yǔ)語(yǔ)音識別需求越來(lái)越多,但想要實(shí)現精準的粵語(yǔ)識別效果,面臨的技術(shù)難度也不小。

粵語(yǔ)有多難?
由于承接著(zhù)古漢語(yǔ)的許多特點(diǎn),粵語(yǔ)在詞匯、語(yǔ)法、發(fā)音上都和普通話(huà)有明顯區別。
詞匯上,粵語(yǔ)的日常用語(yǔ)富有特色。雖是口語(yǔ),卻比較"文縐縐":"喜歡"叫做"鐘意","厲害"叫做"犀利","討厭"是"乞人憎",勞駕他人、感謝幫忙,要說(shuō)"唔該"。粵語(yǔ)的發(fā)音就更難了。由于保留了古漢語(yǔ)、古南越語(yǔ)的特色,以及受外語(yǔ)的影響,相對于普通話(huà)的四聲調,粵語(yǔ)擁有完整的九韻六調,能夠組合出的總音節數比普通話(huà)還要多。
標貝科技粵語(yǔ)語(yǔ)音識別
對于A(yíng)I語(yǔ)音產(chǎn)品來(lái)說(shuō),想要提高語(yǔ)音識別的準確性,就需要大量的優(yōu)質(zhì)語(yǔ)音數據作為模型訓練支撐。面對以上問(wèn)題及粵語(yǔ)語(yǔ)音識別發(fā)展現狀,標貝科技此前已經(jīng)推出一系列粵語(yǔ)語(yǔ)音識別數據集,幫助對識別模型進(jìn)行優(yōu)化訓練。
近日,標貝科技在融合更多語(yǔ)音和文本的數據采集,以及高精度的數據標注基礎上,定制專(zhuān)用語(yǔ)音識別模型,推出高準確率的粵語(yǔ)語(yǔ)音識別服務(wù)。
在聲學(xué)模型方面,通過(guò)采集大量真實(shí)的粵語(yǔ)錄音數據,包括朗讀式、自由交談和命令詞等類(lèi)型,對粵語(yǔ)的發(fā)音習慣、聲調變化等,進(jìn)行學(xué)習訓練,提高模型精度和識別率。
語(yǔ)言模型方面,標貝科技語(yǔ)音識別技術(shù)通過(guò)對粵語(yǔ)方言中的特有詞匯,如"咁"、"哋"、"嘅"、"咩呀"、"點(diǎn)睇"等進(jìn)行專(zhuān)門(mén)訓練,有效提升了語(yǔ)音識別引擎對口音、詞匯的適配能力。
立足應用場(chǎng)景 助力人機交互更便捷
在移動(dòng)互聯(lián)網(wǎng)和信息大爆炸時(shí)代,無(wú)論是從語(yǔ)言角度還是文化角度,我們都不再離群索居,包括人與人的交流、人與機器的交流,多語(yǔ)種和方言的交匯互通已經(jīng)無(wú)處不在。因而,智能語(yǔ)音識別技術(shù)成為解決"聽(tīng)不懂"的有效途徑。
伴隨此次粵語(yǔ)語(yǔ)音識別能力的上線(xiàn),當前標貝科技可以支持中文、英文、粵語(yǔ)三種語(yǔ)言的語(yǔ)音識別,可以廣泛應用于工作、生活、學(xué)習多種場(chǎng)景。
在商務(wù)會(huì )談中,無(wú)論發(fā)言人說(shuō)的是英文、普通話(huà)還是粵語(yǔ),標貝科技語(yǔ)音識別都能對這些發(fā)言分角色進(jìn)行識別,將會(huì )議和訪(fǎng)談的音頻快速生成會(huì )議記錄,后期信息檢索和整理更方便快捷。
在智能客服領(lǐng)域,客服機器人掌握多個(gè)語(yǔ)種,能提高普通話(huà)、英文、方言識別的準確率,從而精準識別出用戶(hù)提出的問(wèn)題,給予用戶(hù)最合適的回答,成為真正"聽(tīng)得懂,說(shuō)得出"的智能客服,提升服務(wù)質(zhì)量。
智能家居場(chǎng)景下,精準高效的語(yǔ)音識別讓用戶(hù)不必再擔心因為口音問(wèn)題出現的錯輸、漏輸問(wèn)題,隨心所欲對各類(lèi)家居、家電語(yǔ)音助手,以及智能機器人、智能可穿戴設備等進(jìn)行語(yǔ)音控制。
同時(shí),面向金融、電商、教育、媒體娛樂(lè )等行業(yè),我們也推出行業(yè)領(lǐng)先的語(yǔ)音合成方案,擁有豐富的語(yǔ)音合成音庫,覆蓋中文、英文、中英混讀、小語(yǔ)種、方言等不同語(yǔ)種。客戶(hù)可快速選擇合適的音色,也可以根據業(yè)務(wù)場(chǎng)景需求,定制與產(chǎn)品形象相匹配的合成聲音,助力語(yǔ)音產(chǎn)品快速落地應用。
未來(lái),隨著(zhù)語(yǔ)音交互技術(shù)與智能手機、平板電腦、智能家居等電子設備芯片集成的深入發(fā)展,將帶動(dòng)智能語(yǔ)音產(chǎn)業(yè)迎來(lái)更加廣闊的發(fā)展空間。標貝科技將繼續加碼研發(fā)投入,加速在垂直行業(yè)進(jìn)行滲透和布局,驅動(dòng)語(yǔ)音合成、語(yǔ)音識別技術(shù)繼續升級迭代,為消費者創(chuàng )造更優(yōu)質(zhì)的交互體驗。