編者按:本文作者 Vishal Krishna,原文標題:Indian Languages need a voice online. Here's how homegrown startups are giving them one.
在13億印度人中,真正會(huì )說(shuō)英語(yǔ)的人不到1億,不管你參考的是哪份報告。
印度的大多數網(wǎng)站和應用還必須使用英語(yǔ)操作,但現在變化正在發(fā)生——所有的數字和在線(xiàn)產(chǎn)品/服務(wù)都在向印度本地的語(yǔ)言過(guò)渡。這種變化吸引了新的用戶(hù),但是本土語(yǔ)言的使用還面臨一個(gè)重要挑戰。
這個(gè)挑戰就是語(yǔ)音。

圖片來(lái)源:YourStory
不僅是印度,全世界的初創(chuàng )公司和開(kāi)發(fā)人員都在大力投資語(yǔ)音技術(shù)。語(yǔ)音技術(shù)省掉了用戶(hù)打字的麻煩,能打開(kāi)全新的用戶(hù)市場(chǎng)——包括那些還不懂ABC的小孩子,以及不太會(huì )用手機鍵盤(pán)的老年人等等。
搜索巨頭Google目前支持9種印度語(yǔ)言,而Amazon也在構建基于語(yǔ)音技術(shù)的各種功能。
而印度需要的不僅僅是語(yǔ)言支持和語(yǔ)音技術(shù)。像人們常說(shuō)的“內容為王”,對一種語(yǔ)言進(jìn)行精確識別需要足夠的數據來(lái)訓練,而印度有多達17種官方語(yǔ)言(編者校:印度憲法認定的官方語(yǔ)言有22種)和數百種被認可的方言。如果想打動(dòng)印度的消費者,對這些不同語(yǔ)言的語(yǔ)音識別是必經(jīng)之路,盡管這并不容易。
為了彌合這一缺口,幾家初創(chuàng )公司正在幫印度人打造使用本地語(yǔ)言的搜索工具,畢竟每個(gè)人都希望為自己的問(wèn)題搜索到明確的答案。這項工作的難點(diǎn)是:印度缺少使用本地語(yǔ)言的內容,或者說(shuō)數據。
班加羅爾的Vokal就是這樣一家公司。Vokal由Aprameya Radhakrishna和Mayank Bidawatka創(chuàng )立。用戶(hù)可以在該平臺上使用印度本土語(yǔ)言提問(wèn),然后會(huì )有其他用戶(hù)用同樣的語(yǔ)言做出解答。簡(jiǎn)言之,Vokal就好比印度版的Quora,不過(guò)Quora是純文字問(wèn)答平臺,而Vokal則是純語(yǔ)音問(wèn)答。
“語(yǔ)音是未來(lái)。印度的農村居民會(huì )更喜歡用語(yǔ)音搜索來(lái)尋找感興趣的內容。目前,如果你不會(huì )英語(yǔ),你就很難在各大平臺上搜索和獲取信息。”Aprameya說(shuō)。他補充說(shuō),Vokal花費了大量時(shí)間來(lái)訓練機器學(xué)習算法,使其能理解各種提問(wèn)并顯示相關(guān)回答。
推薦閱讀:報告:在亞太地區,中國人不如印度人愛(ài)用語(yǔ)音助手
YourStory嘗試了Vokal的埃納德語(yǔ)和泰盧固語(yǔ)語(yǔ)音搜索,用它查找了烹飪、農作、旅行和健康生活指導等方面的內容。和任何初創(chuàng )公司一樣,Vokal還需要一些時(shí)間才能獲得足夠的用戶(hù)和用戶(hù)使用數據,進(jìn)而優(yōu)化其AI搜索引擎,達到99%的準確率,但它已經(jīng)走出了第一步。投資者顯然也是這么看的,Vokal成立才不到一年半,就已經(jīng)從Kalaari Capital、Accel Partners、順為資本和Blume Venture等投資機構獲得了大約700萬(wàn)美元的融資。
除Vokal外,一些其他的創(chuàng )業(yè)公司也在開(kāi)發(fā)基于語(yǔ)音的技術(shù)。Reverie Techonologies幾年前就成功推出了用于手機的印地語(yǔ)輸入法,這種本地化的輸入法廣受歡迎。最近該公司被Reliance Industries以19億盧比(約2772萬(wàn)美元)高價(jià)收購。收購背后的原因正是Reverie正在開(kāi)發(fā)的、支持本地語(yǔ)言的語(yǔ)音銀行服務(wù)工具。
Reverie開(kāi)發(fā)的所有產(chǎn)品和功能的使用場(chǎng)景都是基于具體設備的(包括手機、平板、機頂盒、以及游戲和App的開(kāi)發(fā)工具)。另外,Reverie還與高通、沃達豐和三星等公司合作,幫助它們提高旗下電子設備處理語(yǔ)言的能力。
印度有許多初創(chuàng )公司都在對語(yǔ)音技術(shù)進(jìn)行探索,但其功能各有不同。比如Gnani。AI,這家公司一直專(zhuān)注于B2B業(yè)務(wù),但現在它正計劃為農戶(hù)推出B2C服務(wù),讓他們能夠用本地語(yǔ)言咨詢(xún)有關(guān)農作物的問(wèn)題。
更有意思的是,Gnani.AI還在嘗試用手機進(jìn)行語(yǔ)音翻譯和信息讀取。也就是說(shuō)用戶(hù)可以將一段語(yǔ)音消息轉換為文字,然后將其分享給WhatsApp上的好友。假如有一名用戶(hù)會(huì )說(shuō)埃納德語(yǔ),但卻不會(huì )寫(xiě),那他/她只要對著(zhù)Gnani的平臺講話(huà),就能將語(yǔ)音轉換為埃納德語(yǔ)文字。
除了官方語(yǔ)言,Gnani平臺也可以將方言轉換為文字內容。目前,Gnani的主要使用語(yǔ)言是埃納德語(yǔ),但未來(lái)肯定會(huì )擴充更多語(yǔ)言。
“我們還在對產(chǎn)品進(jìn)行測試,完善算法,以求輸出最準確的(翻譯)結果。”Gnani。AI的聯(lián)合創(chuàng )始人Ganesh Gopalan表示。
重量級企業(yè)玩家中,想要占據語(yǔ)音和地方語(yǔ)言市場(chǎng)的也不止收購了Reverie的RelianceIndustries一家。去年,Flipkart收購了Liv.AI,Flipkart的首席執行官Kalyan Krishnamurthy表示,Liv。AI可以使用支持當地語(yǔ)言的語(yǔ)音技術(shù)來(lái)完成交易、進(jìn)行付款、提供客戶(hù)服務(wù)以及與賣(mài)家互動(dòng)。Liv.ai由Subodh Kumar、Sanjeev Kumar和Kishore Mundra三人聯(lián)合創(chuàng )辦,該公司將來(lái)會(huì )幫助Flipkart以本地語(yǔ)言與顧客交流,不管是通過(guò)語(yǔ)音還是文字。
Vernacular。ai則代表了語(yǔ)音應用的另一種可能。Vernacular想建立一個(gè)可以應對印度不同語(yǔ)言的自動(dòng)化呼叫中心。目前它可以自動(dòng)化對幾家賓館和餐廳的預約,客人只需說(shuō)出自己的需求就可進(jìn)行預約,而不用在線(xiàn)上等著(zhù)和客服交流。
根據一篇《語(yǔ)音識別市場(chǎng)》的報告,語(yǔ)音技術(shù)市場(chǎng)預計將從2018年的75億美元增長(cháng)到2024年的215億美元,復合年增長(cháng)率為19.18%。對語(yǔ)音識別市場(chǎng)強勁增長(cháng)的預期有很多原因,包括其在醫療保健類(lèi)應用方面的潛力、手機銀行類(lèi)應用中不斷增長(cháng)的對語(yǔ)音認證需求、多功能設備和智能音箱的快速普及,以及在A(yíng)I幫助下不斷提高的語(yǔ)音識別的準確性。
該報告補充說(shuō),微觀(guān)語(yǔ)言學(xué)、教育和自動(dòng)駕駛等領(lǐng)域都可能為語(yǔ)音識別公司創(chuàng )造巨大的增長(cháng)機會(huì )。
在印度,隨著(zhù)使用移動(dòng)流量的用戶(hù)指數級增長(cháng),本地語(yǔ)言的使用需求會(huì )越來(lái)越大,有太多的場(chǎng)景會(huì )需要用到本地語(yǔ)言。現在行業(yè)內的所有的努力——不僅包括Google和Amazon等巨頭的努力,也包括本地初創(chuàng )公司的努力——都是未來(lái)市場(chǎng)所必需的。希望很快印度人能夠以本地語(yǔ)言搜索信息并獲得本地化的答案。