記者日前獲悉,由中關(guān)村科技企業(yè)推出的全球首個(gè)全方位智能人機交互云平臺“靈云”,本月起向普通開(kāi)發(fā)者開(kāi)放注冊。對普通開(kāi)發(fā)者來(lái)說(shuō),看似高深莫測的語(yǔ)音識別、手寫(xiě)識別等技術(shù)能力,今后不僅能像水電一樣按需購買(mǎi),還能在軟件開(kāi)發(fā)、調試階段免費享用。
“我兩年前有個(gè)不錯的移動(dòng)互聯(lián)網(wǎng)應用創(chuàng )意,可是需要用到語(yǔ)音識別技術(shù),自己又一點(diǎn)也不懂,只能白白放棄了。”技術(shù)愛(ài)好者劉晨有些無(wú)奈。其實(shí),劉晨如果早點(diǎn)知道并不是所有具備語(yǔ)音識別功能的APP,都需要由開(kāi)發(fā)者自己動(dòng)手研發(fā),或許就能創(chuàng )造出一個(gè)熱門(mén)應用了。
在一款名為“靈云”的云平臺上,能將平面文字轉換成逼真人聲的“語(yǔ)音合成能力”,讓機器“聽(tīng)懂”人們說(shuō)話(huà)的“語(yǔ)音識別能力”,從掃描儀、照相機捕捉到的照片上“讀”出文字的“光學(xué)字符識別能力”等,這些能力都可以像超市中的商品一樣買(mǎi)得到。開(kāi)發(fā)者只需要從平臺獲得一個(gè)具有相應能力的開(kāi)發(fā)包,載入自己的軟件工程中,就能實(shí)現這些神奇的功能了。
“不同能力每使用一次,消耗1到5個(gè)點(diǎn)數。”“靈云”平臺的開(kāi)發(fā)企業(yè)北京捷通華聲語(yǔ)音技術(shù)有限公司相關(guān)負責人于凡所說(shuō)的“點(diǎn)數”,是指開(kāi)發(fā)者某個(gè)應用調用一次識別能力所需要的虛擬貨幣——“云端使用點(diǎn)數”。8月開(kāi)始開(kāi)放的“靈云”平臺,開(kāi)發(fā)者注冊后將免費獲贈數千點(diǎn)“云端使用點(diǎn)數”。
2011年,捷通華聲推出了全球第一個(gè)全方位智能人機交互感知云——“靈云”。與以往開(kāi)發(fā)者只能通過(guò)銷(xiāo)售渠道接觸該平臺不同,從本月開(kāi)始,開(kāi)發(fā)者只要免費注冊一個(gè)“靈云”平臺用戶(hù),就能免費使用平臺上的智能人機交互資源。
“智能人機交互”,搭載在“云平臺”上能有什么好處呢?
“舉個(gè)形象的例子,利用‘云端’能力就好像每個(gè)月根據需要買(mǎi)水、買(mǎi)電;而傳統的‘終端’實(shí)現方式,就好比一次性買(mǎi)了個(gè)大發(fā)電機、大水窖在家,好用是好用,但存儲空間、耗費資源程度都很大。”于凡說(shuō)。
其實(shí),讓機器實(shí)現語(yǔ)音識別跟教小孩子說(shuō)話(huà)是一個(gè)道理,都需要讓機器對語(yǔ)音語(yǔ)料進(jìn)行長(cháng)時(shí)間的訓練,讓機器像小孩子一樣“學(xué)習”語(yǔ)言,然后再進(jìn)行識別。這個(gè)學(xué)習的過(guò)程,少則兩三千個(gè)小時(shí),多則上萬(wàn)個(gè)小時(shí),而學(xué)習的“范圍”則是以TB級計算的原始文本語(yǔ)料。這對于普通的開(kāi)發(fā)者來(lái)說(shuō),無(wú)疑是一筆難以承擔的巨額成本。
“類(lèi)似中國‘Siri’或安卓‘Siri’的計劃不太適合國內創(chuàng )業(yè)公司,因為投入大、風(fēng)險高、技術(shù)難以實(shí)現。”創(chuàng )新工場(chǎng)董事長(cháng)兼CEO李開(kāi)復評價(jià)。而有了這樣一個(gè)隨時(shí)可按需購買(mǎi)的云平臺,李開(kāi)復的擔心將不再是問(wèn)題。即使“手無(wú)寸鐵”,開(kāi)發(fā)者也能借力“云端”,發(fā)揮自己的技術(shù)創(chuàng )新能力,做出可以實(shí)現智能人機交互的產(chǎn)品。