
登錄靈云開(kāi)發(fā)者社區,開(kāi)發(fā)者即可下載包括語(yǔ)音識別、語(yǔ)音合成、語(yǔ)音喚醒、語(yǔ)義理解、文字識別、人臉識別、手寫(xiě)識別、機器翻譯、聲紋識別、鍵盤(pán)輸入在內的十多項人工智能技術(shù)SDK,支持Windows/Android/Linux/IOS等各種主流操作系統,能方便的集成到各種應用與客戶(hù)業(yè)務(wù)系統中。除此之外,在社區內還有麥克風(fēng)陣列、靈云種子等聚合性SDK以方便開(kāi)發(fā)者快速實(shí)現近遠場(chǎng)語(yǔ)音交互。
網(wǎng)址:https://www.aicloud.com/dev/index/index

語(yǔ)音合成SDK
作為國內最早從事語(yǔ)音技術(shù)研究與應用的企業(yè),捷通華聲為廣大開(kāi)發(fā)者提供的靈云語(yǔ)音合成SDK可將文本實(shí)時(shí)準確地轉換為自然、流暢的語(yǔ)音,并提供男聲、女聲、童聲等多種合成音色,支持中文普通話(huà)、粵語(yǔ)、維語(yǔ)、英語(yǔ)、日語(yǔ)等21種語(yǔ)言,并可為用戶(hù)提供定制化的語(yǔ)音合成服務(wù)。
語(yǔ)音合成SDK可以根據當前網(wǎng)絡(luò )狀況及指令的類(lèi)型,自動(dòng)判斷使用本地引擎還是云端引擎進(jìn)行語(yǔ)音合成。此次版本的升級優(yōu)化了優(yōu)化TTS Player,提升云端訪(fǎng)問(wèn)速度。

語(yǔ)音識別SDK
采用行業(yè)領(lǐng)先的深度學(xué)習算法,捷通華聲為開(kāi)發(fā)者提供行業(yè)領(lǐng)先的語(yǔ)音識別SDK,普通話(huà)識別準確率高達96%,并采用實(shí)時(shí)識別方式,實(shí)時(shí)率可達0.3以下,已支持普通話(huà)、英語(yǔ)、粵語(yǔ)、維吾爾語(yǔ)、客家話(huà)等多種語(yǔ)言,具備很強的口音普適性,并可自由定制垂直領(lǐng)域的語(yǔ)音識別模型,識別效果更精確。
此次版本更新,SDK增加了本地語(yǔ)音意圖理解、云端本地雙路識別功能,優(yōu)化ASR Recorder,提升云端訪(fǎng)問(wèn)速度。
語(yǔ)音喚醒SDK
靈云語(yǔ)音喚醒SDK采用先進(jìn)的芯片,ROM小于40K,低功率持續偵聽(tīng),用戶(hù)使用無(wú)感知,無(wú)需網(wǎng)絡(luò ),實(shí)時(shí)離線(xiàn)喚醒,喚醒率大于95%,且誤喚醒率低于小于1次/24小時(shí),并支持自定義設置多個(gè)喚醒詞,滿(mǎn)足用戶(hù)個(gè)性化需求。

語(yǔ)義理解SDK
為開(kāi)發(fā)者提供的語(yǔ)義理解SDK可實(shí)現意圖理解與智能問(wèn)答兩類(lèi)核心功能,支持上下文語(yǔ)義分析、多輪對話(huà)、實(shí)體屬性等,支持天氣、導航、航班、音樂(lè )、閑聊等20多個(gè)常見(jiàn)領(lǐng)域,且支持HTTP、Socket、WebService以及MRCP等多種接口,滿(mǎn)足不同需求。
聲紋識別SDK
靈云聲紋識別技術(shù)采用端點(diǎn)檢測和噪聲消除技術(shù),克服環(huán)境噪音對的影響,識別準確率高達99%,能夠在多人對話(huà)場(chǎng)景中分離出單個(gè)說(shuō)話(huà)人音頻,并識別出每個(gè)人的說(shuō)話(huà)內容,并提供聲紋自由說(shuō)、動(dòng)態(tài)數字、開(kāi)放文本、固定文本密碼等多種識別模式。

人臉識別SDK
靈云人臉識別技術(shù),采用最新深度學(xué)習算法,并引入國際領(lǐng)先的多模型融合技術(shù),具備“一對一確認”與“多選一辨別”功能,可對人臉五官定位并對性別、表情、年齡、膚色、姿態(tài)等人臉屬性進(jìn)行分析,并提供關(guān)鍵點(diǎn)定位、活體檢測等能力。
光學(xué)字符識別SDK
捷通華聲與清華大學(xué)合力攻關(guān),應用最新機器學(xué)習算法,光學(xué)字符識別技術(shù)國際領(lǐng)先,識別率高達99.99%,讓機器不再只能識別“清晰、端正的文字”,還能識別“傾斜、相對模糊的文字”,并且支持更多的字體。支持文檔識別、票據識別、證照識別、銀行卡識別、名片識別等多種應用領(lǐng)域。
手寫(xiě)識別SDK
靈云手寫(xiě)識別技術(shù)采用最新深度學(xué)習算法,正楷、連筆字、無(wú)筆順識別率均在98%以上,且可支持中文、英文、維吾爾文、日文、韓文等多種語(yǔ)言、50多種筆勢識別,還擁有傾斜校正、簡(jiǎn)繁體自動(dòng)判斷、拼音獲取等強大功能,同時(shí)提供鋼筆、鉛筆、毛筆等多種筆形,將輸寫(xiě)體驗融入藝術(shù)與傳統文化。

機器翻譯SDK
靈云機器翻譯技術(shù)采用國際先進(jìn)的翻譯技術(shù)及深度學(xué)習算法,可生成流暢的譯文,翻譯結果地道流暢,忠實(shí)表達原文內容,滿(mǎn)足高質(zhì)量的翻譯要求,該版本SDK支持中英、中維等多種語(yǔ)言互譯,具有翻譯準確率高、翻譯快速等優(yōu)點(diǎn)。
鍵盤(pán)輸入SDK
靈云開(kāi)放平臺為廣大開(kāi)發(fā)者提供鍵盤(pán)輸入SDK,支持中文,外文,韓文,日文等識別,同時(shí)支持多種鍵盤(pán)(T9,Qwerty以及容錯鍵盤(pán))以及多種輸入模式(拼音,五筆,筆畫(huà)等)。
全方位AI技術(shù)助力智能場(chǎng)景應用落地
十多年的行業(yè)積累,捷通華聲靈云全方位人工智能技術(shù)已在各行各業(yè)得到廣泛應用實(shí)踐,靈云SDK在移動(dòng)應用、智能客服、智能家電、智能音箱、智能車(chē)載、機器人等應用領(lǐng)域大顯神通:可為移動(dòng)應用提供智能語(yǔ)音、圖像、手寫(xiě)、生物特征識別等智能技術(shù)集成手段,可利用語(yǔ)音識別SDK、語(yǔ)音合成SDK、麥克風(fēng)陣列SDK等讓電視、空調等實(shí)現自然遠場(chǎng)語(yǔ)言交互,可通過(guò)SDK結合打造可語(yǔ)音、手寫(xiě)的智能車(chē)載輸入法,讓車(chē)載設備擁有遠場(chǎng)語(yǔ)音識別能力,可真正實(shí)現讓機器人“能說(shuō)會(huì )聽(tīng)、能寫(xiě)會(huì )看、能辨音會(huì )認人、能思考會(huì )判斷”。
未來(lái),捷通華聲將通過(guò)靈云全方位人工智能開(kāi)放平臺,為廣大企業(yè)及個(gè)人開(kāi)發(fā)者提供更多更加智能的人工智能能力SDK,助力企業(yè)智能化產(chǎn)品、設備的快速落地,從而實(shí)現“讓每個(gè)企業(yè)都擁有人工智能,讓每個(gè)人都能享受到人工智能的輕松與便捷”。