嬰幼兒哭鬧怎么辦?寶寶啼哭不止是病了么?嬰幼兒啼哭要不要抱?……這些在搜索引擎、母嬰社區十分常見(jiàn)問(wèn)題背后,正是一個(gè)明顯的市場(chǎng)需求--父母希望有效發(fā)現嬰幼兒啼哭等聲音,并了解背后的含義,同時(shí)獲得相應的應對方法。不過(guò),現實(shí)當中,還很難有產(chǎn)品能夠自動(dòng)化的解決這問(wèn)題,嬰兒啼哭發(fā)現主要依賴(lài)于人工陪護,啼哭的解讀主要依賴(lài)于經(jīng)驗。
我們近期接觸的初創(chuàng )公司聲聯(lián)網(wǎng)(深圳聲聯(lián)網(wǎng)科技有限公司)則希望利用技術(shù)自動(dòng)解決上述難題,公司主要從事嬰幼童音視頻的行為分析和情感計算,目前已經(jīng)研發(fā)了基于人工智能技術(shù)的嬰幼兒音頻行為監護平臺(BabyABAM),通過(guò)芯片和云后臺,可以實(shí)現實(shí)時(shí)精確監測嬰幼兒發(fā)出的啼哭等聲音,并已經(jīng)與國內一些合作伙伴達成了合作及合作意向,有望在軟硬件終端產(chǎn)品中迅速落地這一技術(shù)。
嬰兒啼哭的監測與識別,在學(xué)術(shù)界早有研究。隨著(zhù)人工神經(jīng)網(wǎng)絡(luò )技術(shù)的出現,也使得準確率進(jìn)一步提升。近年來(lái),也有一些針對嬰兒啼哭的軟件開(kāi)始問(wèn)世,如西班牙的whycry等,此前也有一些攝像頭及音頻類(lèi)產(chǎn)品,主打嬰幼兒哭聲識別,但在識別的準確性及穩定性方面依然不高。
聲聯(lián)網(wǎng)分析,之所以出現這一現象,有幾方面的原因,一是因為以往的一些方案,主要通過(guò)識別環(huán)境音中的異常響聲,只要滿(mǎn)足一定分貝就識別,因此很可能會(huì )誤識;二是一般識別過(guò)程中會(huì )出現成人與嬰幼兒聲音的普遍混音現象,識別難度增加;三是目前市面上還缺少準確有效的嬰幼兒啼哭的高精度的數據。
為此,聲聯(lián)網(wǎng)自研了一套算法方案,增加了更多如音高、音強、音色等各種特征維度在內的分析維度,提升識別的準確性。精準標注的訓練數據是提升識別準確率的一個(gè)重要因素。團隊表示,公司用來(lái)訓練的嬰兒音頻數據超過(guò)了1000GB,上萬(wàn)小時(shí)的錄音文檔;采用了統計建模和神經(jīng)網(wǎng)絡(luò )建模的算法,目前的錯誤率可以低至5%以?xún)龋菄鴥瓤闪慨a(chǎn)方案中最低的。
之所以能做到這一點(diǎn),是因為聲聯(lián)網(wǎng)已經(jīng)組建了包括技術(shù)、戰略和育嬰方面的頂級專(zhuān)家顧問(wèn)團隊。公司成立后,獲得了中科院聲學(xué)所、東南大學(xué)、北京理工大學(xué)語(yǔ)音實(shí)驗室的大力支持,協(xié)助組建起了技術(shù)研發(fā)團隊。首席科學(xué)家顏永紅是中科院聲學(xué)所研究員、博士生導師、語(yǔ)言聲學(xué)與內容理解重點(diǎn)實(shí)驗室主任,美國俄勒岡OGI研究院終身教授,2002年入選中科院百人計劃,Intel中國研究中心首任主任。首席戰略顧問(wèn)倪光南是全國政協(xié)委員、中國工程院院士,聯(lián)想集團創(chuàng )始人、首任總工程師,國家科技重大專(zhuān)項“核高基”相關(guān)項目主要負責人。團隊人工智能顧問(wèn)Bj?rnW。Schuller是德國慕尼黑工業(yè)大學(xué)博士,研究領(lǐng)域集中在機器學(xué)習、復雜系統、視聽(tīng)信號處理、人機交互、情感計算等,著(zhù)有6本專(zhuān)著(zhù),在相關(guān)國際期刊和會(huì )議中發(fā)表過(guò)500余篇文章,被引用10000余次,被世界經(jīng)濟論壇評為40歲以下40位最杰出科學(xué)家之一。母嬰領(lǐng)域顧問(wèn)郭建國則是中華育嬰協(xié)會(huì )會(huì )長(cháng),國內久負盛名的實(shí)戰派育嬰專(zhuān)家,人力資源與社會(huì )保障部“育嬰師職業(yè)”專(zhuān)家委員會(huì )專(zhuān)家,中國兒童基金會(huì )教育專(zhuān)家委員會(huì )專(zhuān)家,《育嬰師職業(yè)師資培訓教材》主編。

目前,聲聯(lián)網(wǎng)的這一技術(shù),主要通過(guò)SDK軟件包或AVS7516音頻識別芯片的方式提供,兩款產(chǎn)品都已經(jīng)更新至2.0版本,可以對寶寶哭、笑、噴嚏、咳嗽、飽嗝等監測和分析,可適用于智能攝像頭、機器人、小夜燈、智能音箱、智能搖籃、智能玩具等產(chǎn)品。產(chǎn)品推廣方面,團隊表示,SDK和芯片樣品已經(jīng)送至多家知名智能硬件制造商、母嬰用品商、機器人公司進(jìn)行測試,目前進(jìn)展順利。
縱觀(guān)國內智能語(yǔ)音市場(chǎng),除了汽車(chē)外,暫時(shí)還沒(méi)有清晰可見(jiàn)的能有大盈利的市場(chǎng)。聲聯(lián)網(wǎng)分析嬰幼兒市場(chǎng)很可能就是其中的一個(gè)。國內每年新生兒數量即將超過(guò)1800萬(wàn),全球的數量則達到1.4億,用戶(hù)的數量基礎龐大。另外,嬰兒父母對于嬰兒用品的態(tài)度是很積極的,購買(mǎi)意愿及付費能力比較強,因此公司對這一市場(chǎng)相對樂(lè )觀(guān)。
市場(chǎng)前景樂(lè )觀(guān)的領(lǐng)域,競爭往往難以避免,這方面聲聯(lián)網(wǎng)的團隊具有一定的先發(fā)資源優(yōu)勢。聲聯(lián)網(wǎng)科技是由國內智能語(yǔ)音合成技術(shù)公司北京宇音天下科技有限公司、國內最大的可穿戴方案企業(yè)深圳金康特、新三板上市傳感器芯片公司深圳貝特萊三家公司共同籌資注冊成立,并獲得了中科院聲學(xué)所的投資入股。金康特和貝特萊兩家股東方可以提供芯片、方案、客戶(hù)、量產(chǎn)等多方面的幫助。
團隊預計,最近幾年的工作重心都會(huì )圍繞嬰幼兒語(yǔ)音做研究,目前已經(jīng)實(shí)現了嬰兒啼哭聲的探測和捕捉,下一步會(huì )做持續的大數據分析,從而進(jìn)行背后意義的解讀,即嬰幼兒情感、心理和健康趨勢的解讀。
目前聲聯(lián)網(wǎng)科技已經(jīng)組建了25人的團隊。總經(jīng)理何宇新是中科院計算所博士,前北京漢王公司副總裁,語(yǔ)音合成企業(yè)宇音天下創(chuàng )始人。副總經(jīng)理肖溪是荷蘭鹿特丹大學(xué)碩士,前盈信投資集團助理總裁、前遠古控股集團總經(jīng)理助理,是精鉆傳媒、遠航縱橫前聯(lián)合創(chuàng )始人。
此前聲聯(lián)網(wǎng)科技已經(jīng)獲得來(lái)自深圳市高新投集團旗下深圳市人才創(chuàng )新創(chuàng )業(yè)二號股權基金的天使輪融資。