標貝科技是36氪持續關(guān)注的一家AI公司,成立于2016年2月,最早做數據服務(wù),現已升級,主要做語(yǔ)音合成(TTS)整體解決方案及相關(guān)數據服務(wù):所推出的名為“聲音超市”的產(chǎn)品,可提供多音色的語(yǔ)音合成服務(wù);數據服務(wù)主要包括音庫制作、文本標注、評測系統、語(yǔ)音轉寫(xiě)、聲音采集標注等。
作為人機交互的重要領(lǐng)域,語(yǔ)音合成技術(shù)近兩年發(fā)展迅速。端對端合成技術(shù),以及神經(jīng)網(wǎng)絡(luò )聲碼器技術(shù)的研究成果,使得語(yǔ)音合成的效果大幅提升。語(yǔ)音合成技術(shù)的應用也成為這兩年智能語(yǔ)音交互領(lǐng)域的一個(gè)熱點(diǎn)。國外,去年,Google系的Lyerbird推出了一套“只需一分鐘的聲音樣本就能模仿任何人說(shuō)話(huà)”的系統;今年,微軟在其公有云平臺上推出了語(yǔ)音合成定制服務(wù)產(chǎn)品Custom Voice。國內,訊飛推出了“訊飛留聲”,只需要10段的聲音采集即可完成個(gè)人聲音的復刻。
標貝科技是國內語(yǔ)音合成領(lǐng)域以技術(shù)見(jiàn)長(cháng)的創(chuàng )業(yè)公司。當下其優(yōu)勢體現在語(yǔ)音合成效果更好,“個(gè)性化聲音”定制實(shí)現周期更短。這與團隊技術(shù)背景及數據積累有關(guān)。數據上,團隊此前做語(yǔ)音數據服務(wù),積累了大量的語(yǔ)料數據。同時(shí),研發(fā)了高效的數據標注工具,提高了數據標注的效率。技術(shù)上,CTO李秀林從事語(yǔ)音行業(yè)十余年,曾就職于百度,并帶領(lǐng)團隊獲得百萬(wàn)美元大獎。
產(chǎn)品方面,今年5月,標貝科技打造了“聲音超市”,為客戶(hù)提供一個(gè)可供選擇的、所聽(tīng)即所得的聲音平臺。主要按照API調用、SDK進(jìn)行收費。目前已為360、網(wǎng)易等提供數據及語(yǔ)音合成技術(shù)服務(wù)。
與語(yǔ)音識別、語(yǔ)義理解等智能語(yǔ)音交互的技術(shù)相比,語(yǔ)音合成技術(shù)被認為是有機會(huì )單獨存在而無(wú)需做全棧的一個(gè)方向。且隨著(zhù)技術(shù)的成熟,開(kāi)始在諸如語(yǔ)音交互、有聲讀物、新媒體、智能客服、泛娛樂(lè )領(lǐng)域開(kāi)始被應用。這也是當前標貝主要商業(yè)落地的領(lǐng)域。
CEO劉博介紹,目前在智能客服領(lǐng)域,標貝已與智齒等建立合作,進(jìn)入銀行和金融機構;在有聲讀物、新媒體等領(lǐng)域,標貝已與央視、出版社等達成合作;在語(yǔ)音交互領(lǐng)域,標貝的主要客戶(hù)為智能音箱客戶(hù);在泛娛樂(lè )領(lǐng)域,也與幾個(gè)明星工作室達成了合作;整體來(lái)看,目前智能客服領(lǐng)域的付費能力更好,預計明年新媒體、有聲讀物領(lǐng)域的付費能力會(huì )有所提升。
現階段,標貝科技的主要營(yíng)收還是來(lái)自于數據業(yè)務(wù),主要客戶(hù)包括了阿里、百度、騰訊、搜狗等。根據獵云網(wǎng)的數據,標貝科技已成功為客戶(hù)提供了總規模約1500小時(shí)的IP語(yǔ)音庫數據。
劉博認為,對標貝來(lái)說(shuō),當下技術(shù)與數據兩項業(yè)務(wù)都會(huì )是公司重點(diǎn)。數據方面,公司去年開(kāi)始已將部分資金投入到特色IP聲音數據的儲備;技術(shù)方面,公司目前的時(shí)間窗口還有半年左右,明年新的技術(shù)會(huì )突破。
當BAT等大廠(chǎng)開(kāi)始關(guān)注到語(yǔ)音合成技術(shù),語(yǔ)音合成的賽道未來(lái)競爭也很可能更為激烈。劉博認為,一方面,大公司往往需要做全棧技術(shù),技術(shù)上未必有創(chuàng )業(yè)公司專(zhuān)注,另一方面,標貝科技目前會(huì )從三方面提升競爭力,包括提升數據壁壘、廣泛布局聲音類(lèi)型IP、技術(shù)上尋求新突破。