崗位職責:
1.自然語(yǔ)言處理及語(yǔ)義理解等相關(guān)技術(shù)研發(fā);
2.多語(yǔ)種文本處理技術(shù)研發(fā);
任職要求:
1.NLP、機器學(xué)習、計算機等相關(guān)專(zhuān)業(yè);
2.精通NLP領(lǐng)域的相關(guān)技術(shù),對數據結構和算法設計有深刻的理解;
3.熟練掌握C/C++和腳本語(yǔ)言編程(如Shell,Python或Perl等);
4.優(yōu)秀的分析問(wèn)題和解決問(wèn)題能力,對解決具有挑戰性的問(wèn)題充滿(mǎn)激情;
5.具有良好的溝通能力和團隊合作精神;
二、C++研發(fā)工程師
崗位職責:
1.負責公司核心系統代碼開(kāi)發(fā),參與語(yǔ)音合成引擎總體設計與編碼,解決工程架構及算法邏輯的通用問(wèn)題,推動(dòng)系統迭代。
2.負責項目開(kāi)發(fā)過(guò)程中的問(wèn)題分析和總結,提供建議和幫助改善研發(fā)流程。
3.和數據/測試/架構同學(xué)進(jìn)行密切溝通,能夠根據需求提出合理技術(shù)方案;
任職要求:
1.有扎實(shí)的C/C++語(yǔ)言基礎,熟練使用C/C++;加分項熟悉Python。
2.精通算法設計/數據結構,有系統分析和設計的項目經(jīng)驗,有多線(xiàn)程高并發(fā)開(kāi)發(fā)經(jīng)驗。
3.熟悉Linux,熟悉操作系統原理,熟悉代碼管理工具git。
4.有較強的分析和解決問(wèn)題的能力,強烈責任感、縝密的邏輯思維能力。
5.善于用數據說(shuō)話(huà),具備良好的項目管理及執行能力。
加分項:有語(yǔ)音合成相關(guān)背景
三、高級語(yǔ)音研發(fā)工程師
崗位職責:
1.語(yǔ)音合成/識別系統的設計研發(fā),包括模型訓練、聲碼器(合成)或者解碼器(識別)等;
2.多語(yǔ)種、多說(shuō)話(huà)人的高性能合成/識別系統的設計和研發(fā);
任職要求:
1.機器學(xué)習、模式識別、計算機、信號處理等相關(guān)專(zhuān)業(yè);
2.精通神經(jīng)網(wǎng)絡(luò )建模、模型訓練和優(yōu)化;
3.對數據結構和算法設計有深刻的理解;
4.精通C/C++編程和python等腳本語(yǔ)言,熟悉Linux平臺;
5.優(yōu)秀的分析問(wèn)題和解決問(wèn)題能力,對解決具有挑戰性問(wèn)題充滿(mǎn)激情;
6.具有良好的溝通能力和團隊合作精神;
四、資深高性能計算工程師
崗位職責:
1.負責深度學(xué)習算法的加速與產(chǎn)品落地;
2.與算法研究人員協(xié)同,進(jìn)行深度學(xué)習網(wǎng)絡(luò )的選擇與優(yōu)化,;
任職要求:
1. 計算機基礎扎實(shí),精通C/C++,熟悉常用的算法、數據結構;
五、數據工程師
崗位職責:
1.負責爬蟲(chóng)系統的架構設計與開(kāi)發(fā)、維護;
2.負責網(wǎng)絡(luò )數據抓取,并進(jìn)行結構化存儲;
3.負責文本、音頻等數據的處理、目標數據篩選,配合數據平臺技術(shù)研發(fā);
任職要求:
1.計算機、信號處理相關(guān)專(zhuān)業(yè),本科及以上學(xué)歷;
2.一年以上實(shí)際爬蟲(chóng)經(jīng)驗,熟練掌握一種開(kāi)源爬蟲(chóng)框架;
3.精通Python,有良好的編碼習慣;
4.有良好的學(xué)習能力,責任感強,具有良好的團隊合作精神。
簡(jiǎn)歷投遞至:hr001@data-baker.com
標貝科技簡(jiǎn)介
標貝(北京)科技有限公司(簡(jiǎn)稱(chēng)“標貝科技”)是國內領(lǐng)先的人工智能語(yǔ)音及數據服務(wù)方案提供商,業(yè)務(wù)涵蓋語(yǔ)音合成整體解決方案及語(yǔ)音合成、語(yǔ)音識別、圖像識別自然語(yǔ)言處理等數據服務(wù)。標貝科技以“數據服務(wù)技術(shù),技術(shù)服務(wù)生活”為使命,致力于為客戶(hù)提供專(zhuān)業(yè)、高效的解決方案和數據服務(wù),實(shí)現語(yǔ)音效果及數據價(jià)值轉化。
公司成立于2016年2月,總部位于北京,并在深圳、天津、長(cháng)春等全國范圍內建立多個(gè)語(yǔ)音及數據專(zhuān)業(yè)團隊。團隊成員曾就職于百度、滴滴、360等國內知名互聯(lián)網(wǎng)企業(yè),其中核心成員擁有超過(guò)15年以上語(yǔ)音行業(yè)從業(yè)經(jīng)歷,在語(yǔ)音技術(shù)、產(chǎn)品、運營(yíng)等方面具備專(zhuān)業(yè)技能和豐富的實(shí)戰經(jīng)驗。
在語(yǔ)音解決方案方面,標貝基于3000小時(shí)自有合成數據庫、深度學(xué)習技術(shù)及高精度數據自動(dòng)預處理技術(shù),推出“聲音超市”這一產(chǎn)品。該產(chǎn)品匯集百余種音色,涵蓋多元音色、類(lèi)型、明星、動(dòng)漫IP和優(yōu)質(zhì)發(fā)音人,通過(guò)所聽(tīng)即所得的方式,高品質(zhì)合成語(yǔ)音滿(mǎn)足各類(lèi)場(chǎng)景下的需求,適用于多行業(yè)、多領(lǐng)域、多場(chǎng)景的智能語(yǔ)音解決方案。
在數據能力方面,經(jīng)過(guò)科學(xué)的立項設計,嚴格授權的數據采集環(huán)節,專(zhuān)業(yè)的數據加工處理流程,嚴格的校對及語(yǔ)音標注,統一整齊的結構處理,實(shí)現快速產(chǎn)出高質(zhì)量的人工智能數據,業(yè)務(wù)涵蓋語(yǔ)音合成、語(yǔ)音識別、圖像識別等。標貝科技開(kāi)創(chuàng )了TOBI國際標注體系在中國商業(yè)領(lǐng)域運用,并通過(guò)自主研發(fā)的TTS評測系統,為客戶(hù)提供快速、有效、專(zhuān)業(yè)的語(yǔ)音數據服務(wù);合成與識別數據庫準確率高達99%。
基于技術(shù)與數據的雙重優(yōu)勢加持,標貝科技打造國內領(lǐng)先的海量語(yǔ)音庫,聚焦明星、動(dòng)漫IP和優(yōu)質(zhì)發(fā)音人,滿(mǎn)足現有客戶(hù)的特殊需求;目前語(yǔ)音數據超市規模超10萬(wàn)小時(shí),40種明星IP音庫;20種歌曲音庫;定制庫230種;80種合成自有庫,包括中美兒童/男女聲、粵語(yǔ)/臺語(yǔ)/韓語(yǔ)/日語(yǔ)/方言女聲、智能客服、前端訓練集等;50種識別自有庫,包括成年人、青少年/兒童、多語(yǔ)種等。
標貝科技自設立以來(lái)保持高速發(fā)展,于2018年年底獲深創(chuàng )投、恒生電子兩家資深投資機構的5000萬(wàn)A輪融資。
標貝科技已獲得國家高新技術(shù)企業(yè)、中關(guān)村高新技術(shù)企業(yè)認證。此外,標貝科技既是中國語(yǔ)音產(chǎn)業(yè)聯(lián)盟、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟、中國服務(wù)機器人產(chǎn)業(yè)發(fā)展聯(lián)盟成員,也是BAT人工智能生態(tài)重要成員。
截至目前,標貝科技已與百度、阿里、騰訊、微軟、京東、滴滴、字節跳動(dòng)、網(wǎng)易、360、三星等國內外百余家企業(yè)客戶(hù)建立合作,服務(wù)項目累計超過(guò)300項,涵蓋汽車(chē)、教育、客服、零售、閱讀、智能硬件等領(lǐng)域;同時(shí)在高校科研合作方面,與北京大學(xué)、西北工業(yè)大學(xué)、新加坡國立大學(xué)等高校建立合作關(guān)系。
企業(yè)網(wǎng)址:www.data-baker.com
