2009年,斯坦福大學(xué)李飛飛教授的實(shí)驗室發(fā)布ImageNet數據集,開(kāi)啟了現代深度學(xué)習時(shí)代。大多數情況下,沒(méi)有標記的數據,就沒(méi)有AI算法模型。模型迭代和調整,則需要更多的數據。安全、準確和無(wú)偏見(jiàn)的AI系統依賴(lài)于大量高質(zhì)量的訓練數據。
由于缺乏成熟的基礎設施,構建機器學(xué)習系統具有挑戰性。AI進(jìn)一步發(fā)展的關(guān)鍵瓶頸是數據——特別是標記數據集。數據是支撐AI的基礎,每一項人工智能的進(jìn)步,都離不開(kāi)基礎數據的支持。
機器學(xué)習已然是這個(gè)時(shí)代最重要的技術(shù)變革,它給世界帶來(lái)的總體效益將與互聯(lián)網(wǎng)相媲美。也就是說(shuō),高質(zhì)量標簽數據的瓶頸限制了人工智能僅能在少數資金充足的科技公司里發(fā)揮作用。獲取標簽數據,是構建機器學(xué)習模型中最困難的部分。
標貝科技深度研發(fā),試圖用人機協(xié)作的方式從語(yǔ)音采集到數據標記實(shí)現無(wú)縫銜接,攻破行業(yè)技術(shù)壁壘。標貝構建了一個(gè)遍布世界各地約有萬(wàn)余名合同工的眾包網(wǎng)絡(luò )。其核心業(yè)務(wù)是為AI及大數據領(lǐng)域公司提供數據采集、標注等定制化數據解決方案,服務(wù)領(lǐng)域涵蓋圖像、語(yǔ)音、文本、視頻四個(gè)方面。
數據采集方面,可根據定制化需求,對各類(lèi)規定文本、指定圖片,各種環(huán)境下的語(yǔ)音、視頻進(jìn)行采集;采集過(guò)程中可實(shí)現對其內容的篩選、文本化等相關(guān)任務(wù)。可承載千萬(wàn)級別以上樣本的收集,單日完成10萬(wàn)+樣本采集。
數據標注方面,通過(guò)對圖像、文本、音頻、視頻等信息進(jìn)行搜集、評估、歸類(lèi),最終完成標注;標注過(guò)程中可實(shí)現對內容進(jìn)行關(guān)鍵詞等內容的提取、清洗、脫敏、校驗等相關(guān)任務(wù)。

標貝科技旗下全新的人工智能數據眾包平臺——數據工場(chǎng),正在以專(zhuān)業(yè)、高效、安全等優(yōu)勢,助力全球人工智能企業(yè)的研究和進(jìn)步。數據工場(chǎng)的數據服務(wù)全球客戶(hù),數據類(lèi)型覆蓋全行業(yè),自有數據集和定制化數據服務(wù)能夠滿(mǎn)足不同行業(yè)、多類(lèi)型的數據需求。標貝數據服務(wù)深耕行業(yè)多年,目前,BAT、網(wǎng)易、滴滴、京東、小米、喜馬拉雅和搜狗等知名企業(yè)的機器學(xué)習團隊陸續在使用該平臺完成數據相關(guān)需求。
數據工場(chǎng)首次將數據格式算法融入其中,通過(guò)操作平臺嚴格控制前端采集格式,大幅度提升了數據的高質(zhì)量和準確性,確保數據在采集和上傳的過(guò)程中無(wú)任何壓縮問(wèn)題。全新的品牌視覺(jué)設計融入了多類(lèi)型數據元素,卡片式交互使產(chǎn)品全方位提升用戶(hù)體驗。

產(chǎn)品特色:
- 多類(lèi)型任務(wù)隨心領(lǐng)取、關(guān)鍵標簽一覽無(wú)遺;
- 直擊任務(wù)核心信息、一鍵領(lǐng)取開(kāi)始采集;
- 卡片交互易操作、采集上傳高效率。
數據工場(chǎng)產(chǎn)品負責人張亞偉表示:“反復雕琢產(chǎn)品的每一處細節,精益求精”。
數據工場(chǎng)以全新的品牌視覺(jué)、順暢的操作體驗和強大的算法能力問(wèn)世。作為AI數據服務(wù)行業(yè)的引領(lǐng)者,標貝一直秉承“數據服務(wù)技術(shù),技術(shù)服務(wù)生活”的使命,為促進(jìn)語(yǔ)音行業(yè)發(fā)展、學(xué)術(shù)交流、合作伙伴,標貝提供多種類(lèi)、大規模、高質(zhì)量的數據服務(wù)。
各大應用市場(chǎng)搜索“數據工場(chǎng)”或掃描下方“二維碼”先人一步體驗服務(wù)。
