IT問(wèn)答網(wǎng)站Stack Overflow日前宣布,計劃從今年年中起,向大型AI開(kāi)發(fā)商收取數據訪(fǎng)問(wèn)費用,付費后才可以獲取該平臺上的5000萬(wàn)個(gè)問(wèn)題與答案。
Stack Overflow是一個(gè)程序設計領(lǐng)域的問(wèn)答網(wǎng)站,隸屬Stack Exchange Network。網(wǎng)站上最常見(jiàn)的問(wèn)答主題包括JavaScript、Java、C#、PHP、Android、Python、jQuery和HTML等。如今其注冊用戶(hù)已超過(guò)2000萬(wàn)。
其首席執行官Prashanth Chandrasekar表示,“社區平臺推動(dòng)了大語(yǔ)言模型(LLM)發(fā)展,所作出的貢獻也必須得到補償。”
同樣也是在本周,美國新聞媒體聯(lián)盟(The News/Media Alliance,前美國報業(yè)協(xié)會(huì ))公布多項原則,呼吁AIGC開(kāi)發(fā)公司就數據使用展開(kāi)談判,并要求這些開(kāi)發(fā)公司尊重新聞媒體獲得公平補償的權利。
環(huán)球音樂(lè )集團(Universal Music Group)近日也發(fā)出警告,阻止AI服務(wù)從其受版權保護的歌曲中抓取旋律和歌詞。
科技巨頭或成主要收費對象 馬斯克已作出“價(jià)格示范”
實(shí)際上,OpenAI、谷歌、Meta等多家科技公司在建立大規模AI項目時(shí),歷來(lái)不會(huì )為大部分訓練數據付費,而是選擇從網(wǎng)絡(luò )直接“搜刮”,數據來(lái)源便囊括上文提到的Stack Overflow和Reddit。當然,在美國此舉通常被看作合法行為,但仍存在一些版權與網(wǎng)站條款爭議。
但即便在這種情況下,ChatGPT等一系列AI大模型/聊天機器人的開(kāi)發(fā)費用也已高達數億美元。隨著(zhù)Reddit、Stack Overflow等網(wǎng)站開(kāi)始“開(kāi)口要錢(qián)”,這些科技巨頭的AI開(kāi)發(fā)費用未來(lái)很可能“再上一層樓”,而技術(shù)開(kāi)發(fā)時(shí)間或也將進(jìn)一步延長(cháng)。
至于具體如何收費?不論是Stack Overflow還是Reddit都暫未發(fā)布價(jià)格信息。
Reddit透露,“我們正在處理這個(gè)問(wèn)題,將在未來(lái)幾周內與合作伙伴分享更多信息。”Stack Overflow則表示,公司將借鑒研究Reddit的策略,并與潛在客戶(hù)展開(kāi)協(xié)商,目前已與部分客戶(hù)就數據訪(fǎng)問(wèn)進(jìn)行接觸。
這兩家公司的收費方案或許都將針對大型科技公司:Stack Overflow稱(chēng)希望收費對象僅限于以商用為目的開(kāi)發(fā)LLM的大型公司;Reddit也有類(lèi)似表態(tài)。而其余用戶(hù)與公司則有望繼續免費使用數據。
而馬斯克或許也為這兩家公司提供可供借鑒的定價(jià)方案——本月馬斯克已提高推特數據訪(fǎng)問(wèn)價(jià)格,起價(jià)為每月4.2萬(wàn)美元,可訪(fǎng)問(wèn)5000萬(wàn)條推文。而就在本周三,馬斯克剛剛指控微軟非法使用推特數據來(lái)訓練其AI模型,還直言“訴訟時(shí)間到”,警告要起訴微軟。