這次上央視,云寶可沒(méi)空著(zhù)手回來(lái),給各位帶來(lái)了一個(gè)暴富小技巧!
CCTV-9紀錄頻道近日隆重推出人文歷史系列紀錄片《甲骨王朝》,揭開(kāi)商王朝的神秘面紗,還原商王朝的歷史面貌。
在第六集,華為云AI團隊攜手首都師范大學(xué)甲骨文研究中心莫伯峰教授,基于華為云ModelArts一站式AI開(kāi)發(fā)平臺等服務(wù),發(fā)起了一場(chǎng)文化跨界科技的標桿性實(shí)驗。雙方共同打造了甲骨文字形匹配、甲骨文語(yǔ)義推理兩個(gè)AI模型,為甲骨文的研究工作插上科技的翅膀。

央視紀錄片《甲骨王朝》截圖
要知道,中國文字博物館曾發(fā)布天價(jià)懸賞求“認字”,“破譯一個(gè)甲骨文字獎勵10萬(wàn)元”!云寶有了這AI模型,真的要暴富啦!

央視紀錄片《甲骨王朝》截圖
不開(kāi)玩笑了,認真說(shuō)。甲骨文字的識別對于中國考古的重大意義不言而喻,但距離甲骨文被創(chuàng )造已三千余年,每個(gè)文字的形體、意義、讀音都發(fā)生了劇烈變化,且“一字多形、一字多義”,辨識難度極大,工作十分繁重。

出自《漢語(yǔ)詞典》(黃揚主編)
它們都是“龜”字,側面俯視就算了
第四個(gè)六條腿是怎么回事
那么,為了幫助甲骨文的破解,華為云做了些什么呢?
字形匹配模型
洞悉文字變遷的規律

央視紀錄片《甲骨王朝》視頻畫(huà)面
為幫助未考釋的甲骨文揭開(kāi)神秘面紗,華為云AI團隊首先為莫伯峰教授打造了字形匹配模型,“推演”是該模型的主要任務(wù)代號。在早期,文字的變遷主要是基于字形逐漸演變的。相鄰朝代中,字形的變化通常有跡可循。沿著(zhù)文字發(fā)展的脈絡(luò )進(jìn)行字形對比,是甲骨學(xué)家重要的破譯方法。華為云的字形匹配模型正是基于這種規律,通過(guò)檢索與單個(gè)甲骨文字符字形相似的金文字符,來(lái)幫助實(shí)現甲骨文的破譯。

央視紀錄片《甲骨王朝》視頻畫(huà)面
將大量甲骨文與金文錄入到計算機系統后,華為云AI工程師利用神經(jīng)網(wǎng)絡(luò )等技術(shù),訓練出幫助識別甲骨文的字形匹配模型,讓AI掌握從甲骨文到金文再到現代文的文字發(fā)展規律,并模擬專(zhuān)家的破譯思路。“機器識別與人的識別效果非常接近”,莫伯峰教授這樣說(shuō)道。同時(shí),模型推理出的關(guān)于甲骨文-金文的匹配結果,往往能給甲骨學(xué)家們一些關(guān)于字形演變的新的思考。

首都師范大學(xué)甲骨文研究中心莫伯峰教授
然而,對甲骨文考釋而言,能夠從文字相似度的角度來(lái)破譯的未釋字數量相對有限,字形匹配模型的應用能解決的問(wèn)題僅為冰山一角。剩余的“文化密碼”,也許需要一個(gè)全新的破解思路。
語(yǔ)義推理模型幫助推理文字的AI界福爾摩斯
讓AI學(xué)習專(zhuān)家在古文字考釋中常見(jiàn)的“辭例歸納法”,是華為云AI團隊在該項目中的另一項創(chuàng )新。所謂“辭例歸納”,意即根據上下文語(yǔ)境推理出某個(gè)字或某詞組的含義。比如當我們使用計算機和手機的聯(lián)想輸入法,只要輸入一些內容,就能自動(dòng)預測接下來(lái)可能會(huì )搭配的文字,這種預測其實(shí)就是根據之前的語(yǔ)境和辭例歸納出來(lái)的,也就是機器的“辭例歸納”。
為讓AI與人類(lèi)一樣具備識文斷句、上下文理解及推理能力,在模型構建環(huán)節,華為云AI團隊以8億字的《四庫全書(shū)》作為語(yǔ)料,結合通假字、同音字等古文規則,培養人工智能的語(yǔ)感,同時(shí)也能讓人工智能系統化地學(xué)習漢朝至清乾隆時(shí)期的中國古典文化。
團隊以已經(jīng)具有成熟釋文文本的戰國楚竹書(shū)《上博簡(jiǎn)》(1-9)中的2103個(gè)字作為測試對象,隨機遮蔽某個(gè)文字,并讓模型預測遮蔽處的文字含義。語(yǔ)義推理模型可以在備選字符中為遮蔽處推選出五個(gè)可能的正確選項,有效地幫助專(zhuān)家縮窄探索范圍。

央視紀錄片《甲骨王朝》截圖
正確理解一片甲骨刻辭,并不僅取決于所有文字是否可識,更重要的是能否讀懂刻辭內容。接下來(lái),團隊一方面計劃引入華為云盤(pán)古大模型,基于其優(yōu)秀的泛化能力,解決甲骨文研究領(lǐng)域知識和數據不足的瓶頸。另一方面,團隊計劃構建關(guān)于甲骨文的知識圖譜,承載既有的研究成果,用圖網(wǎng)絡(luò )的形式展示甲骨拓片所蘊藏的豐富信息,從更高維度的視角來(lái)推動(dòng)甲骨文的研究。

華為云人工智能領(lǐng)域總裁賈永利
華為云人工智能領(lǐng)域總裁賈永利表示,新興技術(shù)讓學(xué)界專(zhuān)家得以將人類(lèi)經(jīng)驗與計算機自然語(yǔ)言相結合。通過(guò)AI對甲骨文研究的賦能,早期文明史的探索步伐將邁上新的臺階,蘊含在珍貴文物中的優(yōu)秀傳統文化將能更好地實(shí)現創(chuàng )新性發(fā)展。