
HotpotQA評測(Fullwiki Setting賽道)最新榜單(截至2021年1月20日)
作為企業(yè)重要的信息載體,數字化文檔記錄了大量企業(yè)知識,如何快速幫助企業(yè)員工從數字化文檔中獲得答案,是企業(yè)文檔維護人員的痛點(diǎn)。為解決此問(wèn)題,一方面需要較強的閱讀理解技術(shù),另一方面還需要構建一套復雜的開(kāi)放域問(wèn)答流程。
HotpotQA評測數據是斯坦福、CMU和蒙特利爾大學(xué)聯(lián)合推出的新型問(wèn)答數據集,由斯坦福的Manning教授和深度學(xué)習三巨頭之一的Bengio牽頭構建,該數據集由多跳復雜問(wèn)題以及對應的答案組成,同時(shí)包含佐證證據用來(lái)解釋答案的來(lái)源。
在斯坦福此前公布的SQUAD評測任務(wù)中,機器已經(jīng)多次超過(guò)人類(lèi),該評測僅需要從單個(gè)篇章中找到與問(wèn)題有關(guān)的答案即可,故相對簡(jiǎn)單。然而,HotpotQA評測需要從整個(gè)wikipedia或者多篇文章中找出問(wèn)題相關(guān)的答案,同時(shí)要求返回問(wèn)題到答案的推理鏈,難度大大增加更具有挑戰性。該評測也吸引了來(lái)自谷歌、微軟、Facebook等知名研究機構以及CMU、Stanford、華盛頓大學(xué)、清華大學(xué)、北京大學(xué)等知名高校。
挑戰多跳知識推理技術(shù)高點(diǎn)
HotpotQA評測的難點(diǎn)在于機器要結合多篇文章進(jìn)行多跳推理才能得出答案,并返回佐證證據。該評測分為Distractor Setting和 Fullwiki Setting兩個(gè)賽道。Fullwiki Setting相較于Distractor Setting更為復雜也更接近實(shí)用價(jià)值,需要從整個(gè)維基百科文檔中抽取文檔,然后再從文檔中提取段落,最后從段落中抽取答案,而Distractor Setting賽道會(huì )提供10篇備選的篇章。如何從大量文檔段落中去多跳搜索候選,然后理解候選段落的內容提取佐證證據成為比賽的關(guān)鍵。
華為云聯(lián)合華為諾亞方舟實(shí)驗室,提出了新的檢索目標hop,用于收集維基百科中隱藏的推理證據,解決復雜多跳問(wèn)題,同時(shí)結合beam search對答案進(jìn)行排序和融合。

從維基百科文本圖譜中檢索跳轉(Hops)
如今,企業(yè)面臨著(zhù)數字化、知識化轉型,知識化轉型重要的關(guān)鍵技術(shù)就是知識的理解和推理,該技術(shù)對企業(yè)知識轉型具有重大的意義和推動(dòng)作用。2020年華為云推出知識計算解決方案,企業(yè)可以基于華為云知識計算解決方案打造自己的知識計算平臺,用于研發(fā)、生產(chǎn)、運營(yíng)、銷(xiāo)售、售后服務(wù)等企業(yè)核心流程。目前,該方案已在石油、汽車(chē)、醫療、化纖、煤焦化、鋼鐵、交通等行業(yè)率先實(shí)踐。