• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 國內 >
     首頁(yè) > 資訊 > 國內 >

    刷新中文命名實(shí)體識別SOTA 華為云研發(fā)團隊論文入選國際頂會(huì )NAACL 2022

    2022-04-14 09:44:17   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      2022年4月7日,自然語(yǔ)言處理領(lǐng)域國際頂級學(xué)術(shù)會(huì )議NAACL 2022(The North American Chapter of the Association for Computational Linguistics)公布論文入選名單,由華為云語(yǔ)音語(yǔ)義創(chuàng )新Lab多名研究者撰寫(xiě)的信息抽取論文《Delving Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition》被NAACL 2022 Findings接收,這代表著(zhù)中文命名實(shí)體識別的最優(yōu)結果 (SOTA) 被進(jìn)一步刷新,更準確有效地實(shí)體識別將推動(dòng)下游自然語(yǔ)言處理任務(wù)的進(jìn)一步發(fā)展。
      NAACL由國際計算語(yǔ)言學(xué)學(xué)會(huì )(ACL)主辦,與ACL、EMNLP并稱(chēng)NLP領(lǐng)域的三大頂會(huì ),是人工智能的重要研究陣地。NAACL的錄用十分嚴格,根據往年評選結果,只有不到30%的論文被接收。
      作為自然語(yǔ)言處理中最經(jīng)典、最基礎的任務(wù),命名實(shí)體識別一直受到廣泛的關(guān)注與研究。近年來(lái),中文命名實(shí)體識別任務(wù)上取得了明顯進(jìn)展,很多新的方法和框架被陸續提出,但往往忽略了實(shí)體詞的內部組成。
      對于中文命名實(shí)體而言,很多類(lèi)別的實(shí)體都具有很強的命名規律性。比如說(shuō),以“公司”或者“銀行”結尾的實(shí)體詞,通常屬于組織機構這一實(shí)體類(lèi)別。因此,在《Delving Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition》中,華為云語(yǔ)音語(yǔ)義創(chuàng )新Lab的研究者提出用簡(jiǎn)單有效、規律性引導的識別網(wǎng)絡(luò )來(lái)探究中文實(shí)體詞中的規律性。
      圖1 規律性引導的識別網(wǎng)絡(luò )
      如圖1,華為云研究者首先利用注意力機制顯著(zhù)地提取每個(gè)文本段的規律性,進(jìn)而將這種表征文本內部的規律性的特征和通過(guò)Biaffine Attention提取的文本段特征結合起來(lái),進(jìn)行后續的實(shí)體識別。為了避免由于過(guò)度關(guān)注實(shí)體內部規律性導致的實(shí)體邊界識別偏差,研究者們另外設計了一個(gè)與規則無(wú)關(guān)的模塊來(lái)幫助模型更準確地識別實(shí)體的邊界。
      圖2 中文數據集上的實(shí)驗結果
      華為云研究者提出的規律性引導的識別網(wǎng)絡(luò ),如圖2,在MSRA, Ontonotes4.0, 和Ontonotes5.0三個(gè)大規模中文實(shí)體識別數據集上都取得了SOTA的結果。同時(shí),本文提出的方法不依賴(lài)于外部詞典信息,并且F1值超過(guò)了目前所有使用詞典信息的方法的結果。這充分說(shuō)明通過(guò)研究實(shí)體詞的內部規律性,研究者們提出了一個(gè)非常有效的網(wǎng)絡(luò )結構。
      不止在信息抽取方面,華為云語(yǔ)音語(yǔ)義創(chuàng )新Lab秉承開(kāi)放創(chuàng )新、勇于探索、持續突破關(guān)鍵技術(shù)的精神,面向行業(yè)客戶(hù)提供領(lǐng)先的語(yǔ)音語(yǔ)義AI能力,結合大量行業(yè)知識,推出知識計算等行業(yè)解決方案,打造業(yè)界一流的知識計算競爭力。截至目前,已在政務(wù)、金融、石油等多個(gè)行業(yè)進(jìn)行了落地和實(shí)踐,幫助客戶(hù)實(shí)現AI落地與智能升級。
      查看相關(guān)論文:https://arxiv.org/pdf/2204.05544.pdf
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 嘉祥县| 阿勒泰市| 赤峰市| 石景山区| 梁河县| 报价| 吉水县| 莱芜市| 徐州市| 广德县| 宜兴市| 开鲁县| 石景山区| 宜州市| 阜平县| 深水埗区| 香格里拉县| 甘孜县| 松滋市| 讷河市| 罗平县| 常州市| 建始县| 英吉沙县| 咸宁市| 和田市| 玉山县| 邵东县| 始兴县| 平邑县| 富裕县| 城市| 红桥区| 固阳县| 布尔津县| 罗甸县| 宜良县| 嘉祥县| 榆树市| 康马县| 永泰县| http://444 http://444 http://444 http://444 http://444 http://444