• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當(dāng)前的位置是:  首頁 > 資訊 > 國內(nèi) >
     首頁 > 資訊 > 國內(nèi) >

    刷新中文命名實體識別SOTA 華為云研發(fā)團隊論文入選國際頂會NAACL 2022

    2022-04-14 09:44:17   作者:   來源:CTI論壇   評論:0  點擊:


      2022年4月7日,自然語言處理領(lǐng)域國際頂級學(xué)術(shù)會議NAACL 2022(The North American Chapter of the Association for Computational Linguistics)公布論文入選名單,由華為云語音語義創(chuàng)新Lab多名研究者撰寫的信息抽取論文《Delving Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition》被NAACL 2022 Findings接收,這代表著中文命名實體識別的最優(yōu)結(jié)果 (SOTA) 被進一步刷新,更準確有效地實體識別將推動下游自然語言處理任務(wù)的進一步發(fā)展。
      NAACL由國際計算語言學(xué)學(xué)會(ACL)主辦,與ACL、EMNLP并稱NLP領(lǐng)域的三大頂會,是人工智能的重要研究陣地。NAACL的錄用十分嚴格,根據(jù)往年評選結(jié)果,只有不到30%的論文被接收。
      作為自然語言處理中最經(jīng)典、最基礎(chǔ)的任務(wù),命名實體識別一直受到廣泛的關(guān)注與研究。近年來,中文命名實體識別任務(wù)上取得了明顯進展,很多新的方法和框架被陸續(xù)提出,但往往忽略了實體詞的內(nèi)部組成。
      對于中文命名實體而言,很多類別的實體都具有很強的命名規(guī)律性。比如說,以“公司”或者“銀行”結(jié)尾的實體詞,通常屬于組織機構(gòu)這一實體類別。因此,在《Delving Deep into Regularity: A Simple but Effective Method for Chinese Named Entity Recognition》中,華為云語音語義創(chuàng)新Lab的研究者提出用簡單有效、規(guī)律性引導(dǎo)的識別網(wǎng)絡(luò)來探究中文實體詞中的規(guī)律性。
      圖1 規(guī)律性引導(dǎo)的識別網(wǎng)絡(luò)
      如圖1,華為云研究者首先利用注意力機制顯著地提取每個文本段的規(guī)律性,進而將這種表征文本內(nèi)部的規(guī)律性的特征和通過Biaffine Attention提取的文本段特征結(jié)合起來,進行后續(xù)的實體識別。為了避免由于過度關(guān)注實體內(nèi)部規(guī)律性導(dǎo)致的實體邊界識別偏差,研究者們另外設(shè)計了一個與規(guī)則無關(guān)的模塊來幫助模型更準確地識別實體的邊界。
      圖2 中文數(shù)據(jù)集上的實驗結(jié)果
      華為云研究者提出的規(guī)律性引導(dǎo)的識別網(wǎng)絡(luò),如圖2,在MSRA, Ontonotes4.0, 和Ontonotes5.0三個大規(guī)模中文實體識別數(shù)據(jù)集上都取得了SOTA的結(jié)果。同時,本文提出的方法不依賴于外部詞典信息,并且F1值超過了目前所有使用詞典信息的方法的結(jié)果。這充分說明通過研究實體詞的內(nèi)部規(guī)律性,研究者們提出了一個非常有效的網(wǎng)絡(luò)結(jié)構(gòu)。
      不止在信息抽取方面,華為云語音語義創(chuàng)新Lab秉承開放創(chuàng)新、勇于探索、持續(xù)突破關(guān)鍵技術(shù)的精神,面向行業(yè)客戶提供領(lǐng)先的語音語義AI能力,結(jié)合大量行業(yè)知識,推出知識計算等行業(yè)解決方案,打造業(yè)界一流的知識計算競爭力。截至目前,已在政務(wù)、金融、石油等多個行業(yè)進行了落地和實踐,幫助客戶實現(xiàn)AI落地與智能升級。
      查看相關(guān)論文:https://arxiv.org/pdf/2204.05544.pdf
    【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

    專題

    CTI論壇會員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 搜索| 武乡县| 连城县| 沙湾县| 鹤壁市| 赫章县| 莱西市| 公主岭市| 南充市| 乌兰县| 迁安市| 永丰县| 深州市| 铁力市| 安多县| 朝阳区| 房产| 德州市| 鹤山市| 梓潼县| 略阳县| 九寨沟县| 铅山县| 金平| 册亨县| 平潭县| 邹城市| 光山县| 门源| 海盐县| 固原市| 洞口县| 隆德县| 崇信县| 无为县| 寿光市| 无为县| 博野县| 新营市| 峨边| 株洲市| http://444 http://444 http://444 http://444 http://444 http://444