亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

您當前的位置是:  首頁 > 資訊 > 國內 >
 首頁 > 資訊 > 國內 >

思必馳在中文文本相似度計算任務上的探索與進展

2020-12-17 10:43:50   作者:   來源:CTI論壇   評論:0  點擊:


  文本相似度計算旨在識別兩段文本在語義上是否相似,是自然語言處理領域的一個重要研究方向,其在智能問答、信息檢索等領域都發(fā)揮重要作用,具有很高的商業(yè)價值。
  近期,思必馳知識服務團隊在中文文本相似度計算方向投入研究,并取得階段性成果:
  1)在第十四屆全國知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)[1]上發(fā)表相關論文一篇《Neural Fusion Model for Chinese Semantic Matching》。
  該會議是國內知識圖譜、語義技術、鏈接數據等領域的核心學術會議,聚集了知識表示、自然語言理解、知識獲取、智能問答、鏈接數據、圖數據庫、圖計算、自動推理等相關技術領域的和研究人員的學者和研究人員。
  2)在“千言數據集:文本相似度”評測[2]中取得階段性進展。該評測的文本相似度數據集包括公開的三個文本相似度數據集,分別為哈工大(深圳)LCQMC、BQCorpus和谷歌的PAWS-X(中文)。目前,思必馳知識服務團隊在三個數據集上均暫列第一。
  針對中文文本相似度計算的魯棒性和泛化性問題,思必馳知識服務團隊在以下幾個方面開展了技術研究:
  1)針對中文特點的字、詞融合編碼器;
  2)基于預訓練模型的領域自適應訓練;
  3)目標應用領域導向的多階段模型微調。
  相關技術實現(xiàn)在上述公開評測中得到了應用和驗證。
  語言智能常被稱為人工智能皇冠上的一顆明珠。在未來,思必馳知識服務團隊將繼續(xù)深耕認知智能領域,在面向通用領域的文本相似度計算基礎上,打造領域自適應的文本相似度計算系統(tǒng),推動文本相似度在垂直領域的應用和發(fā)展。
  參考文獻:
  [1]第十四屆全國知識圖譜與語義計算大會(CCKS: China Conference on Knowledge Graph and Semantic Computing)
  http://sigkg.cn/ccks2020/
  [2]千言數據集:閱讀理解公開評測
  https://aistudio.baidu.com/aistudio/competition/detail/45
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)

卢氏县| 寿光市| 安徽省| 抚顺市| 绵阳市| 安阳市| 如皋市| 綦江县| 昆山市| 富源县| 从化市| 工布江达县| 板桥市| 射阳县| 舞阳县| 闻喜县| 修文县| 巴塘县| 青岛市| 宣汉县| 周至县| 离岛区| 鹤山市| 伊宁市| 鸡东县| 奈曼旗| 公安县| 南通市| 北流市| 连江县| 托克逊县| 台安县| 永清县| 枞阳县| 耒阳市| 叶城县| 延边| 盐池县| 二连浩特市| 永登县| 襄城县|