• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    面向NLP場(chǎng)景應用的智能輔助建模(一)簡(jiǎn)介

    2019-05-08 15:37:56   作者:晉耀紅   來(lái)源:“泰岳語(yǔ)義工廠(chǎng)”微信公眾號   評論:0  點(diǎn)擊:


      之前的文章“NLP場(chǎng)景應用中的本體論”中提到,場(chǎng)景本體(也稱(chēng)為“OEC模型”)是面向場(chǎng)景的形式化模型,是以本體論為指導,對場(chǎng)景應用中,NLP語(yǔ)義分析的業(yè)務(wù)目標(需求)進(jìn)行形式化描述,并對場(chǎng)景相關(guān)的領(lǐng)域模型、要素模型、概念模型進(jìn)行形式化描述,提高場(chǎng)景知識的共享、復用能力。
      智能輔助建模(也稱(chēng)為“OEC智能輔助建模”)將介紹如何利用機器學(xué)習算法和語(yǔ)義資源,輔助場(chǎng)景業(yè)務(wù)人員,自動(dòng)或半自動(dòng)化地構建具體場(chǎng)景應用中的OEC模型。本文是輔助建模系列文章的第一篇,將介紹輔助建模的概念、工具和基本功能。
      一個(gè)場(chǎng)景模型示例
      在下邊這個(gè)本體場(chǎng)景實(shí)例,是銀行領(lǐng)域客服投訴分析挖掘的場(chǎng)景本體模型,可用于對銀行客服投訴進(jìn)行自動(dòng)分析。輸入是客服投訴文本,是自然語(yǔ)言表示的文本,輸出結果是客服投訴的自動(dòng)分類(lèi)。
      客服投訴模型,包括3部分:
      1、本體模型:形式上由一個(gè)本體樹(shù)和領(lǐng)域模型構成。本體樹(shù)是類(lèi)目體系的形式化描述,這里指客服投訴的分類(lèi)。領(lǐng)域模型,是本體樹(shù)對應的推理規則的形式化描述,這里指客服投訴分類(lèi)相關(guān)的業(yè)務(wù)知識。領(lǐng)域模型支持兩種類(lèi)型:概念模型、機器學(xué)習預訓練模型。上圖中的“本體表達式”,是概念模型的形式化規則,說(shuō)明客服投訴的業(yè)務(wù)知識,一般是用“客服人員-態(tài)度-不好”這樣的三元組表示,其中“客服人員”是投訴對象要素,“態(tài)度”是投訴涉及的屬性要素,“不好”是投訴中對投訴對象涉及屬性的評價(jià)性描述。
      2、要素模型:是對領(lǐng)域相關(guān)實(shí)體概念的形式化描述。這里指銀行領(lǐng)域相關(guān)投訴對象(對象要素)、投訴對象相關(guān)屬性(屬性要素)。如工作人員的對象要素,可包括下級要素,如“柜員、客服人員、保安、大堂經(jīng)理”等,工作人員的屬性要素,可包括下級要素如“態(tài)度、效率、業(yè)務(wù)水平”等。
      3、概念模型:是對領(lǐng)域無(wú)關(guān)的語(yǔ)言概念的形式化描述。這里指對象和屬性的評價(jià)概念,如“不好、惡劣、怠慢”等。概念模型可理解為傳統意義上的語(yǔ)言資源形式化管理。
      場(chǎng)景本體輔助建模
      場(chǎng)景本體模型是業(yè)務(wù)知識的形式化表示,一般由業(yè)務(wù)人員主導構建。面向場(chǎng)景應用開(kāi)發(fā)的工具——DINFO-OEC平臺,提供專(zhuān)業(yè)、方便、易用的建模IDE集成環(huán)境,支持場(chǎng)景化業(yè)務(wù)建模,可通過(guò)概念規則,構建形式化的業(yè)務(wù)規則,也可通過(guò)數據標注,指定機器學(xué)習(包括深度學(xué)習)算法,來(lái)訓練機器學(xué)習模型。建模工具支持兩種類(lèi)型領(lǐng)域模型。
      為了提高建模效率,DINFO-OEC平臺也提供OEC智能輔助建模工具,支持利用機器學(xué)習算法,對業(yè)務(wù)數據進(jìn)行自動(dòng)學(xué)習。輔助建模中涉及到的機器學(xué)習算法(包括深度學(xué)習)、知識資源及各種功能模塊,均由DINFO-OEC平臺提供。
      輔助建模工具
      輔助建模工具,提供可視化輔助建模環(huán)境,支持業(yè)務(wù)人員通過(guò)拖拉拽的方式,實(shí)現各種建模操作。
      輔助建模工具的3個(gè)分區:
      1、組件區:在建模工具左下角。該區提供相關(guān)算法組件,如用于本體模型輔助的分類(lèi)聚類(lèi),用于要素模型、概念模型中的實(shí)體抽取,用于本體模型中本體表達式輔助的關(guān)聯(lián)發(fā)現、規則生成等組件。每個(gè)組件對可以對應一個(gè)或多個(gè)算法,業(yè)務(wù)人員無(wú)須了解算法的具體細節,只需要在輔助建模工具中拖拽組件(如分類(lèi)、聚類(lèi)組件),即可完成自動(dòng)聚類(lèi)的任務(wù)。組件區也提供建模常用操作,如選擇語(yǔ)料,可以選擇客服投訴語(yǔ)料來(lái)作為輔助建模的數據等。
      2、建模區:在建模工具左上方。該區支持業(yè)務(wù)人員將組件區的組件和操作,通過(guò)拖拉拽的方式,形成一個(gè)處理流程,用以實(shí)現多級建模。
      3、結果區:在建模工具右方。該區展示當前流程的輸出結果,業(yè)務(wù)人員可對結果進(jìn)行合并、修改、刪除等操作。
      輔助建模功能示例
      以上述客服投訴模型為例,輔助建模工具在以下4個(gè)環(huán)節中,支持業(yè)務(wù)人員對客服投訴的文本數據進(jìn)行分析,提高客服投訴模型的建設效率:
      1、分類(lèi)體系建模:針對本體模型中本體樹(shù)建設,輔助自動(dòng)發(fā)現本體樹(shù)節點(diǎn)。
      2、要素發(fā)現:針對要素模型中要素樹(shù)建設,輔助自動(dòng)發(fā)現客服投訴場(chǎng)景下的實(shí)體對象。
      3、評價(jià)概念復用:針對概念樹(shù)中概念樹(shù)建設,可直接復用平臺提供的語(yǔ)言資源。
      4、本體表達式發(fā)現:針對本體模型中,一個(gè)本體樹(shù)節點(diǎn)的業(yè)務(wù)規則,從客服投訴文本中,輔助發(fā)現要素與概念的組合關(guān)系,自動(dòng)形成本體表達式。
    作者:晉耀紅博士,神州泰岳首席科學(xué)家,人工智能研究院院長(cháng),北京師范大學(xué)教授,博士生導師。
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 湛江市| 宁夏| 石屏县| 双牌县| 昆明市| 泸州市| 新丰县| 娱乐| 象州县| 长沙市| 达拉特旗| 宁蒗| 洪泽县| 莱西市| 安福县| 蒲城县| 涟源市| 墨脱县| 赞皇县| 柘城县| 平乐县| 施甸县| 新营市| 玉屏| 大连市| 兴义市| 永福县| 正镶白旗| 庆元县| 济宁市| 保德县| 南漳县| 东宁县| 马山县| 庆云县| 屏东市| 凉城县| 静宁县| 神池县| 樟树市| 嘉祥县| http://444 http://444 http://444 http://444 http://444 http://444