• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 國內 >
     首頁(yè) > 新聞 > 國內 >

    神州泰岳AI小講堂:Ultra-NLP大揭秘

    2017-11-20 15:33:19   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      今天我們要開(kāi)啟新一單元的課程啦——Ultra-NLP。吶,乍一看很是高深莫測呀,那么Ultra-NLP是什么呢?是在高深的學(xué)問(wèn)下進(jìn)行深入研究與拓展,還是顛覆與創(chuàng )新?別急,通過(guò)泰岳AI小課堂的認真學(xué)習,再多的問(wèn)題都會(huì )迎刃而解噠!
      Ultra-NLP是神州泰岳人工智能研究院研發(fā)的集機器學(xué)習、統計學(xué)習、深度學(xué)習以及概念語(yǔ)義理解技術(shù)于一體的自然語(yǔ)言處理技術(shù)平臺。該平臺致力于打造一個(gè)業(yè)界持續領(lǐng)先的、完備的自然語(yǔ)言處理體系,以期快速、有效地解決自然語(yǔ)言處理領(lǐng)域中普遍存在的歧義理解、精準分類(lèi)、高純度聚類(lèi)、精確信息提取、關(guān)聯(lián)信息挖掘等難點(diǎn)、痛點(diǎn)問(wèn)題。平臺實(shí)現文本的語(yǔ)義理解和語(yǔ)義量化計算,提供高效的自然語(yǔ)言理解相關(guān)分析算法,包括自動(dòng)分詞、實(shí)體識別、句法分析、文本分類(lèi)、聚類(lèi)、主題分析、歧義理解、自動(dòng)摘要、關(guān)聯(lián)挖掘等。
      Ultra-NLP整體能力可分為詞語(yǔ)、句子和篇章三個(gè)層面:
      (1)詞語(yǔ)層面:使用HMM、CRF等統計學(xué)習技術(shù)實(shí)現精準的自動(dòng)分詞和發(fā)現新詞的能力。利用概念語(yǔ)義網(wǎng)絡(luò )模型,能夠符號化的表示詞匯的語(yǔ)義,自動(dòng)識別詞語(yǔ)的一詞多義和多詞一義歧義現象,解決讓機器掌握詞匯的語(yǔ)義,并能正確提取句子中蘊含的關(guān)聯(lián)性:同義、上下位、包含關(guān)系等。
      (2)句子層面:利用語(yǔ)義網(wǎng)絡(luò )來(lái)自動(dòng)識別句子中各概念間的語(yǔ)義關(guān)系,實(shí)現句子語(yǔ)義的歸一化處理,結合基于依存、n-gram、短語(yǔ)語(yǔ)法等語(yǔ)義理解技術(shù)實(shí)現的文法分析以及句子結構分析,精確識別句子變形,深層理解句子表達語(yǔ)義。
      (3)篇章層面:結合機器學(xué)習、深度學(xué)習以及概念語(yǔ)義網(wǎng)絡(luò )模型,正確分析篇章中上下文語(yǔ)境特征,實(shí)現分類(lèi)、聚類(lèi)、關(guān)鍵信息提取以及句群的切分與合并等篇章級分析能力。
      Ultra-NLP優(yōu)勢
      語(yǔ)義處理技術(shù)具備領(lǐng)先性
      Ultra-NLP是神州泰岳人工智能研究院多年的科研成果,提供領(lǐng)先業(yè)界的中文文本分析處理技術(shù)。源于中國傳統語(yǔ)言學(xué)(訓詁學(xué)—義)、人工智能、認知學(xué)、物理學(xué)、信號處理、哲學(xué)等跨學(xué)科的知識(文字學(xué)—形;音韻學(xué)—音),突破計算語(yǔ)言學(xué)界源于圖靈標準而采用的句法分析和語(yǔ)法分析標準,解決中文并沒(méi)有所謂主謂賓語(yǔ)法的問(wèn)題。
      豐富的行業(yè)應用經(jīng)驗
      Ultra-NLP已經(jīng)在中國工商銀行、中國銀行、新華社等行業(yè)領(lǐng)先機構得到過(guò)廣泛應用,上線(xiàn)產(chǎn)品均得到業(yè)界一致好評。豐富的行業(yè)應用經(jīng)驗有效的保證了產(chǎn)品成熟度。
      先進(jìn)的模型設計
      Ultra-NLP配合基于本體模型實(shí)現的DINFO-OEC非結構化數據分析挖掘平臺,對于語(yǔ)義分析功能可以提供更好的模型建設和算法配置能力,實(shí)現高效便捷的非結構化文本語(yǔ)義分析。
      提供分布式計算能力
      Ultra-NLP引入Spark分布式計算框架,實(shí)現了算法的分布式計算能力,解決傳統算法單機運行的瓶頸,大大提高算法的可用性和效率。
      復雜模型計算能力
      Ultra-NLP集成Tensorflow深度學(xué)習框架,滿(mǎn)足對大規模語(yǔ)料學(xué)習與復雜模型計算能力的需求。
      場(chǎng)景化分析能力
      Ultra-NLP自主設計組合不同處理類(lèi)型算法,構建能夠直接處理業(yè)務(wù)場(chǎng)景數據的NLP流程化的場(chǎng)景化算法,提供場(chǎng)景化的分析能力。
      個(gè)性化算法自定制
      Ultra-NLP提供靈活、易操作的Pipeline算法管道,支持用戶(hù)結合具體業(yè)務(wù)場(chǎng)景需求,自主定制個(gè)性化的NLP流程,實(shí)現個(gè)性化的場(chǎng)景化算法。
      Ultra-NLP平臺V1.0主要功能
      分詞標注
    • 提供最大切割、最短路徑和CRF新詞發(fā)現三種分詞算法
    • 提供HMM分詞模型的訓練和替換能力
    • 提供CRF分詞模型的替換能力
    • 支持用戶(hù)自定義分詞詞典
      實(shí)體識別
    • 提供命名實(shí)體識別能力
    • 提供自定義實(shí)體識別能力
    • 支持CRF實(shí)體模型替換
    • 支持用戶(hù)自定義實(shí)體詞典
      句法分析
    • 提供短語(yǔ)語(yǔ)法分析能力
    • 支持PCFG和factored兩種句法模型的訓
      依存文法
    • 提供依存文法分析能力
    • 提供N元文法分析能力
    • 依存文法支持ME模型訓練和替換
    • 依存文法支持CRF模型替換
      特征轉換
    • 提供文本特征轉換為數值編碼的能力
      特征選擇
    • 提供卡方驗證的特征選擇方法,支持設置TopN特征數量
    • 提供TF-IDF的特征選擇方法,支持設置TopN特征數量
      特征抽取
    • 提供TF-IDF特征抽取方法,支持minDF最小文檔頻度設置
    • 提供HashTF特征抽取方法,支持minDF最小文檔頻度設置
    • 提供CountVectorizer特征抽取方法,支持minDF最小文檔頻度設置
      分類(lèi)
    • 提供LinearSVM分類(lèi)算法能力,支持分類(lèi)模型的訓練、保存和加載
    • 提供樸素貝葉斯分類(lèi)算法能力,支持分類(lèi)模型的訓練、保存和加載
    • 提供隨機森林分類(lèi)算法能力,支持分類(lèi)模型的訓練、保存和加載
    • 提供邏輯回歸分類(lèi)算法能力,支持分類(lèi)模型的訓練、保存和加載
      場(chǎng)景化分類(lèi)算法
      設計組合場(chǎng)景化的分類(lèi)流程,優(yōu)化流程內部各算法參數,提供效果較好的Pipeline類(lèi)型的場(chǎng)景化分類(lèi)算法(分類(lèi)流程:分詞->向量轉換->特征選擇->權重計算->分類(lèi)器)
    • 提供LinearSVM分類(lèi)Pipeline能力,開(kāi)放測試準確率93%,支持分類(lèi)Pipeline模型的訓練、保存和加載
    • 提供樸素貝葉斯分類(lèi)Pipeline能力,開(kāi)放測試準確率90%,支持分類(lèi)Pipeline模型的訓練、保存和加載
    • 提供隨機森林分類(lèi)Pipeline能力,開(kāi)放測試準確率87%,支持分類(lèi)Pipeline模型的訓練、保存和加載
    • 提供邏輯回歸分類(lèi)Pipeline能力,開(kāi)放測試準確率92%,支持分類(lèi)Pipeline模型的訓練、保存和加載
    • 支持接收參數集合,調整Pipeline中任意步驟可調的參數
      文本相似計算
    • 提供余弦相似計算方法
    • 提供海明距離計算方法
      關(guān)聯(lián)計算
    • 提供基于word2vec的關(guān)聯(lián)詞匯推薦能力
      驗證方法
    • 提供數據拆分的方法
    • 提供封閉驗證的方法
    • 提供交叉驗證的方法
    • 提供網(wǎng)格尋優(yōu)的方法
      Pipeline基類(lèi)
    • 提供裝載transformer和estimator的能力,如分詞器、特征選擇、分類(lèi)器等
    • 支持添加、刪除、替換transformer或estimator
    • 支持接收參數集調整其中任意transformer或estimator可調參數值
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 阿图什市| 永昌县| 庆云县| 逊克县| 且末县| 龙川县| 温泉县| 鞍山市| 沭阳县| 突泉县| 宜丰县| 鞍山市| 彭水| 若羌县| 望谟县| 永川市| 兴安县| 六安市| 阿勒泰市| 芦山县| 普宁市| 喀喇沁旗| 兰州市| 郁南县| 镇江市| 睢宁县| 嘉峪关市| 合川市| 西吉县| 柳江县| 师宗县| 镇沅| 福州市| 淅川县| 东兰县| 陕西省| 陈巴尔虎旗| 巴林左旗| 兰溪市| 新巴尔虎左旗| 乐业县| http://444 http://444 http://444 http://444 http://444 http://444