智能評(píng)閱系統(tǒng)已成熟應(yīng)用于大規(guī)�？荚�，并可輔助教師日常教學(xué)。

　　雷鋒網(wǎng)按：7月12日-7月14日，2019第四屆全球人工智能與機(jī)器人峰會(huì)（CCF-GAIR 2019）于深圳正式召開(kāi)。峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)（CCF）主辦，雷鋒網(wǎng)、香港中文大學(xué)（深圳）承辦，深圳市人工智能與機(jī)器人研究院協(xié)辦，是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流博覽盛會(huì)，旨在打造國(guó)內(nèi)人工智能領(lǐng)域極具實(shí)力的跨界交流合作平臺(tái)。

　　7月14日，在CCF-GAIR 2019的「智慧教育專場(chǎng)」論壇上，科大訊飛北京研究院副院長(zhǎng)、哈工大訊飛聯(lián)合實(shí)驗(yàn)室副主任付瑞吉博士做了《智能評(píng)閱核心技術(shù)及應(yīng)用簡(jiǎn)介》的主題演講。

　　以下為付瑞吉博士的演講全文，雷鋒網(wǎng)進(jìn)行了不改變?cè)獾木庉嫞?/strong>

　　科大訊飛在教育領(lǐng)域的各個(gè)環(huán)節(jié)都做了很多工作，包括教學(xué)、考試、管理等各方面，在去年勇奪全球十二個(gè)人工智能技術(shù)評(píng)測(cè)的冠軍，這十二個(gè)獎(jiǎng)項(xiàng)包括自然語(yǔ)言處理、圖像、語(yǔ)音等各方面，其中語(yǔ)法檢錯(cuò)、圖文識(shí)別和閱讀理解等與智能評(píng)閱相關(guān)的技術(shù)都獲得了冠軍。

　　2016年，我們和教育部考試中心成立了聯(lián)合實(shí)驗(yàn)室，共同推進(jìn)語(yǔ)音識(shí)別、手寫(xiě)識(shí)別、自然語(yǔ)言處理、智能評(píng)測(cè)、機(jī)器翻譯等技術(shù)在教育領(lǐng)域的應(yīng)用。

　　訊飛教育突破點(diǎn)：從口語(yǔ)評(píng)測(cè)到智能評(píng)閱

　　接下來(lái)我將介紹智能評(píng)閱核心技術(shù)。

　　我們從口語(yǔ)評(píng)測(cè)講起，訊飛從2005年開(kāi)始研究口語(yǔ)評(píng)測(cè)。訊飛是做語(yǔ)音起家的，在語(yǔ)音識(shí)別和語(yǔ)音合成基礎(chǔ)上的另一個(gè)應(yīng)用點(diǎn)是語(yǔ)音評(píng)測(cè)。備試的學(xué)生說(shuō)一段話，機(jī)器進(jìn)行自動(dòng)評(píng)測(cè)，包括聲學(xué)方面的評(píng)測(cè)，文本內(nèi)容的評(píng)測(cè)，最后得到一個(gè)綜合分?jǐn)?shù)。

　　之所以會(huì)做這些工作，是因?yàn)槲覀円酝目谡Z(yǔ)考試很難組織，例如普通話水平考試、英語(yǔ)考試，學(xué)生在前面說(shuō)，老師在一直聽(tīng)，一天聽(tīng)下來(lái)是非常累的，到最后會(huì)影響老師的評(píng)分準(zhǔn)確度。

　　科大訊飛的機(jī)器現(xiàn)在可以做到在學(xué)習(xí)人工專家評(píng)分標(biāo)準(zhǔn)的情況下，評(píng)分的總分相關(guān)度和平均誤差達(dá)到人工水平，我們?cè)?0個(gè)省市的普通話考試?yán)飸?yīng)用到這項(xiàng)技術(shù)。

　　此外，我們從口語(yǔ)考試擴(kuò)展到紙筆考試，現(xiàn)在K12大部分是紙筆考試，我們通過(guò)掃描試卷，進(jìn)行圖片的OCR識(shí)別，再進(jìn)行自動(dòng)評(píng)分，得到一個(gè)評(píng)分的成績(jī)。

　　口語(yǔ)評(píng)測(cè)和智能評(píng)閱的關(guān)系是什么？

　　實(shí)際上二者很相似。我們做紙筆考試也是從口語(yǔ)評(píng)測(cè)激發(fā)的靈感。口語(yǔ)評(píng)測(cè)的輸入是一段語(yǔ)音，我們會(huì)對(duì)這個(gè)語(yǔ)音的發(fā)音標(biāo)準(zhǔn)進(jìn)行評(píng)測(cè)，同時(shí)進(jìn)行語(yǔ)音識(shí)別，對(duì)文字內(nèi)容進(jìn)行評(píng)測(cè)。我們的智能評(píng)閱輸入就變成了掃描或者拍照的圖片，對(duì)書(shū)寫(xiě)質(zhì)量有評(píng)價(jià)，對(duì)圖文識(shí)別后的語(yǔ)義層面也有評(píng)價(jià)，綜合獲得最終的分?jǐn)?shù)，這與口語(yǔ)評(píng)測(cè)是很相似的。

　　智能評(píng)閱難點(diǎn)解讀：作文評(píng)分技術(shù)框架

　　我們智能評(píng)閱中最難的是作文的評(píng)分，下圖是科大訊飛做評(píng)閱技術(shù)的核心框架。

　　左側(cè)是作文試卷圖片輸入后進(jìn)行圖文轉(zhuǎn)寫(xiě)，對(duì)內(nèi)容的相似度和其他異常進(jìn)行檢測(cè)，這部分由于內(nèi)容和標(biāo)準(zhǔn)很難處理，目前仍是交給人來(lái)評(píng)測(cè)；接下來(lái)，進(jìn)行定標(biāo)的篩選。

　　為什么需要進(jìn)行定標(biāo)的篩選？這是因?yàn)槊看慰荚嚭笤u(píng)分標(biāo)準(zhǔn)可能會(huì)有一些差異，這種情況下我們會(huì)選取一小部分試卷作為定標(biāo)來(lái)打樣卷，請(qǐng)專家進(jìn)行評(píng)分，以專家評(píng)分為標(biāo)準(zhǔn)來(lái)訓(xùn)練模型。右側(cè)是進(jìn)行評(píng)分的抽取、訓(xùn)練和評(píng)分模型的訓(xùn)練。

　　首先，我們進(jìn)行圖文轉(zhuǎn)寫(xiě)，試卷掃描之后的情況如左側(cè)所示（如下圖）。右側(cè)是進(jìn)行行的切分、插入符號(hào)的識(shí)別，還有一些潦草涂抹塊的識(shí)別。對(duì)于手寫(xiě)作文識(shí)別的最終準(zhǔn)確率已經(jīng)達(dá)到98%以上，達(dá)到了使用的門(mén)檻。在圖文轉(zhuǎn)寫(xiě)基礎(chǔ)上，我們會(huì)對(duì)內(nèi)容進(jìn)行評(píng)分。

　　對(duì)于內(nèi)容的評(píng)分，我們會(huì)抽取多個(gè)維度的特征。

　　在議論文篇章結(jié)構(gòu)分析方面，以語(yǔ)文為例，高考中通常是議論文，我們會(huì)識(shí)別作文主旨、分論點(diǎn)、事實(shí)論據(jù)等篇章角色。采用的方法是通過(guò)整篇文章句子間的語(yǔ)義關(guān)聯(lián)性來(lái)分析其篇章角色。例如整篇作文全局性關(guān)聯(lián)的句子，在各個(gè)段落之間都會(huì)出現(xiàn)，通常是貫穿全局的主旨，表示整個(gè)文章的核心思想；還有一些局部相關(guān)聯(lián)的句子，可能是分論點(diǎn)以及對(duì)應(yīng)的論據(jù)，是分論點(diǎn)的展開(kāi)闡述；通過(guò)這些句子之間語(yǔ)義的相關(guān)性，我們會(huì)把整篇文章的篇章角色標(biāo)注出來(lái)。例如，將引論句、主旨句、子論點(diǎn)、論據(jù)句都會(huì)識(shí)別出來(lái)。這些分析結(jié)果可以作為評(píng)分的特征。

　　在表達(dá)方式方面，大家小學(xué)都學(xué)過(guò)表達(dá)方式，例如記敘、抒情、議論、描寫(xiě)等表達(dá)方式，我們需要自動(dòng)識(shí)別出來(lái)。尤其是描寫(xiě)，描寫(xiě)體現(xiàn)出一個(gè)人對(duì)于語(yǔ)言運(yùn)用的能力。我們計(jì)算過(guò)相關(guān)性，高分作文中描寫(xiě)的比例很高，描寫(xiě)的質(zhì)量也很高。對(duì)于描寫(xiě)的識(shí)別，我們用了多標(biāo)簽訓(xùn)練標(biāo)注的方法來(lái)進(jìn)行識(shí)別，也作為評(píng)分的特征使用。

　　在修辭的識(shí)別方面，以比喻為例，在中小學(xué)，尤其是記敘文中，恰當(dāng)?shù)谋扔鞯氖褂脮?huì)使作文更加生動(dòng)形象，作文質(zhì)量在一定程度上會(huì)更高。我們識(shí)別比喻用的方法是基于多任務(wù)學(xué)習(xí)的方法，主要分為三個(gè)任務(wù)：

左側(cè)是識(shí)別出比喻的本體和喻體，是比喻元素的抽�。�

右側(cè)上部是判斷是否是比喻，進(jìn)行二元分類；

右側(cè)下部是語(yǔ)言模型的建模。

　　同時(shí)優(yōu)化這三項(xiàng)任務(wù)，可以使比喻的識(shí)別達(dá)到更好的效果。
　　此外，擬人、排比、引用等修辭，我們現(xiàn)在也都可以識(shí)別出來(lái)，這些特征可以作為評(píng)分的依據(jù)。
　　智能評(píng)閱系統(tǒng)的另一功能：防作弊

　　在考試中還有一個(gè)應(yīng)用，作文的相似檢測(cè)，也就是抄襲的檢測(cè)。這在大型考試中，人工是很難進(jìn)行判斷的，所以我們做了這樣一件事情。

　　我們有幾百萬(wàn)的范文庫(kù)，還有同批作文，有的學(xué)生會(huì)把閱讀理解的內(nèi)容抄到作文中湊字?jǐn)?shù)，對(duì)于老師來(lái)說(shuō)，做這種檢測(cè)是不太可能的，很容易會(huì)忽略，我們用機(jī)器這套方法來(lái)識(shí)別，可以很方便、快速、準(zhǔn)確地檢測(cè)出來(lái)。

　　例如，在兩篇作文中，中間部分寫(xiě)得基本一樣。這是因?yàn)橹虚g部分是背了一些網(wǎng)絡(luò)范文或模板。也有可能是把前面的閱讀理解抄在了作文中。

　　還有其他作文評(píng)閱技術(shù)，包括體裁分類（議論文、記敘文、散文等）、主題分類、離題檢測(cè)、立意判別，這些我們都已有相應(yīng)技術(shù)。

　　智能評(píng)閱系統(tǒng)應(yīng)用場(chǎng)景：大規(guī)�？荚�、日常教學(xué)

　　剛才介紹的是核心技術(shù)的進(jìn)展，我們看一下這些核心技術(shù)在我們的產(chǎn)品中是如何應(yīng)用的。

　　智能評(píng)閱有兩大應(yīng)用場(chǎng)景，一方面是大規(guī)�？荚嚕裰锌�、高考、會(huì)考、MHK等大型考試，一般是幾萬(wàn)到幾十萬(wàn)人，規(guī)模比較大。這一應(yīng)用場(chǎng)景對(duì)智能評(píng)閱系統(tǒng)有兩類需求：

　　第一，做評(píng)分質(zhì)檢，因?yàn)橐ＷC評(píng)分的準(zhǔn)確性，所以要做評(píng)分質(zhì)檢，校檢人工的錯(cuò)誤；

　　第二，替代一評(píng)，對(duì)于高利害的考試更多是做質(zhì)檢，對(duì)低利害的考試，鑒于對(duì)人工成本節(jié)省的考慮，可以用以替代一評(píng)。

　　另一應(yīng)用場(chǎng)景是，日常教學(xué)。日常教學(xué)包括平時(shí)的作業(yè)、周測(cè)、月考、期中/期末考試和校際聯(lián)考，規(guī)模比較小，比如班級(jí)作業(yè)只有幾十人。這不只需要評(píng)分的準(zhǔn)確，還需要批改、反饋，對(duì)老師來(lái)說(shuō)還需要有詳細(xì)的分析報(bào)告。可以看到，日常教學(xué)中的需求比在考試中的需求更加精細(xì)，技術(shù)難度也更大。

　　我們分別來(lái)看一下。

　　首先，大規(guī)模考試中的應(yīng)用主要是做質(zhì)檢。諸如掃描切圖、客觀評(píng)分、專家定標(biāo)、主觀題人工評(píng)分，這些是人工評(píng)分過(guò)程中要做的一些事情；此外，智能評(píng)分、空白卷和異常的檢測(cè)等智能復(fù)核是智能評(píng)閱做的事情。

　　我們會(huì)在人工評(píng)分的同時(shí)進(jìn)行機(jī)器的自動(dòng)評(píng)分，得到評(píng)分結(jié)果后，進(jìn)行評(píng)分結(jié)果的復(fù)核，發(fā)現(xiàn)一些人機(jī)評(píng)分大分差的情況，我們會(huì)對(duì)大分差進(jìn)行專家復(fù)核，對(duì)成績(jī)進(jìn)行確認(rèn)，復(fù)核以后做最終成績(jī)發(fā)布。加入智能評(píng)閱環(huán)節(jié)后，可以使整個(gè)評(píng)分更加準(zhǔn)確。

　　包括前面提到的語(yǔ)文作文、英語(yǔ)作文、數(shù)學(xué)解答題、文綜簡(jiǎn)答題，其中理綜的簡(jiǎn)答題比較少，其他科目已經(jīng)達(dá)到比較高的比例。近年已經(jīng)在全國(guó)多地大規(guī)�？荚囍袘�(yīng)用。

　　總體來(lái)說(shuō)，各地評(píng)卷專家對(duì)智能評(píng)閱技術(shù)在考試中的應(yīng)用非常認(rèn)可，形成了一個(gè)良好的應(yīng)用示范，可以繼續(xù)深化推廣。

　　在日常教學(xué)中的應(yīng)用，像我剛才強(qiáng)調(diào)的，應(yīng)用反饋的難度會(huì)比大規(guī)模考試的評(píng)分難度更大，盡管如此，仍得到了廣泛的應(yīng)用。例如，英語(yǔ)的填空題、英文作文的反饋，在實(shí)際學(xué)校中的應(yīng)用，已經(jīng)有2000多所學(xué)校常態(tài)化使用，三年來(lái)增長(zhǎng)量提高了將近10余倍，實(shí)現(xiàn)為近萬(wàn)名老師減負(fù)。

　　老師平時(shí)在批改作文的過(guò)程中是非常費(fèi)時(shí)費(fèi)力的，在科大訊飛的平臺(tái)上進(jìn)行的統(tǒng)計(jì)統(tǒng)計(jì)顯示，老師在批改過(guò)程中可能20秒、10秒，甚至幾秒直接批閱作文，直接給一個(gè)評(píng)分或者給一個(gè)“閱”，對(duì)學(xué)生的反饋是不足的。這樣的方式對(duì)于學(xué)生學(xué)習(xí)興趣的培養(yǎng)是不利的。我們有了智能評(píng)閱技術(shù)，可以實(shí)現(xiàn)自動(dòng)反饋，可以輔助老師更好地給學(xué)生更加詳盡的反饋，提高學(xué)生的學(xué)習(xí)興趣，也提高反饋的效率。

　　雷鋒網(wǎng)在會(huì)后對(duì)付瑞吉博士進(jìn)行了采訪，精彩內(nèi)容節(jié)選如下：

　　雷鋒網(wǎng)：科大訊飛目前在智慧教育領(lǐng)域有怎樣的整體布局和版塊劃分？

　　付瑞吉：科大訊飛在智慧教育領(lǐng)域整體布局分為以下五大方向：

第一，智慧課堂，我們通過(guò)一些智能硬件（諸如平板）將后臺(tái)資源，以及我們的一些核心技術(shù)連起來(lái)。例如，我們?cè)谧稣Z(yǔ)音評(píng)測(cè)時(shí)，可以讓學(xué)生用平板進(jìn)行學(xué)習(xí)，老師以大屏作為中控平臺(tái)和顯示平臺(tái)，學(xué)生現(xiàn)場(chǎng)讀一段話，系統(tǒng)會(huì)自動(dòng)給出評(píng)測(cè)結(jié)果，包括來(lái)自哪個(gè)地方，哪個(gè)地方讀的不準(zhǔn)，并給出提示出來(lái)。

　　如果只靠老師一個(gè)人來(lái)進(jìn)行教學(xué)，一方面，沒(méi)有這么準(zhǔn)確，如某些地方老師的普通話水平也有限；另外一方面，老師對(duì)于學(xué)生的薄弱點(diǎn)的把握沒(méi)有那么迅速。

　　此外，平臺(tái)還會(huì)提供大量課程資源，我們后臺(tái)有大量的課件資源，優(yōu)質(zhì)的課件音視頻材料，這種素材相當(dāng)于一個(gè)大的共享平臺(tái)，方便老師進(jìn)行備課，以及在課堂上及時(shí)搜索資源。例如，上歷史課講到一些歷史事件時(shí)，我們可以方便地搜索一些歷史事件當(dāng)時(shí)的地形圖，采用動(dòng)畫(huà)的方式展示當(dāng)時(shí)的戰(zhàn)爭(zhēng)狀態(tài)、演進(jìn)過(guò)程，使得課堂教學(xué)生動(dòng)活躍，資源豐富。

第二，智能評(píng)閱，通過(guò)考試，我們一方面是對(duì)于大規(guī)�？荚囘@種服務(wù)，對(duì)于評(píng)分的公平公正的維護(hù)；另一方面我們?cè)谌粘＿@種應(yīng)用中，可以幫助更加精準(zhǔn)地分析學(xué)生的薄弱點(diǎn)，例如作文中哪些方面不好，我們通過(guò)技術(shù)服務(wù)輔助老師達(dá)到精準(zhǔn)的診斷，最終實(shí)現(xiàn)這種精準(zhǔn)的教學(xué)。

第三，個(gè)性化學(xué)習(xí)，我們會(huì)對(duì)題目做一些分析技術(shù)，例如數(shù)理化這種理科的題目，我們會(huì)針對(duì)知識(shí)點(diǎn)、能力等方面多個(gè)維度打上標(biāo)簽。學(xué)生在考完試后，根據(jù)題目答對(duì)或答錯(cuò)的情況，我們會(huì)個(gè)性化地分析出他在知識(shí)掌握方面的薄弱點(diǎn)，然后再進(jìn)一步為學(xué)生推薦一些針對(duì)性的強(qiáng)化訓(xùn)練，提供訓(xùn)練題目和學(xué)習(xí)資源，做個(gè)性化的學(xué)習(xí)。

　　個(gè)性化學(xué)習(xí)也是科大訊飛今年非常重視的一大戰(zhàn)略。業(yè)界也有很多其他公司在做。這種理念的基礎(chǔ)正是因材施教，節(jié)省學(xué)生大量時(shí)間，提高學(xué)生學(xué)習(xí)效率，有針對(duì)性地幫助學(xué)生針對(duì)薄弱點(diǎn)進(jìn)行學(xué)習(xí)，改變重復(fù)性海量刷題這種傳統(tǒng)、低效的學(xué)習(xí)方式。

第四，新高考業(yè)務(wù)。

　　主要包括面向新高考的排課與選課。新高考改革帶來(lái)了一些新課程，例如，針對(duì)「3+1+2」新模式（其中，3指“語(yǔ)、數(shù)、外”，1指“物理或歷史，2指“生物、化學(xué)、政治、歷史”這四門(mén)學(xué)科中的兩門(mén)，合計(jì)為高考科目），這種個(gè)性化組合，根據(jù)學(xué)生自己的能力去選擇，這是新高考改革帶來(lái)的一個(gè)變化，這樣的變化為教學(xué)過(guò)程帶來(lái)了一些困難，其中一項(xiàng)就是排課。

　　舊高考模式人工排課基本可以實(shí)現(xiàn)，但是這種組合一來(lái)以后，學(xué)生上的課不一樣，學(xué)校排課的難度會(huì)非常大，科大訊飛針對(duì)排課也設(shè)計(jì)了一套自動(dòng)排課算法，可以快速滿足學(xué)生學(xué)校這種排課的需求。

　　另外選哪些科目作為高考科目，也是學(xué)生和家長(zhǎng)普遍關(guān)心的問(wèn)題。新高考改革后，在選課之前，學(xué)生需要對(duì)生涯有一個(gè)清晰規(guī)劃。此前學(xué)生在高中階段可能對(duì)于后面自己想干什么，或者是大學(xué)里的專業(yè)設(shè)置情況并不知道，對(duì)于自己的能力和哪個(gè)專業(yè)會(huì)匹配、應(yīng)該學(xué)哪些課程也不太清楚。

　　我們通過(guò)測(cè)評(píng)，會(huì)做這樣的一個(gè)生涯規(guī)劃。通過(guò)各種測(cè)評(píng)，把學(xué)生的能力、興趣點(diǎn)測(cè)評(píng)出來(lái)，然后與大學(xué)里的生涯規(guī)劃匹配在一起，最終落實(shí)就可以幫助學(xué)生進(jìn)行課程的選擇。這使得學(xué)生在高中階段學(xué)習(xí)過(guò)程中就會(huì)很有目標(biāo)。

第五，綜合測(cè)評(píng)。

　　綜合測(cè)評(píng)主要是針對(duì)學(xué)校的綜合管理的一個(gè)測(cè)評(píng)。實(shí)際上在新高考的背景下，學(xué)�？赡軙�(huì)有些管理上的變革�？拼笥嶏w結(jié)合高考招生制度改革的迫切需要推出新一代綜合素質(zhì)評(píng)價(jià)系統(tǒng)。實(shí)現(xiàn)從指標(biāo)體系、評(píng)價(jià)工具、采集方案、誠(chéng)信體系到結(jié)果公示的全業(yè)務(wù)流程覆蓋。通過(guò)科學(xué)有效的內(nèi)容監(jiān)管和誠(chéng)信體系完整記錄學(xué)生過(guò)程性與終結(jié)性成長(zhǎng)數(shù)據(jù)；并集成自然語(yǔ)言理解、圖形圖像識(shí)別、數(shù)據(jù)可視化等人工智能和大數(shù)據(jù)技術(shù)，輔助教育主管部門(mén)科學(xué)決策；并形成教師、家庭及時(shí)反饋與有效干預(yù)的閉環(huán)體系，指導(dǎo)與促進(jìn)學(xué)生綜合素質(zhì)的全面提升與發(fā)展。

　　具體而言，我們需要構(gòu)建與區(qū)校常態(tài)化教育教學(xué)活動(dòng)結(jié)合的過(guò)程性與終結(jié)性成長(zhǎng)數(shù)據(jù)采集方案，開(kāi)展過(guò)程性評(píng)價(jià)和終結(jié)性評(píng)價(jià)，引進(jìn)學(xué)生、家長(zhǎng)、學(xué)校、第三方等多元評(píng)價(jià)主體，并能夠基于國(guó)家和區(qū)域標(biāo)準(zhǔn)提供評(píng)價(jià)結(jié)果的智能試算。從而科學(xué)、公平地開(kāi)展學(xué)生綜合素質(zhì)評(píng)價(jià)，促進(jìn)學(xué)生核心素養(yǎng)提升。

　　雷鋒網(wǎng)：智能評(píng)閱系統(tǒng)需要怎樣的技術(shù)能力支撐，從技術(shù)能力發(fā)展來(lái)看，整體市場(chǎng)現(xiàn)狀如何？

　　付瑞吉：首先，OCR其實(shí)是很關(guān)鍵的，也是一個(gè)基礎(chǔ)，我們可以通過(guò)OCR技術(shù)識(shí)別出學(xué)生寫(xiě)的比較潦草的文字，目前科大訊飛在這方面已經(jīng)能夠達(dá)到98%以上的識(shí)別率；其次，文字識(shí)別完后，是NLP文本處理的能力。

　　其次，整體來(lái)看，在NLP方面，閱讀理解這兩年的技術(shù)進(jìn)步是比較快的，國(guó)際上也有諸如SQuAD的比賽，引導(dǎo)研究機(jī)構(gòu)去參賽，使這塊的技術(shù)進(jìn)展較快。這其中的技術(shù)方案是可以用到我們智能評(píng)閱系統(tǒng)中的，幫助機(jī)器對(duì)于整篇作文宏觀語(yǔ)義的把握。

　　另外，再加上我們傳統(tǒng)的一些對(duì)于語(yǔ)言的應(yīng)用能力的平臺(tái)，諸如我演講中提到的各類修辭、表達(dá)方式、篇章結(jié)構(gòu)的分析，智能評(píng)閱系統(tǒng)就是將這樣的語(yǔ)言運(yùn)用能力綜合應(yīng)用起來(lái)。

　　現(xiàn)在整個(gè)市場(chǎng)的技術(shù)進(jìn)展是，在大規(guī)�？荚噲�(chǎng)景中，基本上可以達(dá)到實(shí)用水平，大規(guī)�？荚囍袑�(shí)際上也已有應(yīng)用。比較難的則是日常教學(xué)應(yīng)用中，實(shí)現(xiàn)批改反饋功能的難度較大。這里科大訊飛現(xiàn)在采用的是人機(jī)結(jié)合——機(jī)器自動(dòng)評(píng)閱的一些結(jié)果，再通過(guò)人工確認(rèn)，從而提高老師的工作效率。

　　雷鋒網(wǎng)：評(píng)閱系統(tǒng)評(píng)閱中英文作為這樣的主觀題需要怎樣的技術(shù)能力，AI模型如何訓(xùn)練？

　　付瑞吉：通過(guò)前面提到的文本分析技術(shù)可以得出作文的一些特征，然后另外一項(xiàng)重要工作是“定標(biāo)”。

　　每次大型考試以后（諸如數(shù)萬(wàn)人到數(shù)十萬(wàn)人規(guī)模的考試），我們可以拿出幾百份到一千份的樣卷讓專家打分。專家準(zhǔn)確評(píng)分的樣卷，我們可以用來(lái)訓(xùn)練智能評(píng)閱系統(tǒng)的算法模型，即將專家的評(píng)分標(biāo)準(zhǔn)“學(xué)”到我們的模型中。