如何讓程序更懂新冠病毒,從而幫助病人進(jìn)行有意義的醫療對話(huà)?
加州大學(xué)圣地亞哥分校、卡內基梅隆大學(xué)和加州大學(xué)戴維斯分校研究人員提出了利用人工智能聊天機器人來(lái)解決這個(gè)問(wèn)題。目前他們的研究已經(jīng)發(fā)表在預印本網(wǎng)站上。根據他們的研究,該聊天機器人可以對患者就有關(guān)新冠病毒的問(wèn)題做出回應。
“在這項工作中,我們首次嘗試開(kāi)發(fā)可以提供有關(guān)新冠病毒的醫學(xué)咨詢(xún)對話(huà)系統。實(shí)驗結果表明,這些經(jīng)過(guò)訓練的模型有望就新冠病毒產(chǎn)生具有臨床意義的高質(zhì)量咨詢(xún)。”研究人員在論文中稱(chēng)。
據悉,整個(gè)團隊用英語(yǔ)和中文數據集訓練了支持這些聊天機器人的算法模型。數據集內容包含醫生與患者之間談?wù)撔鹿诓《镜膶υ?huà),研究人員稱(chēng)實(shí)驗證明這個(gè)模型對進(jìn)行有益的醫學(xué)對話(huà)很有希望。
具體來(lái)說(shuō),研究人員在CovidDialog數據集訓練了集中對話(huà)模型,模型則來(lái)自在線(xiàn)醫療論壇。整個(gè)數據集包括603次英文數據,1088次中文數據。每次對話(huà)均以簡(jiǎn)短描述患者的醫療狀況開(kāi)始,然后是患者與醫生之間的對話(huà),并且視情況提供醫生給出的診斷和治療建議。
論文合作者稱(chēng),他們基于谷歌的Transformer架構、OpenAI的GPT、BERT-GPT三方面來(lái)訓練模型。由于在相對較小的數據集上直接訓練模型會(huì )導致結果的泛化性,所以該團隊利用了轉移學(xué)習技術(shù)。即先在大型語(yǔ)料庫上對模型進(jìn)行預訓練,然后再在CovidDialog數據集上進(jìn)行微調。預訓練的語(yǔ)料庫則主要來(lái)自Reddit用戶(hù)、維基百科、中文聊天機器人、新聞、書(shū)籍、故事和其他網(wǎng)絡(luò )文本。
經(jīng)過(guò)訓練后,對三種方法下訓練模型進(jìn)行測試,來(lái)評估機器的表現。評估標準包括混亂程度,用來(lái)判斷機器人響應的質(zhì)量和是否流暢;熵和距離,用來(lái)衡量詞匯的多樣性。最后結果顯示,利用BERT-GPT框架來(lái)懸鏈的模型,能對患者的問(wèn)題進(jìn)行回答,提供的答案更具相關(guān)性、信息量和人性化,并且語(yǔ)法和語(yǔ)義表達正確。
目前,研究人員已經(jīng)將數據集和代碼在網(wǎng)上進(jìn)行開(kāi)源。