
1、基于人工標注的評價(jià)
基于問(wèn)答知識庫來(lái)回答的系統,回答能力受限于知識庫的豐富程度,也就是說(shuō)知識庫對用戶(hù)問(wèn)題的覆蓋率,覆蓋率越高,準確性越高。
因此并非能回答用戶(hù)的所有問(wèn)題,系統最佳的狀態(tài)是將能回答的全部回答準確,不能回答的全部拒識,即拒絕回答。
因此這里的評價(jià)指標包括有問(wèn)題解決率、拒識率、召回率和準確率等,
召回率=機器人能回答的問(wèn)題數/問(wèn)題總數
準確率=機器人正確回答的問(wèn)題數/問(wèn)題總數
問(wèn)題解決率=機器人成功解決的問(wèn)題數/問(wèn)題總數
拒識率=機器人未回答問(wèn)題數/用戶(hù)問(wèn)題數
通過(guò)從每日的全量數據集中抽樣出一個(gè)小數據集,保證小數據集的數據分布盡量符合全量數據集,然后由標注團隊對數據集做標注,標注出每個(gè)問(wèn)題的實(shí)際答案,一般標注完成后還有質(zhì)檢的環(huán)節,以保證標注結果盡量準確,這樣便生成了每日數據的標準評測集。
2、基于用戶(hù)反饋的評價(jià)
人工評價(jià)能夠評價(jià)智能客服系統的準確率,但是答案是否合理,能否為用戶(hù)解決問(wèn)題,需要用戶(hù)去反饋評價(jià),整個(gè)智能客服系統的最終目標是幫助用戶(hù)解決問(wèn)題。
最終統計參評比例、滿(mǎn)意度等指標,這些指標能夠真正反應智能客服系統的好壞。實(shí)際中往往用戶(hù)參評比例低,可以使用各種方法去刺激用戶(hù)評價(jià)。
以上就是能夠得到一個(gè)客服系統最真實(shí)好壞的方法。長(cháng)沙朗深技術(shù)升級的智能客服系統在長(cháng)久的實(shí)踐中得到了廣大用戶(hù)的不斷好評。如果你也有客服系統需要進(jìn)行智能升級,朗深技術(shù)的呼叫中心智能升級套件是一個(gè)非常好的選擇。只需要在原先的呼叫中心基礎上利用呼叫中心套件,將智能呼叫中心功能添加進(jìn)去即可。