基于中科信利場(chǎng)景分割引擎,將坐席和客戶(hù)的語(yǔ)音區別開(kāi)來(lái),是語(yǔ)音分析的首要步驟。可以給出坐席語(yǔ)音和用戶(hù)語(yǔ)音的分別時(shí)間段,并給出角色的判斷。
技術(shù)特點(diǎn):
場(chǎng)景分割分為四個(gè)階段,第一步進(jìn)行語(yǔ)音過(guò)濾,濾除彩鈴、振鈴、傳真等雜音;第二步進(jìn)行自動(dòng)分段分類(lèi),將客服對話(huà)語(yǔ)音分割成靜音和語(yǔ)音部分,并將語(yǔ)音部分按句進(jìn)行切分;第三步是進(jìn)行說(shuō)話(huà)人自動(dòng)聚類(lèi),將對話(huà)中的語(yǔ)音段分別聚類(lèi)成兩類(lèi)說(shuō)話(huà)人(客戶(hù)和坐席),第四步是進(jìn)行客戶(hù)與坐席代表的身份判別,從而實(shí)現對于客戶(hù)語(yǔ)音與坐席代表聲音的自動(dòng)分割。說(shuō)話(huà)人聚類(lèi)模塊采用層次聚類(lèi)算法。
能夠給出客服語(yǔ)音和用戶(hù)語(yǔ)音分別的句子起終點(diǎn)時(shí)間點(diǎn)信息。
性能指標:
