中文字幕无码久久精品,13—14同岁无码A片,99热门精品一区二区三区无码,菠萝菠萝蜜在线观看视频高清1

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 國(guó)內(nèi) >
 首頁(yè) > 資訊 > 國(guó)內(nèi) >

智能質(zhì)檢新實(shí)踐:“雙!辟|(zhì)檢

2020-03-05 16:52:24   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  上篇文章,我們介紹了新一代智能質(zhì)檢模式——基于深度學(xué)習(xí)技術(shù)的“非正則”質(zhì)檢落地應(yīng)用效果:在很多質(zhì)檢項(xiàng)上遠(yuǎn)超“關(guān)鍵詞+正則”的傳統(tǒng)模式,能多找出2~10倍數(shù)量的目標(biāo)通話,并且介紹了其工作原理與“關(guān)鍵詞+正則”的區(qū)別。
  隨著自然語(yǔ)言處理(NLP)領(lǐng)域技術(shù)的發(fā)展,以“非正則”質(zhì)檢模式為主、“關(guān)鍵詞+正則”模式為輔的方案已成為未來(lái)發(fā)展趨勢(shì)。兩種模式將長(zhǎng)期共存,因?yàn)樗鼈兏饔衅涓瞄L(zhǎng)做的事情、更適配的場(chǎng)景。
  “關(guān)鍵詞+正則”模式的2種適配場(chǎng)景
  在實(shí)際應(yīng)用中,“關(guān)鍵詞+正則”作為一種基礎(chǔ)質(zhì)檢模式,越來(lái)越難以滿足企業(yè)在質(zhì)檢效果和效率上的精細(xì)化需求。但是,這種模式也有它的優(yōu)勢(shì):上手快。
  當(dāng)企業(yè)提出一個(gè)新的、此前從未用過(guò)的質(zhì)檢項(xiàng)時(shí),質(zhì)檢項(xiàng)的標(biāo)準(zhǔn)尚未完全確定,因此可以用“關(guān)鍵詞+正則”模式先跑起來(lái),快速進(jìn)行探索和迭代。其后根據(jù)初步探索和迭代的結(jié)果,再判斷是否可以升級(jí)到基于深度學(xué)習(xí)技術(shù)的“非正則”模式。這是適配“關(guān)鍵詞+正則”模式的第一種場(chǎng)景。
  第二種場(chǎng)景:當(dāng)一個(gè)質(zhì)檢項(xiàng)命中的目標(biāo)通話量比較少,只有幾百甚至幾十條,就無(wú)法產(chǎn)生足夠的“正例”給機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,只能繼續(xù)采用“關(guān)鍵詞+正則”模式。這是一種被動(dòng)場(chǎng)景,也是比較常見的場(chǎng)景。
  還有一種場(chǎng)景比較特殊:有些質(zhì)檢項(xiàng)命中的目標(biāo)通話比較多,原則上可以用來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型,但是因?yàn)?ldquo;關(guān)鍵詞+正則”已經(jīng)得出不錯(cuò)的結(jié)果,既找得全(術(shù)語(yǔ)叫召回率高),又找得準(zhǔn)(術(shù)語(yǔ)叫準(zhǔn)確率高),兩個(gè)值都超過(guò)90%,那么暫時(shí)就不迫切需要升級(jí)到“非正則”質(zhì)檢模式了。比如很多企業(yè)需要的正向質(zhì)檢項(xiàng)——“禮貌問(wèn)候”,因?yàn)榭梢愿F舉出大部分“禮貌問(wèn)候”的用詞,用“關(guān)鍵詞+正則”模式就能得到雙90%的結(jié)果。
  不過(guò),這種場(chǎng)景非常少見。大部分情況下,“關(guān)鍵詞+正則”質(zhì)檢模式相比基于深度學(xué)習(xí)技術(shù)的“非正則”質(zhì)檢模式,在找全率和找準(zhǔn)率上有很大差距。
  “非正則”模式的2種適配場(chǎng)景
  在實(shí)際應(yīng)用中,基于深度學(xué)習(xí)技術(shù)的“非正則”質(zhì)檢模式(原理細(xì)節(jié)可參考上一篇文章),可以大幅提升質(zhì)檢效率,更好地解決企業(yè)質(zhì)檢任務(wù)的痛點(diǎn):傳統(tǒng)“關(guān)鍵詞+正則”的模式,很難找得全和找得準(zhǔn)目標(biāo)通話,大大影響工作效率——如果找不全,就意味著會(huì)遺漏很多目標(biāo)通話;如果找不準(zhǔn),就意味著在人工復(fù)檢時(shí)會(huì)浪費(fèi)大量人力。
  我們之前分享過(guò)實(shí)際對(duì)比的例子,貸后資產(chǎn)管理領(lǐng)域的基礎(chǔ)質(zhì)檢項(xiàng)“恐嚇威脅”,采用基于深度學(xué)習(xí)技術(shù)的“非正則”質(zhì)檢模式找出的違規(guī)通話量是“關(guān)鍵詞+正則”的9倍。
  考慮到在實(shí)際使用中,質(zhì)檢項(xiàng)與命中的目標(biāo)通話量之間的關(guān)系也存在“二八法則”——20%的質(zhì)檢項(xiàng)貢獻(xiàn)了80%的質(zhì)檢量,所以將質(zhì)檢量大的少數(shù)質(zhì)檢項(xiàng)升級(jí)到“非正則”模式,往往可以大幅提升整個(gè)質(zhì)檢任務(wù)的找全率和找準(zhǔn)率。這是“非正則”質(zhì)檢模式的第一種適配場(chǎng)景,也是主要的適配場(chǎng)景。
  第二種場(chǎng)景:某些質(zhì)檢項(xiàng),雖然從某一家企業(yè)的角度看,所命中的目標(biāo)通話量不算大,但是這個(gè)質(zhì)檢項(xiàng)是整個(gè)行業(yè)中較為成熟的、通用的質(zhì)檢項(xiàng),其他企業(yè)也都在用,那么就可以采用基于深度學(xué)習(xí)技術(shù)的“非正則”模式進(jìn)行模型訓(xùn)練。因?yàn)槠渌髽I(yè)都可以比較快速的復(fù)用或者經(jīng)過(guò)簡(jiǎn)單調(diào)整之后復(fù)用,所以“非正則”模式帶來(lái)的收益就更高。比如,消費(fèi)金融領(lǐng)域的正向質(zhì)檢項(xiàng)“提示逾期天數(shù)”;客服領(lǐng)域的負(fù)向質(zhì)檢項(xiàng)“暴露客戶隱私”等都是各自領(lǐng)域或行業(yè)通用的。
  與“關(guān)鍵詞+正則”質(zhì)檢模式相比,基于深度學(xué)習(xí)技術(shù)的“非正則”模式,不再需要既懂業(yè)務(wù)又懂正則的稀缺人才編寫規(guī)則和迭代規(guī)則,只需要普通人快速進(jìn)行數(shù)據(jù)標(biāo)注即可訓(xùn)練算法模型,而且通常能得到更好的效果。唯一顯著的缺陷就是,如果沒(méi)有數(shù)千條數(shù)據(jù),很難訓(xùn)練出效果好的模型。
  “雙模”質(zhì)檢,各司其職
  當(dāng)前階段,質(zhì)檢項(xiàng)應(yīng)該采取哪種模式,主要取決于該質(zhì)檢項(xiàng)產(chǎn)生的目標(biāo)通話量大小——通常數(shù)量大,才能快速標(biāo)注數(shù)據(jù)、訓(xùn)練出更好的算法模型,采用“非正則”模式,否則仍需要繼續(xù)使用“關(guān)鍵詞+正則”模式。
  其次也要考慮到質(zhì)檢項(xiàng)的成熟度——太新的、標(biāo)準(zhǔn)尚不明確的質(zhì)檢項(xiàng),適合先用“關(guān)鍵詞+正則”模式迭代起來(lái),再?zèng)Q定何時(shí)升級(jí)到基于深度學(xué)習(xí)技術(shù)的“非正則”模式。
  綜合來(lái)看,在實(shí)踐中采用“雙模”方案,讓兩種模式各司其職,可以最大程度提升質(zhì)檢效率。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)