音視頻內(nèi)容審核的行業(yè)困境
日前,多家互聯(lián)網(wǎng)應(yīng)用的音視頻業(yè)務(wù)被曝出涉黃、涉暴、涉政、違禁等不良內(nèi)容。平臺(tái)成了間接作惡工具,面臨約談、整頓、關(guān)停等違規(guī)處理,這給企業(yè)造成了難以估量的損失。而對(duì)音視頻平臺(tái)來說,針對(duì)海量內(nèi)容逐一審核絕非易事,目前主要面臨兩大行業(yè)難題:
首先,審核效率低下。平臺(tái)作為網(wǎng)絡(luò)服務(wù)提供者,視頻內(nèi)容大部分來自于用戶上傳,當(dāng)用戶達(dá)到一定基數(shù),每天百萬甚至千萬的視頻內(nèi)容,客觀上給審核帶來了極大困難。
其次,有害信息難以發(fā)現(xiàn)。對(duì)于嬌喘呻吟、辱罵語音識(shí)別、垃圾廣告,以及涉政、暴恐、特殊LOGO等不良內(nèi)容,不僅量大而且類型不一,從中排查這些危險(xiǎn)因素,需要較高的技術(shù)手段才能完成。
為解決行業(yè)痛點(diǎn),幫助客戶從源頭發(fā)現(xiàn)并杜絕這類不良信息,互聯(lián)網(wǎng)通信云廠商融云提供的音視頻審核服務(wù),可高效精準(zhǔn)地自動(dòng)識(shí)別違規(guī)內(nèi)容,保障平臺(tái)業(yè)務(wù)的穩(wěn)定運(yùn)營。尤其當(dāng)平臺(tái)有對(duì)消息及音視頻有雙重審核需求時(shí),融云可幫助企業(yè)一站式審核圖、文、音、視“全”內(nèi)容,有效解決多類型、海量信息難以甄別的問題。同時(shí),也幫客戶節(jié)省了對(duì)接第三方審核公司的商務(wù)溝通成本,以及研發(fā)適配所耗用的成本,為開發(fā)者及各互聯(lián)網(wǎng)平臺(tái)構(gòu)筑起綠色通信的護(hù)城河。
多維度音視頻審核能力,為不同業(yè)務(wù)場景提供安全保障
目前,融云提供的音視頻審核功能主要應(yīng)用在 1v1、1v多通話場景,會(huì)議場景以及直播場景。融云的客戶在使用 CallLib SDK 或 RTCLib SDK 實(shí)現(xiàn)音視頻通話、線上會(huì)議或直播等類型應(yīng)用后,可以把每個(gè)參與人的音頻、視頻數(shù)據(jù)發(fā)送至審核服務(wù),進(jìn)行內(nèi)容審核。
當(dāng)企業(yè)開通審核功能后,融云支持音視頻流自動(dòng)審核,審核結(jié)果會(huì)通過融云的回調(diào)服務(wù)發(fā)送到開發(fā)者的應(yīng)用服務(wù)器。具體來說,融云媒體服務(wù)器(RTC Server)會(huì)把收到的音視頻流轉(zhuǎn)碼成審核服務(wù)需要的格式(RTMP)來送審,不需要開發(fā)者轉(zhuǎn)碼或者截幀再去送審。在啟動(dòng)審核任務(wù)后,融云會(huì)按照一定的周期或在命中攔擊事件時(shí)把審核結(jié)果回調(diào)給用戶,幫助用戶方便地解析出審核結(jié)果,開發(fā)者可以根據(jù)審核結(jié)果決策是否需要斷開直播間主播推流,比如可以踢出主播或封禁主播。
圖1:融云音視頻審核服務(wù)架構(gòu)
在音頻審核功能方面,融云提供涉政語音識(shí)別、嬌喘語音識(shí)別、國歌識(shí)別、色情語音識(shí)別、辱罵語音識(shí)別、垃圾廣告識(shí)別六大審核維度;贐i-GRU、Attention模型、NAR模型,構(gòu)建混合深度神經(jīng)網(wǎng)絡(luò)模型等多個(gè)先進(jìn)手段,精準(zhǔn)識(shí)別各類場景中涉政人物、政治事件、反動(dòng)分裂、恐怖主義等百余種類型涉政音頻,精準(zhǔn)識(shí)別聲音中含有嬌喘、呻吟、耳騷、喊麥等違規(guī)音頻,對(duì)于音頻中含有色情、低俗、污穢、語愛等涉黃內(nèi)容也絕不放過。
在視頻審核功能方面,融云提供涉政視頻識(shí)別、色情視頻識(shí)別、暴恐視頻識(shí)別、廣告視頻識(shí)別、垃圾廣告識(shí)別、LOGO水印識(shí)別。尤其可以實(shí)時(shí)精準(zhǔn)識(shí)別和攔截各類場景的手機(jī)號(hào)、微信、QQ、微博、網(wǎng)址、二維碼等各種變體垃圾廣告內(nèi)容,并通過高精度LOGO水印檢測識(shí)別技術(shù),支持競品LOGO檢測、涉政LOGO檢測,維護(hù)客戶品牌形象。
融云音視頻審核四大優(yōu)勢(shì):精準(zhǔn)、靈活、全面、穩(wěn)定
根據(jù)開發(fā)者的使用調(diào)查反饋,融云的音視頻審核服務(wù)最大的特點(diǎn)是精準(zhǔn),除了審核能力精準(zhǔn),還能迅速精準(zhǔn)地定位問題源頭,縮短了問題排查的時(shí)間;同時(shí),審核模式靈活,支持靈活篩選審核對(duì)象,比如對(duì)指定房間,甚至指定用戶的送審,可添加個(gè)性化的審核維度,最重要的是產(chǎn)品功能性能穩(wěn)定,可用性99.9%,可應(yīng)對(duì)高并發(fā)的使用場景。此外,支持長達(dá)半個(gè)月的測試時(shí)間,讓客戶有充分的時(shí)間熟悉、了解相關(guān)功能,讓使用無后顧之憂。
具體來說,融云音視頻審核服務(wù)具備四大技術(shù)優(yōu)勢(shì):第一,從服務(wù)架構(gòu)上看,深度融合CNN、RNN、GAN、TDNN、LSTM等模型,違規(guī)識(shí)別準(zhǔn)確率高;第二,違規(guī)態(tài)勢(shì)實(shí)時(shí)追蹤,可實(shí)時(shí)監(jiān)測輿情趨勢(shì),動(dòng)態(tài)追蹤違規(guī)態(tài)勢(shì),增量模型小時(shí)級(jí)更新,幫助產(chǎn)品
快速迭代升級(jí);第三,全方位識(shí)別數(shù)百種涉政暴恐圖片、數(shù)十種色情圖片、各式各樣的變體廣告圖片等違規(guī)內(nèi)容,極大降低平臺(tái)監(jiān)管風(fēng)險(xiǎn);第四,超強(qiáng)彈性服務(wù),全球多集群部署,可秒極彈性擴(kuò)容,因此每日可承載數(shù)億級(jí)的海量音視頻審核請(qǐng)求。
復(fù)合的審核服務(wù),打造一站式“全”內(nèi)容審核能力
在實(shí)際應(yīng)用中,融云針對(duì)圖、文、音、視的“全”內(nèi)容,提供雙重審核服務(wù),將IM即時(shí)通訊審核與音視頻審核功能疊加,構(gòu)成“聯(lián)防聯(lián)控”的一站式內(nèi)容審核云服務(wù)產(chǎn)品,結(jié)合融云反垃圾與內(nèi)容安全經(jīng)驗(yàn),構(gòu)筑體系化、專業(yè)化的審核系統(tǒng),全面保障客戶通信云業(yè)務(wù)安全運(yùn)行。
圖2:融云IM 內(nèi)容審核服務(wù)
融云的IM內(nèi)容審核服務(wù)主要包括文本過濾、圖片過濾、音視頻文件過濾三類功能。其中,融云的文本過濾具有多語種識(shí)別能力,支持中文(簡繁體)、維語、藏語、英語、日語等。擁有毫秒級(jí)的響應(yīng)速度,通過機(jī)器學(xué)習(xí)、智能算法、語義分析等多維度對(duì)數(shù)據(jù)解析,識(shí)別準(zhǔn)確率可達(dá) 95% 以上。
融云的圖片過濾能力基于融云海量樣本庫,識(shí)別準(zhǔn)確率達(dá)90%以上,并且支持水印,傾斜,扭曲,異體等多種變形文字的提取識(shí)別,從而提高垃圾圖片過濾的準(zhǔn)確率。同時(shí)還可承受單日千萬級(jí)圖片數(shù)據(jù)的處理,支持?jǐn)?shù)據(jù)高峰時(shí)段彈性擴(kuò)容,檢測結(jié)果毫秒級(jí)返回。
融云的音視頻文件過濾能力可承載日均千萬級(jí)數(shù)據(jù)處理,檢測結(jié)果秒速返回;并支持場景化定制,多種模型組合訓(xùn)練,供手機(jī)號(hào)畫像、IP畫像等多并提維度判定,識(shí)別準(zhǔn)確率可達(dá)98%。
綜上,融云能夠精準(zhǔn)過濾文本、圖片、音視頻消息及音視頻流中的不良信息,幫助客戶有效規(guī)避運(yùn)營風(fēng)險(xiǎn),保證內(nèi)容平臺(tái)的健康安全,并且該服務(wù)提供機(jī)器審核和人工審核的雙重保障,用戶可根據(jù)自身情況同時(shí)使用,也可任選其一。
結(jié)語
由于各行各業(yè)通信云應(yīng)用對(duì)綠色通信都存在迫切的需求,融云的音視頻審核專門針對(duì)在音視頻通信中,對(duì)內(nèi)容有安全過濾和設(shè)防需求的客戶而設(shè)。同時(shí),音視頻審核功能與其圖文審核功能疊加復(fù)核,可全面過濾以及精準(zhǔn)識(shí)別所有通信形式中的內(nèi)容,構(gòu)成了一個(gè)審核閉環(huán)的防護(hù)體系,在解決企業(yè)對(duì)通信內(nèi)容安全痛點(diǎn)的同時(shí),讓業(yè)務(wù)運(yùn)行省心、省力,省成本。