音視頻的多媒體化,正在撬動大量用戶的原創(chuàng)熱情,但由此產生的海量內容卻帶來新的難題。
一方面,由用戶端產生的內容(UGC)跨度廣泛,質量參差不齊;
另一方面,部分打“擦邊球”、違規(guī)內容,蒙混在海量音視頻中,也進一步加劇了內容審核者的挑戰(zhàn)。
對于網(wǎng)絡上傳播的色情惡意內容,圖像鑒黃技術很好的打擊了大部分色情圖像和視頻內容,而在一些短視頻、直播等場景中,還有一些色情內容以音頻方式傳播,用以規(guī)避圖像維度的打擊。
因此騰訊云安全天御研發(fā)了基于音頻的鑒黃系統(tǒng),讓騰訊云的整套鑒黃解決方案更具突破性,目前該系統(tǒng)已在騰訊云的點播、直播等業(yè)務中上線使用,進一步提高色情內容檢出率。
該色情音頻鑒黃系統(tǒng)目前日處理音視頻超過1億條,每日識別數(shù)十萬條色情音視頻,準確率95%以上。
先做個選擇題,根據(jù)以下兩張語譜圖,猜猜哪張是色情尖叫聲?
圖A
圖B
雙管齊下,顯著提升直播平臺色情音頻實時檢出率
看似正常的語譜圖,實際卻是色情尖叫聲。
目前音頻鑒黃面臨以下技術難點:
1. 音頻內容和場景多樣,常常伴有周圍噪聲和背景音樂等,信噪比較低;
2. 大部分音頻時長較短,信息量不足;
3. 信道復雜,語音質量參差不齊,常見截頻截幅等情況。
針對以上問題,騰訊云采用高效的 i-vector 系統(tǒng)保證較長音頻正確快速檢出,同時對信息量不足的短音頻采用 DNN embedding 系統(tǒng)進行特定檢出,兩者互為補充,加上多種信道補償算法的融合,同時保證了系統(tǒng)的識別性能和高實時率。
在業(yè)務量巨大的情況下,騰訊云基于變長統(tǒng)計和深度學習混合的鑒黃系統(tǒng)達到單線50倍速于原始音頻流的高實時率。也就是說:1秒的音頻,騰訊云0.02秒就能識別。
[ 音頻鑒黃系統(tǒng)框圖 ]
騰訊云的音頻鑒黃系統(tǒng)基于海量數(shù)據(jù)訓練得到,對于每條業(yè)務音頻,系統(tǒng)首先會通過靜音檢測去掉其中的靜音部分,將保留下來的有效音頻內容進行聲學特征提取。
由于每條音頻的時長不同,基于統(tǒng)計量和深度神經(jīng)網(wǎng)絡的音頻識別模型將不同長度的音頻特征轉換為統(tǒng)一維度的音頻表征信息。
最后再與系統(tǒng)中的色情模型與正常模型相比對,經(jīng)過分數(shù)融合得到最終的識別結果 。
海量正負樣本訓練,讓色情尖叫聲悄然無存
音頻鑒黃系統(tǒng)離不開海量的正負樣本訓練,樣本標注看似簡單,但實際操作起來卻并不容易:
1、對于色情音頻的定義,不同于語種說話人等有一個明顯的定義,不同的人對色情內容理解會有偏差,一條音頻在 A 聽來是色情內容,在 B 聽來可能只是在惡搞。
2、色情作為一種人為定義的類別,而聲音是一種生物特征。同屬于色情類別的聲音可能從生物特征上來看差別巨大(像色情尖叫聲和吮吸聲),強制分為一類可能會導致訓練不收斂的情況,并影響識別準確率。這就需要在標注時做細化工作,在色情與非色情之下再給出更精細化的標簽。
基于以上幾點,騰訊云在正負樣本的標注中盡可能做到多標簽區(qū)分,比如色情尖叫聲、喘息聲、吮吸聲,專業(yè) AV、UGC 視頻等,以確保訓練的模型能夠有效的區(qū)分正常和色情音頻,常見的標注如下:
[ 色情音頻樣本標注 ]
在長期的細化與標注工作中,騰訊云累積了一套多標簽色情尖叫聲、喘息聲長達上萬小時的色情音頻數(shù)據(jù)集,用于音頻鑒黃系統(tǒng)的訓練提升;
同時,針對線上的識別數(shù)據(jù)也持續(xù)進行人工抽檢覆蓋和漏過情況,并將正負樣本進行標注用于系統(tǒng)優(yōu)化,讓音頻鑒黃系統(tǒng)更智能。
音頻鑒黃技術由騰訊云安全天御打造,在文本、圖片鑒黃的基礎上為騰訊云的客戶提供更全面的技術支持。
目前騰訊云的音頻鑒黃系統(tǒng)已經(jīng)在多個業(yè)務場景上使用,但由于場景需求的復雜性,仍有很多困難與挑戰(zhàn)并存。緊跟音頻分類相關領域的最新技術趨勢,同時利用海量業(yè)務數(shù)據(jù)的優(yōu)勢進一步提高系統(tǒng)性能和速度,是騰訊云下一步的發(fā)展方向。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。