7月6日,以“智見未來,護(hù)航AI”為主題的2024網(wǎng)易易盾AI數(shù)字內(nèi)容風(fēng)控大會(huì)在杭州順利舉行。會(huì)上,網(wǎng)易數(shù)智旗下網(wǎng)易易盾正式發(fā)布面向數(shù)字內(nèi)容風(fēng)控領(lǐng)域的安全大模型。
"安全是一個(gè)需要抬頭創(chuàng)新、低頭深耕的行業(yè)。數(shù)字內(nèi)容風(fēng)控這個(gè)網(wǎng)絡(luò)安全領(lǐng)域內(nèi)的細(xì)分賽道正在蓬勃發(fā)展,這次安全大模型的發(fā)布是我們多年來技術(shù)和經(jīng)驗(yàn)沉淀的‘集大成時(shí)刻’。”網(wǎng)易數(shù)智副總經(jīng)理、網(wǎng)易易盾總經(jīng)理朱浩齊在大會(huì)上帶來網(wǎng)易易盾自研安全大模型的首次正式亮相。
七年磨一劍:為安全范式轉(zhuǎn)變做準(zhǔn)備
在社會(huì)學(xué)著作《理解媒介》中,思想家麥克盧漢曾深刻、具體地揭示了媒介的影響力。
按照麥克盧漢的理論,媒介信息在很大程度上影響人間事物的尺度變化和模式變化,塑造人的組合方式和形態(tài)。因此,媒體是導(dǎo)致社會(huì)變動(dòng)的最強(qiáng)大力量之一。從報(bào)紙到電視廣播,再到網(wǎng)絡(luò)傳媒與數(shù)字時(shí)代的新媒體,作為信息和內(nèi)容的載體,媒介方式隨著技術(shù)變革在不斷進(jìn)化。與此同時(shí),麥克盧漢的理論在逐步得到證實(shí)。
數(shù)字內(nèi)容的安全問題不僅沒有隨著技術(shù)進(jìn)步消除,相反,對(duì)社會(huì)的影響正在逐年上升。
“我們?cè)诮?jīng)歷一場底層安全范式的轉(zhuǎn)變。信息傳播技術(shù)的進(jìn)步把內(nèi)容安全問題的重要性升級(jí)了,需求端從原先的附加安全發(fā)生了到內(nèi)生安全這一模式轉(zhuǎn)變。作為服務(wù)者,我們不僅需要從理論、技術(shù)和工具上做準(zhǔn)備,更需要從思維上主動(dòng)擁抱變革?!敝旌讫R在大會(huì)上說。
如今,人工智能技術(shù)的發(fā)展與應(yīng)用極大地提升了內(nèi)容生產(chǎn)的效率和質(zhì)量。通過自然語言處理(NLP)、機(jī)器學(xué)習(xí)、圖像識(shí)別等技術(shù),人工智能可以幫助企業(yè)自動(dòng)化地生成文章、視頻、圖像等內(nèi)容,甚至進(jìn)行個(gè)性化推薦和優(yōu)化,滿足用戶的多樣化需求。誠然,AIGC為企業(yè)與社會(huì)帶來內(nèi)容生產(chǎn)力的成倍增長,但也再次放大數(shù)字內(nèi)容安全的重要性。
從最開始服務(wù)于網(wǎng)易內(nèi)部業(yè)務(wù)的安全部門到服務(wù)外部客戶的完全商業(yè)化品牌,網(wǎng)易易盾既有天然的技術(shù)優(yōu)勢,又有豐富的的場景實(shí)踐經(jīng)驗(yàn)。
同時(shí),多年內(nèi)外部客戶的持續(xù)服務(wù)也讓網(wǎng)易易盾擁有了成熟的技術(shù)、產(chǎn)品與服務(wù)體系。網(wǎng)易易盾面向娛樂社交、游戲、電商、金融、零售、政企等多個(gè)行業(yè)相繼推出了解決方案,同時(shí)秉持“助力客戶內(nèi)生成長”的服務(wù)理念,持續(xù)上線AIGC內(nèi)容安全、出海安全合規(guī)、未成年人網(wǎng)絡(luò)保護(hù)等數(shù)十個(gè)場景化安全方案。
7年多的時(shí)間,網(wǎng)易易盾累計(jì)數(shù)據(jù)檢測量超3萬億,覆蓋終端數(shù)超32億,服務(wù)客戶審核效率提升超10倍。
網(wǎng)易易盾既是數(shù)字內(nèi)容風(fēng)控領(lǐng)域的頭部企業(yè),又是AI時(shí)代的先行者。率先參與到從附加安全到內(nèi)生安全的轉(zhuǎn)變,并以AI技術(shù)為安全業(yè)務(wù)賦能,給客戶提供更加專業(yè)的安全產(chǎn)品和服務(wù),進(jìn)而推動(dòng)行業(yè)發(fā)展——這在網(wǎng)易易盾總經(jīng)理朱浩齊看來,是義不容辭的責(zé)任,也是得天獨(dú)厚的市場先機(jī)。
因此,更懂?dāng)?shù)字內(nèi)容風(fēng)控的安全大模型正式發(fā)布了。
安全大模型:聚焦數(shù)字內(nèi)容風(fēng)控
在數(shù)字內(nèi)容安全問題治理的過程中,過去很長一段時(shí)間,更多的是憑借經(jīng)驗(yàn)。
在抖音上這句話能不能發(fā)?在小紅書上這個(gè)問題能不能搜到?在微博這個(gè)話題是否可以討論?然而落到個(gè)體對(duì)每次具體情況的理解不同,最終體現(xiàn)在安全風(fēng)控措施的理解上也非常不同。
在網(wǎng)易易盾成立的初期,曾有過一次深入的討論:我們能不能基于我們對(duì)各行業(yè)實(shí)際落地的經(jīng)驗(yàn),去建立各行業(yè)內(nèi)容風(fēng)控的標(biāo)準(zhǔn)?而在實(shí)際落地過程中,發(fā)現(xiàn)標(biāo)準(zhǔn)仍還是非常的粗糙,與以往并沒有根本性不同。
大模型的興起和應(yīng)用,使網(wǎng)易易盾這個(gè)想法真正具備可行性。早在2021年,網(wǎng)易易盾就開始著手研究大模型相關(guān)技術(shù),通過讓大模型學(xué)習(xí)理解不同場景下,不同內(nèi)容的評(píng)判結(jié)果,讓人工智能去建立各行各業(yè)、各個(gè)場景中內(nèi)容風(fēng)控的研判標(biāo)準(zhǔn),進(jìn)而完成數(shù)字內(nèi)容的精細(xì)化治理。
在這樣復(fù)雜的特定場景中,通用大模型顯然并不能提供符合需求的最優(yōu)解。
“數(shù)字內(nèi)容風(fēng)控是安全服務(wù)。安全,就要一絲一毫都不能差。我們給客戶提供的必須是我們自己都挑不出問題的完美方案。”朱浩齊講述了帶領(lǐng)團(tuán)隊(duì)開發(fā)安全垂直大模型時(shí)的原則和思路。
在大模型的“軍備競賽”中,網(wǎng)易易盾雖然有“行業(yè)領(lǐng)軍者”的自我要求,卻不急于將不夠完美的產(chǎn)品推向客戶?;谧陨順I(yè)務(wù)的特性,從客戶的需求和實(shí)際應(yīng)用場景出發(fā),再到小心翼翼地驗(yàn)證產(chǎn)品的每一個(gè)功能細(xì)節(jié),直到反復(fù)確認(rèn)沒有問題,可以解決客戶的問題——網(wǎng)易易盾的大模型之路走的每一步都是穩(wěn)字當(dāng)先。
應(yīng)用安全大模型的數(shù)字內(nèi)容風(fēng)控通過大模型對(duì)風(fēng)控尺度的理解,對(duì)風(fēng)險(xiǎn)內(nèi)容實(shí)現(xiàn)標(biāo)簽的自動(dòng)、精準(zhǔn)標(biāo)識(shí),提升人工審核效率。目前,基于各種場景的測試情況,網(wǎng)易易盾安全大模型已經(jīng)做到對(duì)部分色情疑難樣本召回提升30%以上,助力廣告對(duì)抗場景下的違法廣告識(shí)別率達(dá)到97%以上,AIGC人臉風(fēng)格化疑難案例的識(shí)別率超90%。此外,該安全大模型將風(fēng)險(xiǎn)對(duì)抗的時(shí)效提升到了小時(shí)級(jí),并且輔助真人引流團(tuán)伙檢出量增長達(dá)3倍。
同時(shí),在結(jié)合了網(wǎng)易易盾安全大模型的通用大模型問答場景中,基于安全大模型對(duì)用戶輸入的語義理解和對(duì)風(fēng)控規(guī)則的理解,能夠幫助各類通用大模型對(duì)于一些“看上去不好答”的題目,給予準(zhǔn)確的回答。除少數(shù)幾個(gè)極度敏感的議題外,幫助提供開放式問答的模型能夠快速做到“應(yīng)答盡答”。
以“模”治“?!保篈I時(shí)代的長遠(yuǎn)藍(lán)圖
生成式人工智能的發(fā)展始終伴隨著對(duì)安全的質(zhì)疑。
自ChatGPT引爆人工智能浪潮熱點(diǎn)后,世界各國紛紛緊急將生成式人工智能的安全管控上升至重要緊急議題。我國為了促進(jìn)生成式人工智能健康發(fā)展和規(guī)范應(yīng)用,發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,歐盟理事會(huì)批準(zhǔn)全球首部對(duì)人工智能進(jìn)行全面監(jiān)管的《人工智能法案》,美國發(fā)布一項(xiàng)名為關(guān)于安全、可靠和值得信賴的人工智能(AI)的相關(guān)行政令。
綜合世界各國政府部門與頂級(jí)智庫對(duì)于人工智能安全問題的判斷來看,大模型時(shí)代的安全面臨突出的問題在于數(shù)據(jù)安全、內(nèi)容安全,其中包括業(yè)務(wù)安全、供應(yīng)鏈安全、合規(guī)以及道德倫理風(fēng)險(xiǎn)。
其中,在當(dāng)下以及未來很長一段時(shí)間內(nèi),內(nèi)容安全問題會(huì)一直是人工智能治理的關(guān)鍵挑戰(zhàn)。社會(huì)需要關(guān)注的是大模型生成,如AI換臉的虛假違規(guī)內(nèi)容被利用為作惡工具,以及幻覺問題、知識(shí)模糊、不實(shí)新聞等。
“對(duì)人工智能的治理,長期來看,也許需要靠另一個(gè)人工智能了。”朱浩齊表達(dá)了對(duì)AI時(shí)代內(nèi)容安全問題治理趨勢的判斷,“人工智能給數(shù)字內(nèi)容生產(chǎn)和傳播效率帶來的是幾何倍數(shù)級(jí)別的增長,對(duì)于安全治理的能力提升要求自然也只有人工智能才能滿足?!?/p>
安全,不是一朝一夕的事情。尤其是全新技術(shù)帶來的既有“已知的未知”安全問題,也有“未知的未知”安全問題。為了解決各種“已知的未知”和“未知的未知”安全問題,網(wǎng)易易盾在大模型的研發(fā)思路中應(yīng)用了新設(shè)計(jì)的防御理論:內(nèi)生的彈性縱深防御體系。這個(gè)體系中有兩個(gè)最重要的設(shè)計(jì)原則:
一是用時(shí)間換精度。這個(gè)原則中考慮的并非某個(gè)時(shí)間點(diǎn)下系統(tǒng)的靜態(tài)防御能力,而是需要評(píng)估在持續(xù)的攻擊之下系統(tǒng)的自我升級(jí)能力,其稱之為“自免疫力”。
二是用不確定性提升防御強(qiáng)度。在測試數(shù)據(jù)變化的情況下,該原則要求通過提升自我保護(hù)能力實(shí)現(xiàn)系統(tǒng)對(duì)多次攻擊的穩(wěn)定防御。
用大模型治理大模型的數(shù)字內(nèi)容安全,用人工智能對(duì)抗人工智能帶來的安全風(fēng)險(xiǎn)。這是網(wǎng)易易盾對(duì)未來趨勢的判斷,也是網(wǎng)易易盾正在走的安全技術(shù)長征。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 復(fù)利時(shí)代,大廠人開始轉(zhuǎn)向儲(chǔ)蓄險(xiǎn)
- 扎根業(yè)務(wù),這個(gè)618商業(yè)智能體先跑起來
- 科大訊飛董事長劉慶峰司慶講話透露,7月將升級(jí)訊飛星火X1
- 金融科技的AI新進(jìn)化
- 臺(tái)積電真牛!它說一別人不能說二,ASML光刻機(jī)無處賣
- 科大訊飛董事長劉慶峰司慶講話透露:7月將升級(jí)訊飛星火X1
- @韋東奕不可復(fù)制:大眾造神、流量狂歡、平臺(tái)招牌
- 星鏈衛(wèi)星突然大批墜落,美國的太空霸權(quán)拗不過宇宙的力量
- 傳音手機(jī)要狠補(bǔ)AI這把刀
- AI,讓產(chǎn)業(yè)互聯(lián)網(wǎng)成真
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。