您的位置: 首頁 > 新聞 > 高新技術(shù) > 新聞詳情

阿里AI鑒黃師上線:一日鑒圖數(shù)億張 能聽懂外語和方言

時間:2018-08-20 08:12:24
  • 來源:mydrivers
  • 作者:mydrivers
  • 編輯:landother

以往靠鑒黃圖拿工資的人工鑒黃師,他們的工作可能要“涼涼”了。

近日,阿里AI鑒黃語音反垃圾服務(wù)上線公測,能識別語音中存在的涉黃、廣告等違規(guī)信息。這意味著,除識別色情圖片、色情視頻和色情文字外,涉黃語音也能通過AI鑒別了。

以往,傳統(tǒng)的人工鑒黃師通過一雙肉眼鑒別色情圖片和視頻。聽起來像是“福利”,但實際上并不輕松。如今,伴隨著互聯(lián)網(wǎng)上社交媒體、直播、短視頻的發(fā)展,每天光上傳的圖片超過10億張,發(fā)文數(shù)量超過5億條,不少色情、暴力等內(nèi)容充斥其中。人工鑒黃師一天一人審核1萬張圖片的工作量,遠(yuǎn)遠(yuǎn)滿足不了這一需求。

2015年10月,阿里巴巴“綠網(wǎng)”上線,用人工智能識別網(wǎng)絡(luò)上包括色情、暴力在內(nèi)的違規(guī)信息,阿里AI鑒黃師應(yīng)運而生。通過人工智能、深度學(xué)習(xí)和大數(shù)據(jù)樣本等技術(shù),阿里巴巴的AI鑒黃師訓(xùn)練識別千萬張正常圖片與色情圖片,最終生成一個智能鑒黃模型。

“我們要做的就是拿圖片去‘喂養(yǎng)’它,讓它不斷學(xué)習(xí),變得越來越聰明?!?阿里巴巴安全部高級算法工程師威視介紹:“最初在獲取樣本時,我們篩選了近2000網(wǎng)站、6000多萬色情圖片,經(jīng)過去重,標(biāo)注1300多萬張高質(zhì)量的色情圖片,可以說這是AI鑒黃最重要的一塊基石?!?

阿里安全,一向致力于解決社會問題,可以說,高效率、低成本的阿里AI鑒黃技術(shù),正將人工鑒黃師逐漸解放出來。威視表示:AI鑒黃師每天可審核數(shù)億張圖片,識別準(zhǔn)確率高于99.5%。舉個例子,一天要審核4億張圖片的話,單純由人工來審,一人一天審1萬張,需要4萬人,而AI鑒黃只需將其中20萬張可疑的圖片篩出來,由人工再審一道,這需要20人即可。

更厲害的是,阿里AI鑒黃師不僅能鑒別黃片黃圖,連帶有情色信息的語音內(nèi)容都能識別。近期上線公測的AI語音鑒黃反垃圾服務(wù),可支持中文、日文、英文等多國語言,還支持東北、四川、廣東等地方言。無語義的呻吟聲也能識別出來。8月21日在北京召開的2018年網(wǎng)絡(luò)安全生態(tài)峰會上,這些成果將集中展示。

當(dāng)然,AI鑒黃并不能完全取代人工鑒黃,相比人工審核,機器還很難理解內(nèi)容背后的深意?!白罴训膶徍朔绞绞侵悄転橹?,人工為輔。人工鑒黃師群體數(shù)量少了,目前主要做打標(biāo)和審查可疑圖片的工作?!卑⒗锇踩慨a(chǎn)品專家念夏說。

0

玩家點評 0人參與,0條評論)

收藏
違法和不良信息舉報
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運營游戲推薦 更多+