吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)源鑒黃AI新鮮出爐:代碼+預(yù)訓(xùn)練模型,附手把手入門教學(xué)

jmiy_worldofai ? 來(lái)源:YXQ ? 2019-04-16 16:40 ? 次閱讀

要入門機(jī)器學(xué)習(xí),一個(gè)自己感興趣又有豐富數(shù)據(jù)的領(lǐng)域再好不過(guò)了。

今天我們就來(lái)學(xué)習(xí)用Keras構(gòu)建模型,識(shí)別NSFW圖片,俗稱造個(gè)鑒黃AI

資源來(lái)自一名印度小哥Praneeth Bedapudi,涉及圖像分類和目標(biāo)檢測(cè)兩個(gè)科目。他在GitHub上最新發(fā)布了NudeNet項(xiàng)目,包含代碼和兩個(gè)預(yù)訓(xùn)練模型:負(fù)責(zé)識(shí)別露不露的圖像分類模型和負(fù)責(zé)找出關(guān)鍵部位(以便打碼)的目標(biāo)檢測(cè)模型。

圖像分類模型很簡(jiǎn)單,能區(qū)分兩個(gè)類別:nude和safe,也就是露和不露,堪比經(jīng)典的hotdog/not hotdog。

目標(biāo)檢測(cè)模型則能檢測(cè)6個(gè)類別:不分性別的腹部、臀部,和區(qū)分了性別的不可描述部位。

資源鏈接全在文末,我們先來(lái)學(xué)習(xí)一番。

圖像分類從數(shù)據(jù)集開(kāi)始

構(gòu)建一個(gè)圖像二分類模型,需要數(shù)據(jù)集當(dāng)然也要包含兩類圖像。所以,第一項(xiàng)任務(wù)就是分別搜集露的圖片(nude)和不露的圖片(safe)。

不安全的nude圖片來(lái)自三處:

一是用RipMe從website scrolller下載,這些圖片來(lái)自Reddit論壇的各種NSFW板塊;

圖片來(lái)源:https://scrolller.com/nsfw(打開(kāi)請(qǐng)慎重)

下載工具:https://github.com/RipMeApp/ripme

二是P站的縮略圖。引入這些縮略圖是為了平衡圖片質(zhì)量——上邊的的Reddit圖片質(zhì)量太高了,而一個(gè)鑒黃AI,在現(xiàn)實(shí)中遇到的圖片大多是渣品質(zhì),這就需要分辨率很低的縮略圖來(lái)平衡。

三是之前廣為流傳的同類數(shù)據(jù)集,來(lái)自alexkimxyz。

原數(shù)據(jù)集的5個(gè)類別,被映射到現(xiàn)在的兩類之中。hentai和porn屬于nude,而drawings、neutral和sexy屬于safe。

搜集好數(shù)據(jù)之后,進(jìn)行標(biāo)準(zhǔn)化和去重:

#Resizingandremovingduplicatesmogrify-geometryx320*fdupes-rdN./

最終得到的不安全圖片1,78,601張P站圖片、1,21,644張Reddit圖片和1,30,266張前輩數(shù)據(jù)集圖片。

安全的圖片則有三個(gè)來(lái)源,一是alexkimxyz數(shù)據(jù)集中的普通圖片;二是Facebook資料;三是Reddit論壇上那些老少皆宜的板塊。

為什么已經(jīng)有了現(xiàn)成的數(shù)據(jù)集,還需要去后兩個(gè)來(lái)源抓取呢?

因?yàn)樾「绨l(fā)現(xiàn),前輩收集的安全圖片,有很多根本就不包含人。用這樣的數(shù)據(jù)訓(xùn)練,模型很可能學(xué)到錯(cuò)誤的特征,沒(méi)學(xué)會(huì)判斷“露不露”,直接變成了一個(gè)“有沒(méi)有人”分類器。

最終得到的安全圖片中,有68,948張來(lái)自Facebook資料、98,359張來(lái)自前輩數(shù)據(jù)集、55,137張來(lái)自Reddit。

數(shù)據(jù)收集完畢,接下來(lái)要進(jìn)行數(shù)據(jù)增強(qiáng)。這里用的是Augmentor和Keras自帶的fit_generator。

Augmentor地址:https://github.com/mdbloice/Augmentor

使用的代碼如下:

#Randomrotation,flips,zoom,distortion,contrast,skewandbrightnesspipeline.rotate(probability=0.2,max_left_rotation=20,max_right_rotation=20)pipeline.flip_left_right(probability=0.4)pipeline.flip_top_bottom(probability=0.8)pipeline.zoom(probability=0.2,min_factor=1.1,max_factor=1.5)pipeline.random_distortion(probability=0.2,grid_width=4,grid_height=4,magnitude=8)pipeline.random_brightness(probability=0.2,min_factor=0.5,max_factor=3)pipeline.random_color(probability=0.2,min_factor=0.5,max_factor=3)pipeline.random_contrast(probability=0.2,min_factor=0.5,max_factor=3)pipeline.skew(probability=0.2,magnitude=0.4)

訓(xùn)練與評(píng)估

小哥為這個(gè)任務(wù)選擇了谷歌出品的Xception模型,直接從Keras使用,輸入256x256尺寸的圖片,批次大小設(shè)為32。

而訓(xùn)練的設(shè)備,是從vast.ai租來(lái)的云服務(wù)器,帶一塊GTX 1080Ti顯卡。

Keras提供的圖像分類模型有個(gè)問(wèn)題:不帶正則化。所以,還要用下面的代碼,為每一層加上正則化(dropout或L2)。

#Forl2forlayerinmodel.layers:layer.W_regularizer=l2(..)#OrfordropoutadddropoutbetweenthefullyconnectedlayersandredefinethemodelusingfunctionalAPI.

使用SGD with momentum訓(xùn)練,模型可以在alexkimxyz數(shù)據(jù)集上收斂到0.9347的準(zhǔn)確率。

訓(xùn)練完成后,他選擇了Towards Data Science之前構(gòu)建的一個(gè)測(cè)試集來(lái)測(cè)試模型性能。

測(cè)試集:https://drive.google.com/drive/folders/18SY4oyZgTD_dh8-dc0wmsl1GvMsA7woY

測(cè)試成績(jī)?nèi)缦拢?/p>

目標(biāo)檢測(cè)還是從數(shù)據(jù)集開(kāi)始

訓(xùn)練目標(biāo)檢測(cè)模型需要的數(shù)據(jù)集,和圖片分類可不一樣。分類只需要圖片和類別,而目標(biāo)檢測(cè)需要的,是用邊界框標(biāo)注了某樣?xùn)|西位置的圖片。

因此,上邊講過(guò)的數(shù)據(jù)集不能用了,新科目的數(shù)據(jù)集來(lái)自Jae Jin的團(tuán)隊(duì),包含5789張圖片,各種標(biāo)注的分布如下:

其實(shí)也就是模型能檢測(cè)出的六類目標(biāo)。

數(shù)據(jù)集沒(méi)有公開(kāi),作者在這里:https://github.com/Kadantte

有了數(shù)據(jù),還是要做一些圖像增強(qiáng)工作,隨機(jī)加入一些模糊、翻轉(zhuǎn)。使用的工具是albumentations:

https://github.com/albu/albumentations

訓(xùn)練與評(píng)估

這里的檢測(cè)模型,選擇的是FAIR推出的RetinaNet,它使用焦點(diǎn)損失(交叉熵?fù)p失的一種變體)來(lái)增強(qiáng)一階目標(biāo)檢測(cè)的性能。

檢測(cè)模型的基干使用了ResNet-101,在測(cè)試集上的成績(jī)?nèi)缦拢?/p>

除了用來(lái)指出某個(gè)部位究竟出現(xiàn)在了圖中什么位置之外,這個(gè)模型其實(shí)還可以當(dāng)成分類器來(lái)用:

如果在圖中檢測(cè)到了BUTTOCKS_EXPOSED、*_GENETALIA_EXPOSED、F_BREAST_EXPOSED這四類,就可以判定圖片NSFW,如果沒(méi)有,這張圖就是安全的。

所以,也可以用分類器的測(cè)試集來(lái)檢測(cè)這個(gè)模型的性能。

得到的成績(jī),比純粹的分類器好不少:

當(dāng)然,目標(biāo)檢測(cè)更適合實(shí)現(xiàn)的功能,是打碼。比如說(shuō)見(jiàn)到一張NSFW圖片,它就可以根據(jù)檢測(cè)到的關(guān)鍵部位,自動(dòng)遮擋:

預(yù)訓(xùn)練模型怎么用?

如果你想先用預(yù)訓(xùn)練模型看看效果,可以按照下面的安裝指南來(lái):

安裝:

pipinstallnudenetorpipinstallgit+https://github.com/bedapudi6788/NudeNet

使用分類器:

fromnudenetimportNudeClassifier

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31536

    瀏覽量

    270347
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3408

    瀏覽量

    42714

原文標(biāo)題:開(kāi)源鑒黃AI新鮮出爐:代碼+預(yù)訓(xùn)練模型,還附手把手入門教

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    手把手教你學(xué)單片機(jī)之AVR入門視頻教程

    `手把手教你學(xué)單片機(jī)之AVR入門視頻教程AVR單片機(jī)軟硬件設(shè)計(jì)視頻教程-入門篇本視頻是 力天電子 尹延輝 錄制的 詳情請(qǐng)登 力天電子第01講-單片機(jī)及其開(kāi)發(fā)工具簡(jiǎn)介_(kāi)手把手教你學(xué)單片機(jī)
    發(fā)表于 03-02 11:04

    力天手把手教你學(xué)ARM入門代碼

    力天手把手教你學(xué)ARM入門代碼
    發(fā)表于 08-12 20:26

    【原創(chuàng)】小草手把手教你LabVIEW視頻系列匯總帖(12.22更新)

    為了讓大家更好的查找小草手把手教你LabVIEW視頻教學(xué)系列,小編特為大家匯總?cè)缦拢骸疽曨l教學(xué)】小草手把手LabVIEW編程—LED滾動(dòng)屏【視頻教學(xué)
    發(fā)表于 12-08 10:10

    手把手教你設(shè)計(jì)人工智能芯片及系統(tǒng)--(全階設(shè)計(jì)教程+AI芯片F(xiàn)PGA實(shí)現(xiàn)+開(kāi)發(fā)板)

    核心RTL代碼、工具鏈代碼、測(cè)試代碼等;手把手教學(xué)手把手
    發(fā)表于 07-19 11:54

    手把手教你SIMULINK代碼生成

    FrancisZhao:專欄文章列表以及一些說(shuō)明?zhuanlan.zhihu.comFrancisZhao:手把手教你代碼生成(下):SIMULINK代碼生成?zhuanlan.zhihu.com
    發(fā)表于 08-18 06:03

    美女手把手教你如何裝機(jī)(下)

    美女手把手教你如何裝機(jī)(下) 接著下來(lái)就是今天的重頭戲,開(kāi)核蘿!~
    發(fā)表于 01-27 11:16 ?2933次閱讀

    手把手教你安裝Quartus II

    本章手把手把地教你如何安裝 Quartus II 軟件 ,并將它激活 。此外 還有USB -Blaster下載器的驅(qū)動(dòng)安裝步驟 。
    發(fā)表于 09-18 14:55 ?9次下載

    DSP開(kāi)發(fā)軟件及工具介紹--力天手把手教你學(xué)DSP之入門

    DSP開(kāi)發(fā)軟件及工具介紹--力天手把手教你學(xué)DSP之入門
    發(fā)表于 10-20 14:50 ?18次下載
    DSP開(kāi)發(fā)軟件及工具介紹--力天<b class='flag-5'>手把手</b>教你學(xué)DSP之<b class='flag-5'>入門</b>篇

    手把手教學(xué)Ansoft-Maxwell-工程仿真實(shí)例

    手把手教學(xué)Ansoft-Maxwell-工程仿真實(shí)例
    發(fā)表于 01-18 16:06 ?33次下載

    手把手教你如何開(kāi)始DSP編程

    手把手教你如何開(kāi)始DSP編程。
    發(fā)表于 04-09 11:54 ?12次下載
    <b class='flag-5'>手把手</b>教你如何開(kāi)始DSP編程

    手把手教你學(xué)LabVIEW視覺(jué)設(shè)計(jì)

    手把手教你學(xué)LabVIEW視覺(jué)設(shè)計(jì)手把手教你學(xué)LabVIEW視覺(jué)設(shè)計(jì)手把手教你學(xué)LabVIEW視覺(jué)設(shè)計(jì)手把手教你學(xué)LabVIEW視覺(jué)設(shè)計(jì)手把手
    發(fā)表于 03-06 01:41 ?3183次閱讀

    手把手教你開(kāi)關(guān)電源PCB排板

    手把手教你開(kāi)關(guān)電源PCB排板(新型電源技術(shù))-分享一下開(kāi)關(guān)電源PCB排板的基本要點(diǎn)及分析,以及例子講解。絕對(duì)的手把手
    發(fā)表于 09-18 12:27 ?58次下載
    <b class='flag-5'>手把手</b>教你開(kāi)關(guān)電源PCB排板

    51單片機(jī)手把手教學(xué)(二)—— 點(diǎn)亮 LED 燈(GPIO 操作)

    本文章 來(lái)自原創(chuàng)專欄《51單片機(jī)手把手教學(xué)》,講解如何使用 Keil uVision 構(gòu)建 51單片機(jī) 程序,發(fā)布文章并 會(huì)持續(xù)為已發(fā)布文章添加新內(nèi)容! 每篇文章都經(jīng)過(guò)了精打細(xì)磨!↓↓↓通過(guò)下方
    發(fā)表于 11-17 16:06 ?8次下載
    51單片機(jī)<b class='flag-5'>手把手</b><b class='flag-5'>教學(xué)</b>(二)—— 點(diǎn)亮 LED 燈(GPIO 操作)

    51單片機(jī)手把手教學(xué) (一)—— 開(kāi)發(fā)環(huán)境搭建

    51單片機(jī)手把手教學(xué) (一)—— 點(diǎn)亮第一個(gè)LED燈文章目錄51單片機(jī)手把手教學(xué) (一)—— 點(diǎn)亮第一個(gè)LED燈一、寫(xiě)在前面二、下載開(kāi)發(fā)工具,燒錄工具一、寫(xiě)在前面51單片機(jī)一般指?jìng)鹘y(tǒng)8
    發(fā)表于 11-23 16:20 ?8次下載
    51單片機(jī)<b class='flag-5'>手把手</b><b class='flag-5'>教學(xué)</b> (一)—— 開(kāi)發(fā)環(huán)境搭建

    什么是預(yù)訓(xùn)練 AI 模型

    預(yù)訓(xùn)練 AI 模型是為了完成特定任務(wù)而在大型數(shù)據(jù)集上訓(xùn)練的深度學(xué)習(xí)模型。這些
    的頭像 發(fā)表于 04-04 01:45 ?1529次閱讀
    澳门百家乐官网信誉| 大发888官网客服| 最好的百家乐官网博彩网站| 百家乐国际娱乐场开户注册| 百家乐官网怎么压对子| 现场百家乐的玩法技巧和规则| 真人百家乐官网ea平台| 闲和庄百家乐娱乐平台| 百家乐官网平台哪个有在线支付呢 | 万宝路百家乐的玩法技巧和规则| 真人百家乐官网试玩账号 | 赌场大轮盘| 玩百家乐秘诀| 百家乐官网平注法是什么| 大发888娱乐城888| 八卦24方位| 百家乐官网网络公式| 百家乐平玩法官方网址| K7百家乐官网的玩法技巧和规则| 皇冠走地| 澳门百家乐网上赌城| 真人百家乐官网做假| 娱乐城简介| 皇冠百家乐赢钱皇冠| 百家乐官网有送体验金| 立博国际| 百家乐投注外围哪里好| 香港百家乐官网的玩法技巧和规则| 速博国际| 百家乐新送彩金| 百家乐官网博娱乐场开户注册| 什么叫百家乐的玩法技巧和规则 | 大发888易付168 充值| 家百家乐破解软件| 百家乐官网现金平台排名| 水果机规律| 百家乐是不是有假| 赌博百家乐官网技术| 太阳城开户网| 百家乐冼牌机| E乐博百家乐现金网|