本帖最后由 妇女节 于 2022-4-6 19:42 编辑

本人中年技术宅,平时爱好就是自己写代码做个自用的小程序之类的。日常喜欢逛逛色情网站,搞个程序,把网站上大部分图片扒下来。(声明:由于本人技术不过关,91论坛的从没扒过)。于是乎,电脑上存了几十G的各类色情图片。里面大部分是我想看的,但是也有很大比例是鱼龙混杂一起扒下来的。比如以下:蓝圈标注的乱七八糟的图片,红圈标注的不露点的图片。
01.jpg

这些图片呢,我想分类保存,这就是个大问题。人工筛选太慢,自动筛选又没有合适的软件。关键是,图片中美女的阴部千奇百怪,乳房也各有千秋,这个似乎除了人工识别,没有办法。
02.jpg
想来想去,只有人工智能可以做到!好吧,自己动手,训练一个人工智能神经网络,进行识别。说干就干,用Python语言最方便,目前成熟的人工智能图像识别算法是YOLO v5,开源的在github库中,一搜就能搜到。很多人fork,不乏国内大神,ultralytics这个库的是正版。查了很多中文资料,让我很失望,根本没有一个手把手能教会怎么去用的。好吧,上google,搜索英文的资料,慢慢的攻下来技术难点。我把女人的图片分为三个类,阴部、乳房、臀部。
第一,首先用LableImg软件进行图片标记,LableImg是开源的,github上也能搜到。我最终标记了1200个图片。标记出来是类似这样:
03.jpg
上面一个个的小方框,就是标记出来阴部和乳房的位置。

第二,下载YOLO v5的源代码,是Python写的,在我本地计算机上调通,用自带的coco128库。

第三,最难的,开始训练。用GPU训练快一些,但是无奈我没有GPU卡。一个TeslaT4上万块钱,配上工作站,得小两万。用我的笔记本把,CPU训练,太鸡毛慢。终于借了一个服务器,32G内存,开始了。训练第一次,效果并不好。如下图所示,左半边是我的标记,标记那么多,右边就只识别出了一只奶子,还识别成了屁股。
04.jpg

待会儿再续写。

(7次)        ←好贴,支持作者,点赞一下!

举报此贴为未成年,盗图,骗取红包或广告贴,奖励20个积分。

上传图片貌似有些问题,我把刚才的图片再上传一次。蓝圈标注的乱七八糟的图片,红圈标注的不露点的图片。
01.jpg


图片中美女的阴部千奇百怪,乳房也各有千秋,这个似乎除了人工识别,没有办法。
02.jpg



LableImg软件进行图片标记
03.jpg





训练第一次,效果并不好。


04.jpg

训练第一次用了大概2个多小时,100个数据,训练了10个epoch,用的神经网络模型是yolo5s.pt。yolo5s.pt这个模型,是速度快。但是精度很差,有点打击我的积极性。我拿出写硕士毕业论文的态度,查询了相关英文文献,找到了提高精度的方法:就是刻苦。本着愚公移山的精神,我一口气标记了500张图片,这种图片,看的我眼睛直了,弟弟也一直硬着。然后第二次训练来了:500张图片,训练了10个epoch,用的模型yolo5x.pt,X这个模型比S更复杂,训练速度更慢,精度高。第二次的结果: 05.jpg


左半边是我标记的,右半边带小数的是神经网络识别出来的结果,可以看出来,神经网络识别已经越来越接近人工识别了。右半边的框带的小数,就是它识别出分类的可信度。
但是,但是,但是,科学家是不会止步于这么低的可信度的。

本帖最后由 妇女节 于 2022-4-6 19:29 编辑

最后一次训练来了。我足足标记了一千二百张图片,训练了一百个epoch。伴随着我借来的32G内存的电脑,整整训练了近两百小时!出结果了:
val_batch0_labels.jpg
val_batch0_pred.jpg
这次神经网络的识别度很高了,1.0是指神经网络已经可以百分之百识别这是什么部位,0.8是百分之八十的确认度。我很欣慰。
但是这只是识别出来了,下一步当然是程序化了。

本帖最后由 妇女节 于 2022-4-6 19:52 编辑

最后呢,奋战两天,写了一个程序,可以把我所有的图片进行分类,存放到不同的文件夹里。 06.jpg

乳房:
06-tits.jpg

阴部:
06-pussy.jpg

臀部:
06-ass.jpg

其他:
06-other.jpg

最后这个文件夹就是没有识别出阴部、乳房、臀部的图。其实每个文件夹中都有漏检和误检,但是概率很低了,已经大大的降低了我的工作量。
有人会关心图片上加的红框标记,不要紧,那个是我测试用来看识别精度和可信度的,去掉它分分钟。

本文完。

加几张识别出来的图片,大家欣赏欣赏。 00871.jpg

00873.jpg

00890.jpg

00899.jpg


00401.jpg

上面这张图片的阴部没有识别出来,属于漏检。

回复 32# wumingxiaozu

用google colab训练会很快