美文网首页Python,web开发,前端技术分享互联网科技大数据 爬虫Python AI Sql
用Python做了鉴黄模型,内含多20万张“不可描述”图片

用Python做了鉴黄模型,内含多20万张“不可描述”图片

作者: 一墨编程学习 | 来源:发表于2019-07-22 22:03 被阅读3次

GitHub出现一个名为“NSFW Model”的项目。通俗一点来说,就是一个鉴黄模型。

这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张“不可描述”图片。

大家在学python的时候肯定会遇到很多难题,以及对于新技术的追求,这里推荐一下我们的Python学习扣qun:784758214,这里是python学习者聚集地!!同时,自己是一名高级python开发工程师,从基础的python脚本到web开发、爬虫、django、数据挖掘等,零基础到项目实战的资料都有整理。送给每一位python的小伙伴!每日分享一些学习的方法和需要注意的小细节

同时,这个模型也被项目的贡献者做成了Demo。

既然有了Demo,那肯定是免不了测试一番……

Demo效果

Demo网站十分简单,进去之后能做什么一目了然。

上传图片之后,是自动给出结果,不需要点击其他按钮。但有时候不会给出结果…..还有待完善。

结果是数据集中提到的5种类别的可能性。分别是:hentai、sexy、neutral、drawings、porn。具体每个类别代表的意思,如下图所示:

好了,开始第一个测试:

这个图有71%的可能性是hentai;16%的可能性是porn。你觉得准吗?

再来一个:

71%的可能性是sexy。

但下面这个,就有点不好说了。

porn到了76%,19%是hentai。按照这个标准,《超体》别想正常上映了……

但整体上,这个模型还是能工作的,比如整个漫画,就很好的识别出来了,比如其他的一些,也能识别出来(但图片就不好放了)。

至于准确率怎么样,没法给出定论。如果你有兴趣,可以去体验下这个Demo。地址:

http://ai.midday.me/

话说话来,看到这个模型,你有没有想自己上手体验一下?GitHub有相关的开源代码。

请收好项目地址:

https://github.com/rockyzhengwu/nsfw

最后,数据集地址:

https://github.com/alexkimxyz/nsfw_data_scrapper

One More Thing

相关文章

网友评论

    本文标题:用Python做了鉴黄模型,内含多20万张“不可描述”图片

    本文链接:https://www.haomeiwen.com/subject/cnyllctx.html