2013年4月13日星期六

关于比特化的色情影视作品的过滤方法研究

    黄色图片或者说色情图片,一般人瞟一眼就心里有数了,但是对于电脑来说,屏幕上的男女是谈情说爱还是,还是宽衣解带。。。。。这个就需要计算机视觉来调教了。其实整个系统来看就是教会电脑看A片,教一别人做某件事自己首先要精通,这比较难为我,好吧,开始学了,计算机没有感情,没有荷尔蒙分泌,也没性冲动。只能接受010101110000,所以只能通过归纳此类色情图片的数据特征,或者说把这些数据特征来归纳成数学公式,检验所显示的图片的数据特征是否满足对应的数学公式。


颜色、形状、声音

在计算机中,每张图片的每一个像素pixel都包括亮度值brightness、色相值hue、饱和度值saturation。对于色情影视作品来说最重要的就是naked即露肉,那么每一个像素是否是“肉色”计算机通过比对是可以分辨出来的,如果某张图片中“肉色”所占比例太大,那么这张图片就有点黄了。当然这是粗略的过滤,对于特殊区域的过滤,一般特殊区域有固定的轮廓可以匹配。如果满足匹配,那么是黄片的嫌疑就很大了。


电脑自动识别出图片里的人体皮肤区域
计算肤色区域的几何关系(采样自几个典型的XXOO体位)
电脑“看到”类似于没穿衣服的露肉的区域的图片时,进一步核实这些露肉区域的来源,看看是不是没穿衣服的苍井空老师还是穿着衣服的林志玲,如果有两块肉色区域(比如胳膊或者两条腿),那么这两块肉色区域之间的不管是穿着的内裤还是肩膀必然满足一定的几何关系,可以通过电脑计算得出。

通过肤色和人体构造比例的这套“扫黄打非”的办法是美国University of Iowa and the University of California at Berkeley的研究人员提出来的,当时发表了一篇1996年发表了一篇名为《找到裸露的身体》( Finding Naked People )的论文。


至于A片如何过滤,或者说普通电影中是否有限制级的片段,可以先过滤音频,在匹配库中预存了海量音频,如果声音频率(frequency?)匹配----真没研究过音频,所以不好发表意见,下面有一个有趣的视频。



復旦大學配音系女生完美演譯




错杀和漏网

对应计算机视觉来说,此项研究来源的样本总是有限的,即使是收集成千上万大高清影视作品(不错的工作,我想和教授申请经费购买超大容量硬盘)。当出现新花样的色情作品,与库中比对不匹配,就会出现漏网的情况,。
错杀
图(a),(b)整张画面太黄以至于很像人的皮肤,不幸中枪
图(c)大老爷们穿个大裤衩也不幸中枪
漏网


无辜的黄色图片

注:


A片--普及一下A意思是Adult,那么A片就是成人片


参考资料

1.Fleck, Margaret M., David A. Forsyth, and Chris Bregler (1996) “Finding Naked People,” 1996 European Conference on Computer Vision
2. Haiqiang Zuo, Ou Wu, Weiming Hu, Bo Xu;RECOGNITION OF BLUE MOVIES BY FUSION OF AUDIO AND VIDEO 3.Wang, J. and Wiederhold, G. and Firschein, O;System for Screening Objectionable Images Using Daubechies' Wavelets and Color Histograms

版权声明
本博客所有的原创文章,作者皆保留版权。转载必须包含本声明,保持本文完整,并以超链接形式注明作者编程随想和本文原始地址:
https://idreamboats.blogspot.com/2013/04/blog-post_13.html

0 评论:

发表评论