“平均每十几条就屏蔽掉一条;监控的敏感词有1000多个



这样的潜规则也公开报道了啊!而且还是北京晚报!但我不怀疑它在我的博客上贴不稳。管它的,能贴多久算多久吧——

搜狐:每天屏蔽五千条微博

来源:http://blog.sina.com.cn/s/blog_473f8cfd0100lrvl.html

平均每十几条就屏蔽掉一条;监控的敏感词有1000多个

 稿源:南方都市报
 2010-08-23 
    南都讯 据《北京晚报》报道 目前,新浪、搜狐、网易、腾讯、人民网等各家网站都有微博。搜狐网监控中心负责人王国欣告诉记者,包括微博、博客在 内的网民互动式互联网产品,文字帖一般采用1000多个敏感词进行过滤,如果其中含有敏感词就直接删除。这些敏感词主要是涉枪、涉黄、涉暴的内容。

    据悉,微博被过滤掉的内容,绝大多数是涉黄,另外就是发帖做广告,或者是用语言攻击其他人。王国欣说,搜狐微博是24小时都有人做过滤监控,微博每天出现的七八万个帖子,过滤掉的大约有5000多个。在搜狐社区每天出现的20多万个帖子中,有4万多个会被过滤掉。

    除了文字要进行过滤监控,图片过滤也是互联网监控的一个重要内容。王国欣称,搜狐对网民在搜狐社区上传的图片采取软件自动过滤加人工审核的方法, 搜狐使用的软件名为图片过滤器,能通过肤色、纹理、动作、人脸等多个参数,对图片进行要素的提取。“人的肤色介于红黄之间,当肤色大于一张图片面积的 40%,图片就基本认定为情色图片,进入人工审核程序。”狮子的皮毛是黄颜色,这样的图片会不会直接过滤掉呢?对于这样的疑问,王国欣说,图片过滤的一个 选项是纹理,通过软件可以发现狮子的边缘很杂乱,与人体图片的边缘不同,不会被过滤掉。

    记者在搜狐公司看到,一位负责网络监控的员工正在进行图片的人工审核。网民上传的照片按照每行5张、每屏40行的标准显示在电脑屏幕上。当发现照片有露点、挑逗动作内容时,他就会在图片下面的方框内点一下,图片就不会上传到网上公开发表了。


1 条评论:

Unknown 说...

很抱歉,该文章已经被加密!

您可以通过左侧的推荐博文组件浏览其它文章