欢迎网友参与“中国数字时代敏感词开源研究项目”

Google Doc版:http://sn.im/caonima866

“中国数字时代敏感词开源研究项目”是《中国数字时代》的一个研究项目,目前在更新新浪微博搜索敏感词列表,请网友参与,提供敏感词线索,共同构建和完善该敏感词列表。

这个链接是数字时代现有的”新浪微博搜索敏感词列表”:http://sn.im/caonima439,向网友开源的内容包括:

1. 复测现有列表中词语的敏感性

      *复测最小周期为三个月,即在上一次测试三个月之后才可以进行新一次测试。

      *结果代码: 1-测试结果为敏感词,0-测试结果为非敏感词。

      *提交的时候请写明测试词语测试时间测试结果三个要素。

2. 提交暂还没有被纳入列表的敏感词

      *提交的时候请写明敏感词(组)测试时间两个要素(测试时间为在新浪微博搜索中测试的当日日期)。


请以邮件的形式参与,邮件提交时请注意:

      *发送到邮箱:minganci110@gmail.com

      *邮件标题中含有“敏感词”三个字。

      *邮件内容请写明:

          1)复测现有词语还是提供新的敏感词(例:复测,XXX,2011.10.18,结果为0;新的敏感词,XXX,2011.10.18)

          2)如有需要,也可提供备注(例:“微博”栏目搜索无结果,“找人”栏目搜索显示结果;搜索结果显示不全等)

编辑将根据网友提交的内容对现有敏感词列表做出及时的更新。这是为此项目开通的谷加互动帐号 http://sn.im/caonima864,网友可以在这里与我们进行即时交流。

对本项目有突出贡献的网友,中国数字时代将表示适度感谢。

欢迎您的参与
谢谢!
中国数字时代编辑组
发表评论