国家局域网里的自我保护法(二)

来源:justice360.spaces.live.com

上次说的“脑残文”法有一大缺陷,那就是——实在太折磨读者了......
那么,如果我们人性化一点,让读者看得更舒服些,该怎么办呢?你应该记得许多网站登陆、注册的时候用到的验证码吧?对了。

(盗链一张图片)


方法二:使用图片

验证码都是用 图片实现的,就是为了防止程序自动恶意登陆或者注册,原则其实也就是能让人读懂而不让程序读懂。但随着验证码的普及,高人们又开发出了可以识别图片内容的 恶意程序,于是现在的验证码图片都搞得花里胡哨的,都是来点随机的变形或者加些随机的花纹,有时候人也看不清楚(有些网站有“看不清楚?点击图片换一 张。”之类的提示),这样就大大加大了程序识别的难度(后来还搞出了什么算极限、微积分、辨认分子结构什么的验证码...ORZ)。对于普通的爬虫来说, 去识别图片里的文字内容应该是很少见的,所以把文字做成图片应该有比较好的保护性。如果觉得不够保险,我们也可以在不影响人辨认的情况下给它来个变形或者 加些花纹什么的。
如果你有稍好一点的图片编辑软件(Photoshop, Fireworks, CorelDraw之类的),那制作这样的图片易如反掌,甚至还能顺便美化一下。给文字加点特殊效果,或者稍微来个扭曲都是不错的选择。甚至我怀疑只是把 你的网页上的文字来个截屏贴出来都能避过大多数检查爬虫的耳目。就算你只有Windows自带的画笔,随便写几个字存成图片(记得文件格式选jpg),也 不是什么难事。
可是这个方法也有一些问题,图片和文字相比存储空间要大很多,图片太多在载入的时候会大大影响速度。同时,图片不像文字可以直接发布,需要存储在网络相册中,甚为麻烦。
发现任平生这篇日志使用了两张大图,呵呵。

没有评论: