挑战网络审查?Firefox扩展程序“No More 404s”将帮你打开消失网页


Firefox 开展新项目,将用网页快照代替消失的网页。网页截图
来源:https://theinitium.com/article/20160808-dailynews-no-404/

由于网络审查等多种原因,总有一些网页会在发布一段时间后离奇消失,内地网民将这种现象戏谑为“手慢无”。尽管各大搜索引擎都提供网页快照(Web Cache),以便用户查询失效网页内容,但这种方法并不直接,而且能否找到快照取决于搜索关键词的准确度。
为解决用户这一困扰,Mozilla 公司的开源网页浏览器 Firefox 近日在其测试平台 Test Pilot 上启动了名为“No More 404s”的新项目,计划推出一个浏览器扩展程序,让已无法访问网页的快照内容直接替代其失效链接,方便 Firefox 浏览器用户查看。
对上网时遇到死胡同感到厌烦?当某个网页消失时,我们会尝试给你一份快照。



Firefox 测试项目“No More 404s”导语







由 RFC 2616 规范定义用以表示网页伺服器 HTTP(超文本传输协议)响应状态的 HTTP 状态码由3位数字组成,最常见的包括“403 Forbidden”、“404 Not Found”等错误讯息。
其中,“404 Not Found”代表客户端在浏览网页时,伺服器无法正常提供讯息或无法回应且不知原因,404 错误讯息通常是在目标页面被更改或移除之后出现。
Firefox 正在测试的“No More 404s”扩展功能可以让其用户访问已经快照的内容,这些内容由非营利组织互联网档案馆(Internet Archive)的存有近5000亿网页的 Wayback Machine 提供。不过,该扩展程序不适用于在 Wayback Machine 上没有快照的页面,也不适用于自动跳转至其他页面的链接以及其他 HTTP 错误讯息代码。
3
根据 Net Market Share 今年7月的统计数据,Firefox 在全球浏览器市场占有率排在第3位,仅次于 Chrome 和 IE。

互联网档案馆

互联网档案馆(Internet Archive)是一个非牟利性的数码图书馆。成立于1996年,由 Alexa 创始人布鲁斯特·卡利(Brewster Kahle)创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费储存及获取。迄至2012年10月,其资讯储量达到10PB。除此之外,该档案馆也是网络开放与自由化的倡议者之一。其数据是由自带的网络爬虫自动搜集的,其网站典藏档案馆网站时光机,抓取了超过1500亿的网页。其年度预算约100万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会(Kahle-Austin Foundation)。总部位于美国旧金山里奇蒙德区,此地雇员只有数十人,大部分雇员工作于书籍扫描中心,在雷德伍德城(Redwood City)也有数据中心。该数据库是国际互联网储存联盟成员,2007年被加利福尼亚州选为官方指定图书馆。(资料来自维基百科)

发表评论