超过340家地方新闻机构通过修改robots.txt文件,限制互联网档案馆(Internet Archive)的Wayback Machine抓取和存档其内容。此举旨在保护版权和收入,但引发了对数字历史保存的担忧。
核心要点
- 超过340家地方新闻机构已限制互联网档案馆的访问
- 限制方式为修改robots.txt文件,阻止Wayback Machine抓取
- 主要动机是保护版权和广告收入,防止内容被免费存档
- 此举可能影响数字历史保存,使部分新闻内容无法被长期存档
- 互联网档案馆表示尊重网站意愿,但呼吁平衡保存与版权保护
正文
超过340家地方新闻机构已采取措施,限制互联网档案馆(Internet Archive)的Wayback Machine访问其内容。这些机构通过修改网站根目录下的robots.txt文件,明确禁止互联网档案馆的爬虫抓取和存档其网页。
这一趋势主要源于新闻机构对版权保护和广告收入的担忧。地方新闻业面临财务压力,担心内容被免费存档后,用户不再访问原始网站,从而减少流量和收入。部分机构认为,互联网档案馆的存档行为可能削弱其付费墙和订阅模式。
互联网档案馆是一个非营利组织,致力于保存互联网历史,Wayback Machine已存档超过8000亿个网页。该组织表示,尊重网站所有者的意愿,不会强行抓取被禁止的内容。然而,此举引发了数字历史保存领域的担忧:地方新闻内容往往具有本地历史价值,若无法被存档,未来研究者可能失去重要资料。
目前,受影响的新闻机构包括社区报纸、地方电视台和数字新闻初创公司,分布在美国多个州。互联网档案馆呼吁与新闻行业合作,寻找平衡版权保护与历史保存的解决方案,例如允许有限存档或设置延迟访问。
关联概念
- 互联网档案馆
- Wayback Machine
- robots.txt
- 数字保存
- 版权保护
原文: More than 340 local news outlets are limiting the Internet Archive's access
自动加工于 2026-05-21 20:49