MY NEWS
首页 AI 归档 搜索 收藏 RSS
← 返回首页
行业·观察 Hacker News 2026-05-21 1 min read ★ ★ ★ ☆ ☆

超过340家地方新闻机构限制互联网档案馆的访问

阅读原文 ↗

超过340家地方新闻机构通过修改robots.txt文件,限制互联网档案馆(Internet Archive)的Wayback Machine抓取和存档其内容。此举旨在保护版权和收入,但引发了对数字历史保存的担忧。


核心要点

  1. 超过340家地方新闻机构已限制互联网档案馆的访问
  2. 限制方式为修改robots.txt文件,阻止Wayback Machine抓取
  3. 主要动机是保护版权和广告收入,防止内容被免费存档
  4. 此举可能影响数字历史保存,使部分新闻内容无法被长期存档
  5. 互联网档案馆表示尊重网站意愿,但呼吁平衡保存与版权保护

正文

超过340家地方新闻机构已采取措施,限制互联网档案馆(Internet Archive)的Wayback Machine访问其内容。这些机构通过修改网站根目录下的robots.txt文件,明确禁止互联网档案馆的爬虫抓取和存档其网页。

这一趋势主要源于新闻机构对版权保护和广告收入的担忧。地方新闻业面临财务压力,担心内容被免费存档后,用户不再访问原始网站,从而减少流量和收入。部分机构认为,互联网档案馆的存档行为可能削弱其付费墙和订阅模式。

互联网档案馆是一个非营利组织,致力于保存互联网历史,Wayback Machine已存档超过8000亿个网页。该组织表示,尊重网站所有者的意愿,不会强行抓取被禁止的内容。然而,此举引发了数字历史保存领域的担忧:地方新闻内容往往具有本地历史价值,若无法被存档,未来研究者可能失去重要资料。

目前,受影响的新闻机构包括社区报纸、地方电视台和数字新闻初创公司,分布在美国多个州。互联网档案馆呼吁与新闻行业合作,寻找平衡版权保护与历史保存的解决方案,例如允许有限存档或设置延迟访问。


关联概念

  • 互联网档案馆
  • Wayback Machine
  • robots.txt
  • 数字保存
  • 版权保护

原文: More than 340 local news outlets are limiting the Internet Archive's access
自动加工于 2026-05-21 20:49

#互联网档案馆#地方新闻#版权#数字保存

更多 行业·观察 文章

行业·观察 Simon Willison's Weblog 2026-05-23 ★ ★ ☆ ☆ ☆

FTC 要求 Cox Media Group 等公司支付近 100 万美元以解决对其“主动聆听”AI 营销服务的欺骗指控

美国联邦贸易委员会(FTC)指控 Cox Media Group、MindSift 和 1010 Digital Works 三家公司对其“主动监听”营销服务的虚假宣传,要求它们支付近 100 万美元的赔偿。

阅读全文 →
↗
行业·观察 Hacker News 2026-05-23 ★ ★ ☆ ☆ ☆

Waymo 因 robotaxi 持续驶入洪水而扩大停运范围至四座城市

**Waymo**因其**自动驾驶出租车**持续驶入洪水区域而扩大了暂停服务的范围至四座城市。

阅读全文 →
↗
行业·观察 Hacker News 2026-05-23 ★ ☆ ☆ ☆ ☆

我又开始写作了

作者宣布自己恢复写作。

阅读全文 →
↗
行业·观察 Hacker News 2026-05-22 ★ ★ ☆ ☆ ☆

谷歌的IBM化?

本文探讨谷歌是否正走向类似IBM的衰落路径,即从创新先锋变为官僚化、反应迟缓的企业巨头。通过分析谷歌近年来的产品策略、组织文化及市场表现,指出其面临创新停滞、人才流失、决策缓慢等挑战,与IBM在20世纪90年代的困境相似。文章警示谷歌需警惕“大公司病”,否则可能重蹈IBM覆辙。

阅读全文 →
↗

MY NEWS · AI 自动运营 · SORA