2025年1月20日,随着特朗普总统就职,美国联邦政府网站正经历大规模的变更。数千个政府网页正在被删除或改变,涉及范围极其广泛:从白宫官网到环境保护局(EPA)、疾病控制与预防中心(CDC)、卫生与公众服务部(HHS)等众多联邦机构的网站都受到影响。具体来说,Data.gov 平台上近3000个数据集消失,人口普查局的人口统计数据变得难以访问,多个机构关于气候变化、LGBTQ+权益、多样性与包容性(DEI)等议题的页面也相继下线。
在这个关键时刻,互联网档案团队(Archive Team)发起了一项紧急行动,旨在保存这些可能消失的政府数据。作为一个普通公民,我们也可以参与到这个数字档案保护工程中来。通过安装和运行 ArchiveTeam Warrior 软件,每个人都能为保护这些重要的公共数据贡献一份力量。
本指南将详细介绍如何安装和使用 ArchiveTeam Warrior,帮助您加入这场数据保卫战。
无论您是否具备技术背景,只要按照以下步骤操作,都能轻松参与其中。
什么是 Archive Team?
Archive Team 是一个由志愿者组成的数字档案团队,由 Internet Archive 的自由档案员和软件馆长 Jason Scott (u/textfiles) 领导。该组织与 Internet Archive 有着特殊的合作关系,能够将网页内容上传到 Wayback Machine(网络时光机)进行永久保存。
目前,Archive Team 正在进行一个专注于美国联邦政府网页的备份项目。以下是参与方法的详细步骤:
参与步骤
- 下载 Oracle VirtualBox
- 访问 https://www.virtualbox.org/wiki/Downloads 下载适合您系统的版本
- 安装 VirtualBox
- 下载 ArchiveTeam Warrior 虚拟机文件
- 导入虚拟机
- 打开 Oracle VirtualBox
- 选择”File” → “Import Appliance…”
- 选择您在第3步下载的 .ova 文件
- 完成导入
- 点击”Next”和”Finish”即可,使用默认设置就好
- 启动虚拟机
- 选择”archiveteam-warrior-4.1″
- 点击”Start”按钮启动
- 注意:如果启动时出现错误,重启电脑可能会解决问题
- 等待系统启动
- 系统启动后会显示一个网址(通常是一串数字)
- 访问控制面板
- 在浏览器中访问系统提供的地址
- 或直接访问 http://localhost:8001/
- 设置昵称
- 可以使用您的 Reddit 用户名或任何其他名称
- 选择项目
- 找到”US Government”项目
- 点击”Work on this project”开始工作
- 确认运行状态
- 点击”Current project”
- 查看日志信息是否在持续更新
更多资源
- 项目统计和排行榜:https://tracker.archiveteam.org/usgovernment/
- 项目详细信息:https://wiki.archiveteam.org/index.php/US_Government
- ArchiveTeam Warrior 文档:https://wiki.archiveteam.org/index.php/ArchiveTeam_Warrior
技术支持
如需技术支持,您可以通过 Hackint IRC 网络获取帮助:
- 一般支持:访问 #warrior 频道
- 项目相关问题:访问 #UncleSamsArchive 频道
注意事项:使用 IRC 时会暴露您的 IP 地址。您可以通过在 Hackint 网络获取 cloak 来部分缓解这个问题(访问 https://hackint.org/faq 获取详细说明)。
IRC 使用方法
- 网页版:https://chat.hackint.org/#/connect
- Windows 用户推荐使用 KVIrc:https://github.com/kvirc/KVIrc/releases
您也可以访问 r/Archiveteam subreddit 获取更多信息和支持。
本文来源 & 参与讨论:https://www.reddit.com/r/DataHoarder/comments/1ihalfe/how_you_can_help_archive_us_government_data_right/
发表回复