当前位置: 首页 > 软件库 > 管理和监控 > 数据备份 >

ArchiveBox

自托管互联网归档
授权协议 MIT
开发语言 Python HTML/CSS SHELL
所属分类 管理和监控、 数据备份
软件类型 开源软件
地区 不详
投 递 者 夏朗
操作系统 Windows
开源组织
适用人群 未知
 软件概览

ArchiveBox 是一个强大的、自我托管的互联网归档解决方案,可以收集、保存和查看你想离线保存的网站。

你可以在 Linux、macOS 和 Windows 上将其设置为命令行工具、网络应用和桌面应用(alpha)。

你可以一次给它提供一个URL,或者安排定期从浏览器书签或历史记录、RSS 等提要、Pocket/Pinboard 等书签服务等定期导入。它以多种格式保存你提供的 URL 的快照:HTML、PDF、PNG屏幕截图、WARC等开箱即用,并自动提取和保存各种内容(文章文本、音频/视频、git repos 等)。

其目标是将用户所关心的互联网部分以持久的、易于访问的格式自动保存下来,直到它消失后的几十年。

特性:

  • 免费和开放源代码,不需要注册任何东西,所有数据都存储在本地
  • 强大的、直观的命令行界面,具有模块化的可选依赖性
  • 全面的文档、活跃的开发和丰富的社区
  • 开箱即可提取各种内容:媒体(优酷-DL)、文章(可读性)、代码(Git)等。
  • 支持从多种类型的来源按计划/实时导入
  • 使用标准、持久、长期的格式,如HTML、JSON、PDF、PNG和WARC
  • 可作为一次性CLI、自我托管的Web UI、Python API(BETA)、REST API(ALPHA)或桌面应用程序(ALPHA)使用
  • 默认情况下将所有页面保存到archive.org,以实现冗余(可以禁用本地模式)。
  • 计划中:支持需要登录/付费墙/cookies的归档内容(正在运行,但在一些有待修复的问题发布之前,不建议使用)。
  • 计划中:支持在归档过程中运行JS,如广告屏蔽、自动滚动、模式隐藏、线程扩展等。

 相关资料
  • 我对这家公司有着先入为主的厌恶滤镜,这源自自己作为消费者的直接评价、作为社会人的责任使然;此外,作为学生在与从基层到中层员工、从职能到业务人员的交流接触中,更加加深了这层滤镜。但需要说明的是,我十分幸运——最后遇到了很棒的老板和同事,让我出乎意料;奇葩的面试流程让我对面试有了更深刻的理解。 最后拿到offer对应的组真的挺棒的。做的事情算得上核心,也能发挥自己的特长,面试官/团队有技术,不过分卷;

  • 我正在Java开发一个游戏,使用RMI进行所有网络通信。RMI允许我在服务器上调用方法,但对我来说还不够。我还希望服务器能够在连接的客户端之间传播消息。 我的客户机查找服务器(它的接口扩展为远程)并在其上注册。它允许服务器知道谁已连接。我的客户机还实现了一个扩展远程的接口。这是我的代码的一部分: 接口声明: 服务器端: 客户端: 此解决方案适用于本地,但当我尝试通过Internet使用它时则不起作

  • 若要使用PS Vita与互联网连接,需先准备无线通信的环境。 若您的住家等地无法通过无线通信,可使用公众无线LAN服务(Hotspot)在公众场所与互联网连接。 公众无线LAN服务的使用方法与费用会因该服务的提供者而异。详细请询问该服务的提供者。 使用Wi-Fi连接 若要使用Wi-Fi与互联网连接,需准备以下内容。此外,接入点的设定通常会通过电脑进行。 与网络服务商签订合约 接入点或无线路由器 接

  • 地址 # ipaddress_addresses.py import binascii import ipaddress ADDRESSES = [ '10.9.0.6', 'fdfd:87b5:b475:5e3e:b1bc:e121:a8eb:14aa', ] for ip in ADDRESSES: addr = ipaddress.ip_address(ip)

  • 楼主投的是前端岗,编程语言为JavaScript,试卷是通用技术,题型4道编程 小插曲:发试卷的时候就贼卡,进去直接网络异常,心态小崩,咨询后叫我刷新再进去直接502了,心态崩了!好处就是把502状态码的含义给记住了,哈哈哈哈(苦中作乐中...)!(我记得暑期实习网易笔试也崩过一次,后面还叫重做了...网易...长点心吧!) 下面进入正题: 第一题:删除数位求是否能整除 题目大意:有a和b两个整数

  • 本文向大家介绍互联网和内联网之间的区别,包括了互联网和内联网之间的区别的使用技巧和注意事项,需要的朋友参考一下 Internet和Intranet都与网络有关,如果着眼于两个词,则仅具有一个字母的区别。但是,除了这些注意事项之外,两者之间还有许多明显的区别,下面将进行讨论。 以下是Internet和Intranet之间的重要区别 序号 键 互联网 内联网 1 定义 互联网是互连的计算机网络的全球系