PeaExtractor

文档提取工具
授权协议 未知
开发语言 C/C++
所属分类 应用工具、 个人助理软件
软件类型 开源软件
地区 不详
投 递 者 林星华
操作系统 Windows
开源组织
适用人群 未知
 软件概览

PeaExtractor 是开源项目 PeaZip 项目的附带品,可以从 150+ 文档类型 (7Z, ACE, BZ2, CAB, GZ, ISO, RAR, TAR, ZIP 等等) 提取内容,是个简单直接的提取工具。

PeaExtractor 不能创建文档,只能提取。用户只需要把文件拖拽到 PeaExtractor 窗口,点击 OK 就可以提取文档内容到当前文件夹了。如果这不是你想要的,PeaExtractor 对话框会提供选项来设置特定的密码或者密钥文件,提取文件到另一个新的文件夹。

PeaExtractor 同时提供简单的上下文菜单。

PeaExtractor

 相关资料
  • 以下是从文本文档中提取内容和元数据的程序 - import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; import

  • 问题内容: 我正在尝试学习一些漂亮的汤,并从一些iFrame中获取一些html数据-但到目前为止,我还没有取得很大的成功。 因此,解析iFrame本身似乎不是BS4的问题,但是我似乎并没有从中获得嵌入的内容-不管我做什么。 例如,考虑下面的iFrame(这是我在chrome开发人员工具上看到的): 我要提取的内容在哪里。 但是,当我使用以下BS4代码时: 我得到: 换句话说,我得到的iFrame中

  • 以下是从XML文档中提取内容和元数据的程序 - import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; impor

  • 下面给出了从HTML文档中提取内容和元数据的程序。 import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.tika.exception.TikaException; import org.apache.tika.metadata.Metadata; imp

  • 我知道以前也有人问过类似的问题,但是这些问题已经过时了(有些问题可以追溯到2006年)。 我有一个. net 3.5应用程序(w/iTextSharp 5),我正在转换为. net核心(iText 7),它从联邦快递跟踪文档中提取签名,通过SOAP服务以字节[]数组发送。这段代码多年来一直运行良好,只是略有更新。从联邦快递返回的PDF文档中有几个图像,但签名块不是110x46图像(这是pdf文件中

  • 问题内容: 如何 使用PHP 从PDF文档中提取文本? (我不能使用其他工具,我没有root用户访问权限) 我发现一些函数可用于纯文本,但是它们不能很好地处理Unicode字符: http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf- data-extraction-437.html 问题答案: 下载 c