当前位置: 首页 > 软件库 > 程序开发 > PDF工具包 >

pdf2djvu

文档转换工具
授权协议 GPLv2
开发语言 C/C++
所属分类 程序开发、 PDF工具包
软件类型 开源软件
地区 不详
投 递 者 糜运良
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

pdf2djvu 从PDF 文件中解析出图片、文字、超链、书签、元数据等,并生成 DjVu 文件。

DjVu是由美国AT&T实验室于1996年开发成功的一项新的图片压缩技术。


DjVu的主要技术是将图像分为背景层(纸的纹理和图片)和前景层(文本和线条)。通过将文字和背景分离开来,DjVu可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。使用DjVu格式,用户首先会很快得到页面的一个最初版本,这个版本主要是含有文字的前景层。随着后续信息的到达,图像质量不断提高(这一点与JPEG格式的逐级提高精度的方法有类似之处)。

  • C++库: 1,PDF类库 PoDoFo    http://podofo.sourceforge.net/   PoDoFo 是一个用来操作 PDF 文件格式的 C++ 类库。它还包含一些小工具用来解析、修改和创建 PDF 文 2,Xpdf    http://www.foolabs.com/xpdf/download.html    Xpdf是一个开放源代码的PDF档案浏览器,Xpdf 可解码

  • 作者:马健 邮箱:stronghorse_mj@hotmail.com 发布:2009.09.22 更新: 2012.06.11 针对PdfToy的新进展,更新了相关内容。 1 引言 2 理论 3 实现     3.1 MRC模型的转换         3.1.1 单层DjVu         3.1.2 3层DjVu         3.1.3 2层DjVu(彩色文本)     3.2 图像的转

 相关资料
  • 我有一堆XML文档(源),需要将它们转换为具有不同结构(目标)的POJO。我的第一个明显的想法是使用JAXB和XSLT的组合。然而,在一些问题上,我不确定这是否合适。 我无法访问源的XSD。 我不需要目标作为XML结构,而只需要作为POJOs。 然后我想创建一个映射表,比如。 然而,这将导致大量“映射”代码,特别是在涉及复杂数据类型的情况下。 你对我如何实施这一点有什么建议吗?

  • 我已经用iText创建了一个文档,我想把这个文档(保存为PDF文件)转换成一个图像。为此,我使用PDFBox,它需要一个PDDocument作为输入。我使用以下代码: 此时,我从已保存的文件中加载文档。但我希望在Java内部执行此操作。 所以我的问题是:如何将文档转换为PDDocument? 非常感谢任何帮助!

  • 问题内容: 我已经摆弄了二十多分钟,而我的Google-foo让我失望了。 假设我有一个用Java创建的XML文档(org.w3c.dom.Document): 如何将文档对象转换为文本字符串? 问题答案:

  • 问题内容: 我以这种方式将猫鼬文档作为json返回: 但是,还返回了user . proto。没有它我怎么能回来?我尝试了这个但没有用: 问题答案: 您也可以尝试mongoosejs的lean():

  • 问题内容: 将SQL数据库(例如1个表)转换为mongoDB文档的最佳方法是什么? 我想我可以使用C#驱动程序并实现一个循环,该循环选择表中的每一行并将其保存在Mongo中。但是,我正在寻找一种转换大量数据的更好方法。 问题答案: 司机的方式是FAR最直接的。导入/导出工具非常棒,但 前提 是您必须同时使用它们。如果您的表中包含日期,并且您尝试从数据库中导出并导入到mongo中,那么您将大吃一惊。

  • 我正在将数百个ODT文件转换成PDF文件,一个接一个地做需要很长时间。我有一个多核的CPU。是否可以使用bash或python编写一个脚本并行地完成这些操作?有没有一种方法从命令行使用libreoffice并行化批文档转换(不确定我是否使用了正确的词)?我在Python/bash中调用了以下命令: 蒂姆