当前位置: 首页 > 软件库 > 程序开发 > PDF工具包 >

PyMuPDF

轻量级 PDF 和 XPS 查看器
授权协议 GPL
开发语言 Python
所属分类 程序开发、 PDF工具包
软件类型 开源软件
地区 不详
投 递 者 西门靖琪
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

PyMuPDF是 MuPDF的 Python 绑定-“轻量级 PDF 和 XPS 查看器”。

MuPDF可以访问PDF,XPS,OpenXPS,CBZ(漫画书档案),FB2和EPUB(电子书)格式的文件。可以是扩展名为.pdf,.xps,.oxps,.cbz,.fb2 或.epub的文件

  • 从PDF文档制作图像,按照每一页制作成图片包。
  • 提取PDF内的文字
  • PDF注释

PyMuPDF大大扩展PDF的注释的功能,新的注释类型支持“墨水”,“橡胶印章”和“曲线”注释。墨水注释通过组合一个或多个互连点列表来模拟笔迹。印章旨在以视觉方式告知文档的状态或预期用途(例如“草稿”,“机密”等)。曲线是一个文本标记注释,它用锯齿形的线条在选定的文本下划线。

  • PyMuPDF提供了PDF及流行图片处理接口。 安装与简介 安装:pip install PyMuPDF PyMuPDF使用手册参见https://pymupdf.readthedocs.io/en/latest/index.html MuPDF MuPDF是一个轻量级的PDF、XPS和电子书查看器。MuPDF由软件库、命令行工具和各种平台的查看器组成: 支持多种文档格式:如PDF、XPS、Ope

  • win10中Python3.6.5安装PyMuPDF时候报错,怎样解决 问题遇到的现象和发生背景 在win10系统安装PyMuPDF时报错,代码如下: pip install PyMuPDF -i https://pypi.tuna.tsinghua.edu.cn/simple 运行结果及报错内容: Looking in indexes: https://pypi.tuna.tsinghua.e

  • ​ 读取pdf文件,将每页图片转为np.array格式,供paddleocr进行读取,此代码对转换速度进行了测试. 需要安装:paddleocr, pyinstrument, pymupdf,memory_profiler 收到pymupdf开发者回复,得到了更高效的方法, 使用pix.samples_mv可以直通内存(which is a memoryview to that internal

  • python 出现No module named 'pyMuPDF’解决办法;pyMuPDF无法导入问题 PyMuPDF的模块名称是 fitz, 错误用法: import PyMuPD 会产生No module named ‘pyMuPDF’ 正确用法: import fitz ,

  • import fitz # 设置矩阵缩放比例,一般都是2 mat = fitz.Matrix(2, 2) def pdf_image(pdfPath): # 打开pdf,得到一个列表,一页一个列表值,这里环境可能异常,open有警告,但是能用。 doc = fitz.open(pdfPath) p = doc[0] pix = p.get_pixmap(mat

  • 题外话:这个部署过程实在是很坑,可能本教程任有不完善之处。还请海涵 前置条件: Homebrew已部署 Anaconda已部署 第一步: brew安装依赖 brew install mupdf swig freetype 第二步: 增加Swig Path依赖 vi ~/.bash_profile export SWIG_HOME=/opt/homebrew/Cellar/swig/4.1.0/b

  • 实现了PymuPDF替换pdf指定位置文字和图片的功能,并分别保存pdf和JPG格式. #-*- coding:utf-8 -*- import os import PyPDF2 import fitz text = u"湖南省湘潭市雨湖区鹤岭镇长安村永红组" file_path = r'D:\Desktop\新建文件夹' for root,dirs,files in os.walk(f

  • 安装pymupdf pip install pymupdf PDF转为图片 def pdf2pic(pdf_file): doc = fitz.open(pdf_file) pdf_name = os.path.splitext(pdf_file)[0] for pg in range(doc.pageCount): page = doc[pg]

  • tags: Tips 写在前面 前阶段有人问我如何在M1芯片的macOS上安装PyMuPDF这个包, 我的环境是采用conda安装的Python3.9, 直接采用pip install fitz进行安装之后, 虽然成功安装了, 但是导入时候出现了报错, 后来通过github的讨论界面1得到了答案. 解决 pip install fitz brew install mupdf swig freety

  • 导入 import fitz 打开文档   doc = fitz.open(filename) # fitz.Document(filename) Document对象的属性 Document.page_count        文档页数 Documet.metadata                文档元数据(文档信息),字典 Document.get_toc()              

 相关资料
  • 问题内容: 我正在使用Java和RCP,并且尝试在Acrobat上显示pdf文档。我不需要更改它们。我的这段代码有这个错误。任何想法如何解决这个问题?附言:它同时运作良好。 问候,Haythem 问题答案: 看看这些免费的pdf渲染器… 一些链接… http://www.icepdf.org/(现在位于http://www.icesoft.org/java/projects/ICEpdf/over

  • 请问有哪些轻量级的日志查看工具, 需求是可以通过配置 .log 文件的路径,实现在网页上查看

  • XPS Thumbnail 是一个用来显示 XPS 文档的缩略图的程序。 XPS 是 XML Paper Specification 的简称,它是微软公司开发的一种文档保存与查看的规范。以前的 开发代号为 “Metro”。这个规范本身描述了这种格式以及分发、归档、显示以及处理 XPS 文档所遵循的规则。最为显著的特点是,XPS 所用的置标语言是 WPF 所用的 XAML 的一个子集,因此显示 Wi

  • 主要内容:使用普通函数创建 goroutine,使用匿名函数创建goroutine在编写 Socket 网络程序时,需要提前准备一个线程池为每一个 Socket 的收发包分配一个线程。开发人员需要在线程数量和 CPU 数量间建立一个对应关系,以保证每个任务能及时地被分配到 CPU 上进行处理,同时避免多个任务频繁地在线程间切换执行而损失效率。 虽然,线程池为逻辑编写者提供了线程分配的抽象机制。但是,如果面对随时随地可能发生的并发和线程处理需求,线程池就不是非常直观和方便了。能否

  • Jenkins Pipeline插件有一个称为“轻量级签出”的功能,其中主服务器仅从repo中提取Jenkinsfile,而不是整个repo。配置屏幕中有一个相应的复选框。我想在多分支管道中进行轻量级签出,但我在多分支配置屏幕中没有看到复选框。有什么想法如何实现这一点吗?我注意到一些关闭的问题表明此功能可用,但我无法找到任何有关如何实现它的细节。 相关资料: https://issues.jenk

  • 问题内容: 我发现自己需要为数据字符串生成校验和,以实现一致性。广泛的想法是,客户端可以根据接收到的有效载荷来重新生成校验和,从而检测到传输中发生的任何损坏。我模糊地意识到,这种事情背后存在着各种各样的数学原理,如果您自己动手操作,细微的错误很容易使整个算法失效。 因此,我正在寻找符合以下条件的哈希/校验和算法的建议: 它将由Javascript生成,因此在计算上需要相对较少。 验证将由Java完