当前位置: 首页 > 知识库问答 >
问题:

PDF出血检测

缪征
2023-03-14

我目前正在编写一个小工具(Python pyPdf)来测试PDF的打印机一致性。

唉,我在第一项任务中已经感到困惑:检测PDF是否有至少3毫米的“出血”(页面周围没有打印任何内容的边框)。我已经知道,我无法检测到完整文档的出血,因为似乎没有全局出血。然而,在页面上,我可以检测到总共五个不同的框:

  • mediaBox

我阅读了关于这些框的pyPdf文档,但我唯一理解的是mediaBox,它似乎代表了整个页面大小(即论文)。

bleedBox显然应该定义出血,但似乎并不总是如此。

我注意到的另一件事是,例如PDF,所有这些框在每一页上都有完全相同的大小(意味着根本没有出血),但当我打开它时,有大量出血;这让我想到,各个文本元素都有自己的偏移量。

因此,显然,仅仅从mediaBoxbleedBox计算出血量是不可行的。

如果有人能解释一下这些盒子到底是什么,以及我能从中得出什么结论(例如,一个盒子总是比另一个小),我会非常高兴。

附加问题:有人能告诉我文档中提到的“默认用户空间单元”是什么吗?我很确定这指的是我机器上的mm,但我想在任何地方强制执行mm

共有1个答案

蒋寒
2023-03-14

引用Adobe发布的PDF规范ISO32000-1:2008:

14.11.2页面边界

14.11.2.1概述

PDF页面可以为完成的介质(如一张纸)准备,也可以作为印前过程的一部分,在印前过程中,页面内容被放置在中间介质(如胶片或强制复制板)上。在后一种情况下,区分中间页和完成页很重要。中间页面通常可能包含其他与生产相关的内容,如出血或打印机标记,这些内容超出了完成页面的边界。为了处理这种情况,PDF页面可以定义多达五个独立的边界,以控制成像过程的各个方面:

>

  • 介质框定义了要打印页面的物理介质的边界。它可以包括围绕完成页面的任何扩展区域,用于出血、打印标记或其他类似目的。它还可以包括靠近介质边缘的区域,这些区域由于输出设备的物理限制而无法标记。落在该边界之外的内容可以安全地丢弃,而不会影响PDF文件的含义。

    裁剪框定义了页面内容在显示或打印时应被裁剪(裁剪)的区域。与其他框不同,裁剪框在物理页面几何形状或预期用途方面没有定义的含义;它只是对页面内容进行裁剪。然而,在没有其他信息的情况下(如JDF或PJTF作业传票中指定的拼版说明),裁剪框决定了页面内容应如何在输出介质上定位。默认值是页面的媒体框。

    出血框(PDF 1.3)定义了在生产环境中输出时页面内容应剪切到的区域。这可能包括任何额外的出血区域,以适应切割、折叠和修剪设备的物理限制。实际打印的页面可能包括落在放气盒外的打印标记。默认值是页面的裁剪框。

    修剪框(PDF 1.3)定义了修剪后完成页面的预期尺寸。它可能比介质盒小,以容纳与生产相关的内容,如打印说明、切割标记或色条。默认值是页面的裁剪框。

    艺术框(PDF 1.3)根据页面创建者的意图定义页面有意义内容的范围(包括潜在的空白)。默认值是页面的裁剪框。

    页面对象字典分别在MediaBox、CropBox、BleedBox、TrimBox和ArtBox条目中指定了这些边界(见表30)。所有这些都是以默认用户空间单位表示的矩形。裁剪、出血、修剪和艺术框通常不应超出媒体框的边界。如果它们这样做,它们将有效地减少到它们与媒体框的交叉点。图86说明了这些边界之间的关系。(图中没有显示裁剪框,因为它与任何其他边界都没有定义的关系。)

    下面是一个很好的图形,显示了这些框之间的关系:

    在许多情况下只设置媒体框的原因是

    >

  • 对于用于电子消费(即在计算机上阅读)的PDF,其他框几乎不重要;和

    即使在印前背景下,它们也不再像过去那样必要了,参见佩德罗在评论中提到的文章。

    关于你的“额外问题”:用户空间单位默认为1/72英寸;但是,由于PDF 1.6,可以使用页面字典中的UserUnit条目将其更改为该大小的任意(非必需的整数)倍。在现有PDF中对其进行更改基本上会对其进行缩放,因为用户空间单位是页面的独立于设备的坐标系中的基本单位。因此,除非您希望更新页面描述中引用坐标的每个命令以保持页面尺寸,否则您不会希望强制使用毫米用户空间单位…;)

  •  类似资料:
    • 关于印刷标记 为打印准备图稿时,打印设备需要几种标记来精确套准图稿元素并校验正确的颜色。可以在图稿中添加以下几种印刷标记:裁切标记水平和垂直细(毛细)标线,用来划定对页面进行修边的位置。裁切标记还有助于各分色相互对齐。套准标记页面范围外的小靶标,用于对齐彩色文档中的各分色。颜色条彩色小方块,表示 CMYK 油墨和色调灰度(以 10% 增量递增)。服务提供商使用这些标记调整印刷机上的油墨密度。页面信

    • 本文向大家介绍C#实现pdf导出 .Net导出pdf文件,包括了C#实现pdf导出 .Net导出pdf文件的使用技巧和注意事项,需要的朋友参考一下 最近碰见个需求需要实现导出pdf文件,上网查了下代码资料总结了以下代码、可以成功的实现导出pdf文件。  在编码前需要在网上下载个itextsharp.dll,此程序集是必备的。楼主下载的是5.0版本,之前下了个5.4的似乎不好用。  下载之后直接添加

    • 关于印刷标记 为打印准备图稿时,打印设备需要几种标记来精确套准图稿元素并校验正确的颜色。可以在图稿中添加以下几种印刷标记: 裁切标记 水平和垂直细(毛细)标线,用来划定对页面进行修边的位置。裁切标记还有助于各分色相互对齐。 套准标记 页面范围外的小靶标,用于对齐彩色文档中的各分色。 颜色条 彩色小方块,表示 CMYK 油墨和色调灰度(以 10% 增量递增)。服务提供商使用这些标记调整印刷机上的油墨

    • 我有一堆pdf文件,有些是可搜索的常规pdf文件,有些是不可搜索的文件的扫描版本。我想提取每个pdf的内容。为了提取常规PDF的内容,我使用Apache Tika,为了从不可搜索的PDF中提取内容,我使用tesseract ocr。然而,我需要区分哪个pdf是nornal pdf,哪个不是。有办法吗?

    • 我试图在jrxml中创建表格。表格中的列数可能会很大,当我试图以PDF格式导出报告时,由于列数很大,数据变得不可读。有什么方法可以让我们以更大的页面尺寸(如A3)导出报告,或者在A4尺寸上增加滚动功能。注意:报告只需要导出为pdf格式,而不是CSV或任何其他格式。 谢谢,任何帮助感谢。

    • dw2pdf插件用于导出一个wiki页面为一个pdf文件。官网https://www.dokuwiki.org/plugin:dw2pdf 安装 下载并安装插件 下载mPdf库最新版,替换掉插件自带的 修改mpdf/config.php,大致44行,将useAdobeCJK改为true: 此时导出中文正常 修改Dokuwiki主题模版,添加导出按钮 // Dokuwiki template //