当前位置: 首页 > 知识库问答 >
问题:

pdfbox-获取行或文本字体大小/格式

宗政卓
2023-03-14

我试图从pdf文件中获得特定文本或行的字体大小或格式(粗体等),但没有任何成功到现在。

使用下面的PDFTextStripper只能得到纯文本

PDFTextStripper tripper=新的PDFTextStripper();String actualText=stripper.gettext(actualDoc);

你能帮我做这个吗?谢了。

共有1个答案

周玺
2023-03-14

您需要扩展pdftextstripper并覆盖pdftextstripper#processtextposition。此方法允许您访问TextPosition对象,字体属性保存在该对象中。然后,您需要收集位于指定框(您的行)中的所有TextPositions并将它们放在一起。

 类似资料:
  • 我正在使用最新的PDFBOX库来提取文本,为了做到这一点,我编写了我的自定义PDFStreamEngine(shwoing部分代码,但其余应该类似): 然而,我有三个问题:第一个:“Tf”操作符-在PDF/F1中1 Tf:当我显示fontName和size时,它显示:evmanj+myriadpro-regular,size 1;但是,illustrator和adobe Acrobat上的实际字体

  • 我有一个带有表单字段的现有pdf文件,可以由用户填写。此表单字段具有创建pdf文件时定义的字体和文本对齐方式。 我使用Apache PDFBox在pdf中查找表单字段: 如果我将表单字段的内容设置为 然后表单字段中的文本具有与此字段预定义的相同的字体和对齐方式。 但我需要第二个字段的对齐方式和字体(顺便说一句,这不是表单字段)。 如何找出该表单字段定义了哪种对齐方式(左、中、右)和哪种字体(我需要

  • PDF内容流 表示pdf使用F1字体,设置fontsize 40.959999。 我有一个关于实际字体大小是否为40.959999的问题。因为字体大小40太大了,但是在adobe arcrobat pro中显示的文本没有那么大。 在此pdf中没有意义

  • 我正在编写一个应用程序,它使用PDFbox库来填充PDF文件中的字段。 在其中一个字段中,我将文本设置为希伯来字母。 当我在Android设备上运行代码时,我会得到以下日志: 我试图在堆栈溢出中找到一些关于它的信息,但我找到的答案都与填充表单有关。它都与有关。 你能帮我解决这个错误并用PDFBox在表格中填写希伯来字母吗?

  • PDFBox的字体类PDFont中有一个名为getFontHeight的方法,听起来很简单。然而,我不太理解文档和参数代表什么。 这将获得字符的字体宽度。 参数: c-要获取宽度的字符代码。 偏移量-数组中的偏移量。长度 数据的长度。 返回:宽度为1000个文本空间单位,即333或777 在PDFBox中,这个方法是用来获取角色高度的正确方法吗?如果是的话,如何获取?字体高度和字体大小之间是否存在

  • 问题内容: 我在这里阅读一个问题,试图获取文本的字体大小。他们给出的答案是使用测量方法获得像素大小。我想要做的就是获取字体大小值,以便我可以更改它。 例如: 尽管这两个都可以,但此示例不起作用 唯一的问题是它仅更改一次大小。 问题答案: 仅抓住一个元素可能不起作用。如果由样式表定义,则将报告(空字符串)。 您应该使用window.getComputedStyle。