当前位置: 首页 > 面试题库 >

在pdf中的位置已知时使用pdfbox突出显示文本

相温文
2023-03-14
问题内容

当我有坐标时,pdfbox是否提供一些实用工具来突出显示文本?

文本的界限是已知的。

我知道还有其他库提供相同的功能,例如pdfclown等。但是pdfbox是否提供类似的功能?


问题答案:

好吧,我发现了这一点。很简单。

PDDocument doc = PDDocument.load(/*path to the file*/);
PDPage page = (PDPage)doc.getDocumentCatalog.getAllPages.get(i);
List annots = page.getAnnotations;
PDAnnotationTextMarkup markup = new PDAnnotationTextMarkup(PDAnnotationTextMarkup.Su....);
markup.setRectangle(/*your PDRectangle*/);
markup.setQuads(/*float array of size eight with all the vertices of the PDRectangle in anticlockwise order*/);
annots.add(markup);
doc.save(/*path to the output file*/);


 类似资料:
  • 问题内容: 我正在使用Apache PDFbox库从PDF文件中提取突出显示的文本(即黄色背景)。我对这个库是完全陌生的,并且不知道它用于哪个目的。到目前为止,我已经使用以下代码从注释中提取了文本。 现在,我需要突出显示文本,任何代码示例都将受到高度赞赏。 问题答案: 问题中的代码无法读取行中突出显示的确切文本,已经说明了大多数概念,这些概念可用于从具有PDFBox的页面上的有限内容区域提取文本。

  • 我使用Apache PDFbox库从PDF文件中提取突出显示的文本(即黄色背景)。我对这个库完全陌生,不知道该使用其中的哪个类。到目前为止,我已经使用下面的代码从注释中提取了文本。 现在我需要得到突出显示的文本,任何代码示例都将受到高度赞赏。

  • 问题内容: 我正在尝试突出显示与查询匹配的文本,但是我不知道如何使标记显示为HTML而不是文本。 当前输出: Java 脚本 所需的输出: Java 脚本 问题答案: 这是我简单的twoliner辅助方法: 它返回一个跨度,其中所请求的零件以标签突出显示。如果需要,可以简单地将其修改为使用其他标签。 更新: 为避免唯一键丢失警告,这是一个基于跨度并为匹配的零件设置fontWeight样式的解决方案

  • 结果是图像没有正确放置在文本上。我把文本位置弄错了吗? 这是一个关于如何获取PDF中每个字符的x/y坐标和大小的示例

  • 问题内容: 有人可以通过可以在网页上突出显示文本的JavaScript函数来帮助我。要求是-仅突出显示一次,而不是像我们在搜索情况下那样突出显示所有出现的文本。 问题答案: 您可以使用jquery 突出显示效果。 但是,如果您对原始javascript代码感兴趣,请看一下我得到的内容。将复制粘贴到HTML中,打开文件,然后单击“突出显示”-这应该突出显示“ fox”一词。在性能方面,我认为这适用于

  • 背景 我一直在开发一个程序,它可以获取一个pdf,突出显示一些单词(通过pdfbox标记注释)并保存新的pdf。 为此,我扩展了PDFTextStripper类,以覆盖writeString()方法并获取每个单词(框)的TextPositions,这样我就可以准确地知道文本在PDF文档中的坐标位置(TextPosition对象为我提供每个单词框的坐标)。然后,在此基础上,我画了一个矩形,突出显示我