当前位置: 首页 > 知识库问答 >
问题:

如何使用java获取pdf中任意给定单词的(x,y宽度和高度)

东郭源
2023-03-14

我需要得到pdf中给定单词的x,y,宽度和高度。因此,在以后解析同一类型的文件时,我可以从坐标本身获取值。如何使用java从PDF中获取单词的位置。

Rectangle rect = new Rectangle(451, 125,100,1); // i need to get this co-ordate for any particular word
stripper.addRegion("class1", rect);
stripper.extractRegions(pdDocument.getPage(0));
System.out.println("stripper "+stripper.getTextForRegion("class1").trim());

共有1个答案

濮阳霄
2023-03-14

我认为您可以使用Apache的PDFBoxAPI,并遵循这个类似问题中的建议来编写所需的代码,这个问题是特定于该API的。

 类似资料:
  • 我有一个使用Imagick PHP的PDF文件的缩略图创建脚本。 它将创建PDF文件第一页的缩略图。 我能够生产的缩略图没有任何问题与固定的高度和宽度 我必须得到PDF文件第一页的高度和宽度,并相应地计算缩略图的高度和宽度。 如果我必须从一个图像创建缩略图,我可以使用PHP中的getimagesize函数,但是有没有像那样的函数来获取PDF文件第一页的高度和宽度呢?

  • 问题内容: 除了使用ImageIO.read来获取图像的高度和宽度外,还有其他方法吗? 因为我遇到了锁定线程的问题。 此错误仅在Sun应用服务器上发生,因此我怀疑这是Sun错误。 问题答案: 这很简单方便。

  • 显然,有两个方法和 是这样的: 我看了这篇文章,但它推荐了一种已弃用的方法: 如何在爪哇fx中获取标签

  • 本文向大家介绍使用Tkinter Python获取屏幕的高度和宽度,包括了使用Tkinter Python获取屏幕的高度和宽度的使用技巧和注意事项,需要的朋友参考一下 Tkinter是为Python程序提供GUI编程功能的库。作为GUI创建的一部分,我们需要创建不同大小和深度的屏幕布局。在此程序中,我们将看到如何以像素和毫米为单位计算屏幕尺寸。我们还可以获得以像素为单位的屏幕深度。作为Tkinte

  • 我有一个X字体字符串(如Arial字体)在定义宽度值时具有Y高度,这样字符串就可以进入多行。我需要计算所需的高度,以便所需的字符串可以适合它。Apache POI中的行自动大小是不可能的,因为我需要行合并单元格中存在的富文本字符串(任何字体和高度)的高度,在这种情况下自动大小不起作用。

  • 问题内容: 为什么下面的代码返回高度:-1,这意味着高度未知。如何获得图像的高度? 问题答案: 使用ImageIO.read(URL)或ImageIO.read(File)代替。加载时它将阻塞,返回后将知道图像的宽度和高度。 例如 或者,MediaTracker向由异步加载的映像中添加A ,Toolkit然后等待其完全加载。