当前位置: 首页 > 知识库问答 >
问题:

如何使用一个图像的tesseract输出从另一个图像创建可搜索的pdf

陶智
2023-03-14

我有一张png图像,为了更好的tesseract OCR质量,我对它进行了改进,之后我需要从原始图像制作一个可搜索的pdf。

我可以使用以下python代码,通过tesseract从改进后的图像创建一个可搜索的pdf:

f = open("programme.pdf", "w+b")
file = sys.argv[1]

black_and_white = create_black_and_white(image=file, threshold=150) # function converting the image to black and white with some filtering
pdf = pytesseract.image_to_pdf_or_hocr(black_and_white, config=custom_tesseract_config, extension='pdf')
f.write(bytearray(pdf))

f.close()

然而,我想要的不是用我创建的黑白图像创建一个PDF,而是使用该b的tesseract输出

共有1个答案

仰雅昶
2023-03-14

这是一个愚蠢的问题,我只是表明我没有仔细思考我试图实现的目标。

我通过简单地添加结果b来解决这个问题

 类似资料:
  • 问题内容: 我正在尝试建立一个简单的Java程序,该程序可以从其他多个图像(jpg)创建一个动画gif。谁能给我一个有关如何在Java中实现此目标的信息?我已经搜索过Google,但找不到任何真正有用的信息。 感谢你们! 问题答案: 这里有一个类的示例,该类从不同的图像创建动画的gif: 链接 编辑:链接似乎已死。 无论如何,为了清楚起见,这段代码是由Elliot Kroo完成的。 编辑2:感谢您

  • 问题内容: 搜索后,我没有在网上或任何其他资源中找到任何东西,我想知道您是否可以通过联接另一个视图和一些其他表来形成一个视图?我猜类似的东西与Server_ref.part_notification_view是要加入的视图。 问题答案: 您当然可以在另一个视图的基础上建立一个视图: 但是您不能引用基础表中的任何内容,包括不属于视图的任何字段: 具有相同列的基础表不是问题,并且如果您在视图中包含的内

  • 我使用Android Studios 1.5 我正在尝试做一些非常简单的事情:在我的项目中添加一个大的图像,作为我主要活动的背景。当我右键单击res时- 我做错了什么?我读过好几页,没有其他人有过这个问题。

  • 问题内容: 我是Rails编程的初学者,试图在页面上显示许多图像。有些图像要放在其他图像之上。为简单起见,假设我要一个蓝色正方形,在蓝色正方形的右上角有一个红色正方形(但在角落不紧)。由于性能问题,我试图避免进行合成(使用ImageMagick等)。 我只想相对于彼此放置重叠的图像。 举一个更困难的例子,想象一下将里程表放在更大的图像中。对于六位数字,我将需要合成一百万个不同的图像,或者即时进行处

  • 问题内容: 我需要拍摄图像并将其放置在新的生成的白色背景上,以便将其转换为可下载的桌面墙纸。因此该过程将进行: 生成具有1440x900尺寸的新全白图像 将现有图像放在顶部居中 另存为单个图像 在PIL中,我看到了该对象,但是没有任何迹象表明它可以将现有的图像数据绘制到另一个图像上。任何人都可以推荐的建议或链接? 问题答案: 这可以通过Image实例的方法来完成: 可以在Nadia Alramli

  • 问题内容: 我需要从另一个目录打开一个图像,但是当我尝试像这样输入整个路径名时,以下代码不起作用。 我正在尝试打开图像。我正在这样做,所以我可以为该代码制作GUI,但是我真的很困。我尝试了很多事情,但似乎没有任何效果。任何建议将不胜感激。 问题答案: 你可以尝试任何一个