问题：

是否可以使用pytesseract从图像的特定部分提取文本

卜凯旋

2023-03-14

我在图像中有一个边框（矩形的坐标），我想在该坐标内提取文本。如何使用PyteSeract提取该坐标范围内的文本？

我尝试使用opencv将图像部分复制到其他numpyarray，比如

cropped_image = image[y1:y2][x1:x2]

并尝试了pytesseract。图像到字符串（）。但准确度很差。但当我试着把原始图像变成pytesseract时。它完美地提取了所有的东西。。

是否有任何功能可以使用pytesseract提取图像的特定部分？

这个图像有不同的部分信息考虑我有矩形坐标包围“在线食物递送系统”如何在PytEthARTACT中提取数据？

请帮忙，谢谢

我使用的版本：Tesseract 4.0.0 pytesseract 0.3.0 OpenCv 3.4.3

共有1个答案

阴雪风

2023-03-14

没有内置函数可以使用Pytesseract提取图像的特定部分，但我们可以使用OpenCV提取ROI边界框，然后将该ROI放入Pytesseract。我们将图像转换为灰度，然后使用阈值来获得二值图像。假设您有所需的ROI坐标，我们使用Numpy切片来提取所需的ROI

从这里我们把它扔进Pytesseract中得到我们的结果

ONLINE FOOD DELIVERY SYSTEM

密码

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = cv2.imread('1.jpg', 0)
thresh = 255 - cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

x,y,w,h = 37, 625, 309, 28  
ROI = thresh[y:y+h,x:x+w]
data = pytesseract.image_to_string(ROI, lang='eng',config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.imshow('ROI', ROI)
cv2.waitKey()

类似资料：

在Swing中，是否可以从工具箱中提取预定义的鼠标光标图像？

问题内容：当用户将鼠标悬停在可以单击以获取上下文相关帮助的对象上时，我想通过用问号“标记”内置默认鼠标光标来创建自定义帮助光标。我希望它可以跨平台/外观很好地工作（例如，看起来与白色的Windows鼠标和黑色的Mac鼠标一致。）是否有办法从当前工具包中获取光标图像，以便我可以生成一个组合图像设置为光标吗？这个问题指出，无法从Cursor对象获取信息。那里还有一条评论建议在JRE中钓鱼，我也尝试
在使用CNN时，我们能否明确指定要从图像中提取的特征

昨天我学习了卷积神经网络，并使用Tensorflow完成了一些CNN的实现，所有的实现都只指定了过滤器的大小、数量和步长。但当我了解到过滤器时，它说每一层上的过滤器都会提取不同的特征，如边、角等。我的问题是，我们能否明确指定过滤器，我们应该提取哪些特征，或者图像的哪个部分更重要等等所有的解释都是说，我们将输入图像的一小部分进行卷积滑动。如果是这样的话，我们是否要获取图像的所有部分并在图像上进行
使用VBA从Word文档中提取图像

我需要循环一些word文档，并从word文档中提取图像，并将其保存在单独的文件夹中。我尝试过将它们保存为超文本标记语言文档的方法，但它不太适合我的需求。现在，我使用inlineshapes对象循环浏览图像，然后将它们复制粘贴到publisher文档上，然后将它们保存为图像。但是，在运行脚本时，我会遇到运行时自动化错误。对于使用Publisher运行时库，我尝试了早期绑定和晚期绑定，但都遇到了错误
是否可以从Docker容器中提取Dockerfile

问题内容：我只是从Docker开始，因此能够看到用于创建现有Docker映像的Dockerfile将非常有帮助。即使图像是通过手动运行命令然后提交给标签来构建的，但出于学习目的和安全目的，能够看到图像的制作方式还是很不错的。有没有一种方法可以提取Dockerfile或用于构建给定Docker映像的命令列表？问题答案：您有很大帮助。如果没有任何步骤涉及stdin，它甚至可以用于生成dock
是否可以从docker容器中提取Dockerfile

我刚刚开始使用Docker，能够看到用于创建现有Docker图像的Dockerfiles将非常有帮助。
从PDF图像中提取文本

假设我的用户去了他们办公室的扫描仪。扫描仪能够生成扫描文档的PDF。这基本上就是我拥有的文件类型。我想做的是从这个PDF中提取文本。这不是“第一代”pdf，因为文本没有嵌入到pdf中。文本嵌入在PDF中的图像中。 PDFBox的iText中是否有允许检索此数据的功能？如果可能的话，我正在尝试避免对图像进行OCR。我希望IText或PDFBox中有一些内置的东西可以做到这一点。请注意，我不是在谈

是否可以使用pytesseract从图像的特定部分提取文本

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档