当前位置: 首页 > 知识库问答 >
问题:

做OCR前的预处理(tesseract,OpenCV)

史昱
2023-03-14

为了用OCR库tesseract获得更好的结果,我会做一些预处理,但还不知道什么步骤可以帮助我。

我试图用15因子调整图像的大小,并应用了一个适应的阈值(见图像),但这导致了“波浪”字符,这无法用tesseract OCR库检测到。在底部,你可以通过Dropbox找到我的图像链接。原始图像大小为115x18px,字符高度为10px。

我想从背景中提取人物。什么步骤可以导致更好的结果?对于OCR部分,我是否应该使用另一个OCR库而不是tesseract?在使用tesseract进行文本检测时,您通常有哪些经验?或者你可以选择另一个图书馆,还是商业图书馆?

Dropbox链接到示例图像

OTSU门限作为自适应门限提供了更好的结果。将在接下来的几天里给出关于其他答案的更新!

更新01.07.2015有另一个示例图像,其中serialnumber应该使用Tesseract识别。由于字体大小很小,识别效果不是很好。有什么想法,什么样的方法可以帮助这里?

共有1个答案

微生俊捷
2023-03-14

Otsu阈值在这里给了我更好的结果。结合距离变换和另一个阈值,我甚至得到了Tesseract几乎可以识别的内容。

这是我得到的结果:

6ANFK9PC)100'0-gt

 类似资料:
  • 我试图开发一个应用程序,使用Tesseract从手机摄像头拍摄的文件中识别文本。为了更好的识别,我使用OpenCV对图像进行预处理,使用高斯模糊和阈值方法进行二值化,但结果很糟糕。 我可以使用哪些其他过滤器来使图像对Tesseract更具可读性?

  • null 有些数字比其他数字更好用--例如,'1'似乎有很多麻烦。出现在“+”或“-”后面的数字通常不显示出来,“+”通常显示为“-”。我也玩了一下阈值。 最后三个部分是因为我的视频样本,我一直在画有点歪斜。我可以尝试使用一些更好的数据,我也可以尝试在标准的“letsgoDigital”朗上制作自己的训练数据。虽然我觉得我没有以最好的方式进行图像处理,但我希望得到一些指导。 我计划使用某种程度的边

  • 我正在使用tess4j作为来自JAVA的tesseract的包装器对图像运行一系列OCR。ocr的过程仍然需要大量的时间(有时甚至是5秒),我正在努力加快它。 我正在做我自己的图像预处理和二值化,这是没有必要的宇宙魔方做大津二值化。 我已经阅读了IOS的教程,该教程允许跳过图形处理部分,但是我无法使用tess4j找到任何内容。 这里的turial:https://github.com/gali8/

  • Tesseract OCR 该软件包包含一个OCR引擎 -  libtesseract和一个命令行程序 -  tesseract。 Tesseract 4增加了一个基于OCR引擎的新神经网络(LSTM),该引擎专注于线路识别,但仍然支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用Legacy OCR Engine模式(--oem 0)启用与Te

  • 我试图开发一个简单的车牌识别PC应用程序(Java+OpenCV+Tess4j)。图像不是真的好(在进一步,他们将是好的)。我想为tesseract预处理图像,我被困在车牌检测(矩形检测)上。 我的脚步: 1)源图像 我用油漆从图像(第四步后)中裁剪出所需的区域,并得到: 然后我做了OCR(通过tesseract,tess4j): 而且得到了(足够好?)结果-“Y841OX EH”(几乎正确)

  • Tesseract OCR iOS 是个 iOS5+ 框架,支持 armv7s 和 arm64 编译。 Tesseract 可能是最精确的开源 OCR 引擎,结合 Leptonica 图像处理库可以查看大量的图像格式,支持超过 60 种语言的文本转换。