当前位置: 首页 > 知识库问答 >
问题:

视频中的OCR?openCV还是OCR图像处理?

支智志
2023-03-14

我必须写一个程序,从一个从屏幕上拍摄的视频在司机面前的汽车,所以它只对数字进行OCR。我正在努力寻找实现它的方法。我在考虑使用openCV,但作为替代方案,我在考虑使用一个OCR程序,从视频中提取帧并找到数字。但是许多OCR程序不能正确地识别数字(也许OCR需要训练?)。所以我想用计算机视觉库来完成这项工作。

你认为实施这个简单程序的最佳方法是什么?

我想使用计算机视觉库和匹配的模板会很好,但也可能OCR可以帮助我。例如,有一些程序可以识别车牌。

所以任何建议都是欢迎的。

共有1个答案

尹兴生
2023-03-14

你可以通过谷歌找到很多。

查看此链接:OpenCV-Python中的简单数字识别OCR

它演示了使用OpenCV KNN的简单OCR。代码是用Python编写的,但函数是标准函数,因此您不会发现移植到其他语言有任何困难。

其他一些相关链接是:

  1. OpenCV中的基本OCR:OpenCV C++中的代码,仍然使用knn。
  2. 数字识别OCR示例官方:目前OpenCV Python示例中有一些数字识别OCR示例,我想其中一个也是用于视频的(我还没有尝试过)。你可以查一下。链接1链接2
 类似资料:
  • 我试图开发一个应用程序,使用Tesseract从手机摄像头拍摄的文件中识别文本。为了更好的识别,我使用OpenCV对图像进行预处理,使用高斯模糊和阈值方法进行二值化,但结果很糟糕。 我可以使用哪些其他过滤器来使图像对Tesseract更具可读性?

  • null 有些数字比其他数字更好用--例如,'1'似乎有很多麻烦。出现在“+”或“-”后面的数字通常不显示出来,“+”通常显示为“-”。我也玩了一下阈值。 最后三个部分是因为我的视频样本,我一直在画有点歪斜。我可以尝试使用一些更好的数据,我也可以尝试在标准的“letsgoDigital”朗上制作自己的训练数据。虽然我觉得我没有以最好的方式进行图像处理,但我希望得到一些指导。 我计划使用某种程度的边

  • 为了用OCR库tesseract获得更好的结果,我会做一些预处理,但还不知道什么步骤可以帮助我。 我试图用15因子调整图像的大小,并应用了一个适应的阈值(见图像),但这导致了“波浪”字符,这无法用tesseract OCR库检测到。在底部,你可以通过Dropbox找到我的图像链接。原始图像大小为115x18px,字符高度为10px。 我想从背景中提取人物。什么步骤可以导致更好的结果?对于OCR部分

  • 我为iOS写了一个数字OCR。我有一个测试图像png与两位数5和4。我找到轮廓了。我如何在Tesseract转乘等高线? 初始化tesseract: 用于检测轮廓的函数: GitHub项目链接:https://github.com/maxpatsy/iorc

  • 如何使用opencv和pytesseract从图像中提取文本? 从 PIL 导入触发器导入图像导入 np 从 matplotib 导入 pyplot 作为 plt 但这是在给错误—— Traceback(最近一次调用last):print pytesserac t . image _ to _ string(edges)File "/home/sroy 8091/中文件" open.py "的第1

  • 此示例使用卷积堆栈,后跟递归堆栈和 CTC logloss 函数,以对生成的文本图像进行光学字符识别。 我没有证据表明它实际上是学习文本的一般形状,还是仅仅能够识别所抛出的所有不同字体……它的目的更多是为了在 Keras 中演示CTC。 请注意,可能需要针对使用中的特定操作系统更新字体列表。 它从 4 个字母词开始。对于前12个轮次,使用 TextImageGenerator 类(同时是测试/训练