当前位置: 首页 > 知识库问答 >
问题:

什么是好的算法捕捉一个像样的图像首先?之后是预处理/图像清洗,最后是OCR程序?

尹俊雅
2023-03-14

OCR应用前的图像清洗

如何提高Tesseract OCR的准确性?

什么是正确的预处理步骤,我应该遵循改善图像捕捉相机转换为文字使用OCR在Android?

  1. 如何确定设备上有文档或卡片?
  2. 如何确定卡片的所有有效区域都是完全可见的?

我能想到一些潜在的有用线索:

  • 运动
  • 特性点(很多很多选择,但如何正确使用它们)
  • 当内部相机被卡片或文档压缩时,强度级别会发生显著变化。

对于第一个问题,难点是动态背景,如过往行人、汽车、自然光突变等。

对于第二个问题,问题是卡片或文档的类型不是固定的,不幸的是--至少我被告知:(这使得分类解决方案有点棘手,因为没有办法收集足够的训练样本,更不用说一半或每季度插入的卡片了…

共有1个答案

艾敏学
2023-03-14

几天前我在做一个类似的项目。你可以查看这里的链接

它也有android版本。但是根据您的需求,Card.io是非常好的开源api。

git上的版本也可以读取温和的数学公式。

 类似资料:
  • 问题内容: 什么是最好的Java图像处理库/方法?[关闭]我同时使用JAI媒体API和ImageMagick吗? ImageMagick存在一些可伸缩性问题,基于JNI的JMagick也没有吸引力。与ImageMagick相比,JAI执行大小调整操作时的质量结果较差。 有谁知道过任何出色的开源或商业工具,它们都是本机Java并可以提供高质量的结果? 问题答案: 我知道这个问题已经很老了,但是随着新

  • 问题内容: 考虑以下测试案例: 输出: 对于为什么在相反的情况下最终发生捕获的原因有何解释? 问题答案: 由于中的区块没有区块,因此只有。该代码不会像您认为的那样“跳回”调用者,然后再“跳回”到调用者。

  • 我必须写一个程序,从一个从屏幕上拍摄的视频在司机面前的汽车,所以它只对数字进行OCR。我正在努力寻找实现它的方法。我在考虑使用openCV,但作为替代方案,我在考虑使用一个OCR程序,从视频中提取帧并找到数字。但是许多OCR程序不能正确地识别数字(也许OCR需要训练?)。所以我想用计算机视觉库来完成这项工作。 你认为实施这个简单程序的最佳方法是什么? 我想使用计算机视觉库和匹配的模板会很好,但也可

  • 在docker图像剪枝的docker文档中,可以使用-a标志来 删除所有未使用的图像,而不仅仅是悬空的图像 而后来

  • 当我跑的时候 我还没有最后一张图片——看起来像是第一次运行时的缓存图片。但是我通过name从docker运行这个图像,比如-一切正常。我已经尝试了主题“如何让docker compose始终从新图像重新创建容器”中的所有内容?我还尝试通过docker rmi image_name删除此图像,但没有任何帮助。可能是什么?

  • 我想知道是否有人试图使用类固醇应用程序拍摄图像,并通过api将其发布到后端? 我在他们自己的文档中发现的唯一关于图像处理的事情是如何捕获图像以及如何以base64编码保存它们,但是我如何使用base64编码的图像,并且是否可以通过api发布它们? 代码示例: $ scope . start capture = function(){ navigator . Camera . get picture