问题：

使用tesseract或OpenCV进行android对象检测

濮阳翔

2023-03-14

我已经成功地将镶嵌到我的Android应用程序中，它可以读取我捕获的任何图像，但准确性非常低。但大多数时候，我在捕获后没有得到正确的文本，因为感兴趣区域周围的一些文本也会被捕获。

我想阅读的只是来自矩形区域的所有文本，准确，没有捕捉矩形的边缘。我已经做了一些研究，并在stackoverflow上发布了两次，但仍然没有得到满意的结果！

以下是我发的2个帖子：

https://stackoverflow.com/questions/16663504/extract-text-from-a-captured-image?noredirect=1#comment23973954_16663504

从机器人中捕获的图像中提取信息

我不确定是继续使用宇宙魔方还是使用openCV

共有2个答案

金亦

2023-03-14

提高 OCR 输出的解决方案是

> < li>

要么使用更多的训练数据来更好地训练它

使用一些线性过滤器过滤输入（灰度、高对比度、模糊）

在聊天中，我们发布了一些描述ocr中使用的过滤技术的链接，但没有发布示例代码。

发布的一些链接是

改进对 OCR 的输入

如何训练宇宙魔方

使用非对称过滤器的文本增强

OCR分类

令狐宏浚

2023-03-14

包括其他人的许多链接和答案，我认为后退一步并注意到光学字符识别（OCR）实际上有两个基本步骤是好的：

现在，还有两种应用OCR的常规设置:

Tesseract原样最适用于“受控”设置。一般来说，但特别是对于场景OCR，“重新训练”Tesseract不会直接提高检测，但可能会提高识别能力。

如果您正在寻求改进场景文本检测，请参阅此工作;如果您正在研究改进场景文本识别，请参阅此工作。由于您询问了检测，因此检测参考使用最大稳定极值区域（MSER），它具有大量实现资源，例如，请参阅此处。

这里还有一个专门针对Android的文本检测项目：
https://github.com/dreamdragon/text-detection

正如许多人所指出的，请记住，识别仍然是一个开放的研究挑战。

共有2个答案