当前位置: 首页 > 知识库问答 >
问题:

用预定义的字体图像训练“Tesseract OCR”

仲孙诚
2023-03-14

我试图从图像中对ASCII字符串进行OCR识别。我正在使用Tesseract3库,但是在正确识别方面有一点问题,所以我需要用新的字符集(这是特定的)来训练它。我已经发现了这个how-to:TrainingTesseract3,但教程中有一些不必要的过程,我不需要,因为我的图像测试集很简单。我的图像数据集只包含1个行,其中每个ASCII字符在所有图像中都是相同的(没有旋转,没有缩放),但行中字符之间的距离(只有水平)是可变的。

如何使用字体图像训练识别算法?

暂时还没有答案

 类似资料:
  • 问题内容: 我是TensorFlow的新手。我正在寻找有关图像识别的帮助,可以在其中 训练自己的图像 数据集。 有没有训练新数据集的示例? 问题答案: 如果您对如何在TensorFlow中输入自己的数据感兴趣,可以查看本教程。 我也写与CS230的最佳做法指南在斯坦福这里。 新答案(带有)和带有标签 随着in的引入,我们可以创建一批没有占位符且没有队列的图像。步骤如下: 创建一个包含图像文件名的列

  • 数据增强采用的方法是从现有的示例中生成额外的训练数据,方法是通过增强,然后使用随机转换来生成看起来可信的图像。这有助于将模型公开给数据的更多方面,并更好地泛化。 所以我对此的理解是--例如,如果我没有太多的训练图像--我希望通过在现有的训练图像之外创建新的、增强的图像来生成额外的训练数据。 然后在上面链接的Keras文档中显示了如何将模块中的一些预处理层作为第一层添加到示例的模型中。所以从理论上讲

  • 几种重新培训MobileNet以便与TensorFlow.js一起使用的方法对我来说都失败了。有没有办法用TensorFlow.js来使用重新训练的模型? 使用基于hub的现代教程和使用似乎都失败了。 null null 目的是加载mobilenet,使用自定义数据重新训练,并在TensorFlow.js中使用它。遵循这两个教程似乎都失败了。这可以在Node.js内部完成吗?还有别的办法吗?我在哪

  • 我了解卷积核的工作原理及其在神经网络中的作用。然而,我不确定在典型的CNN中,你是否会预先定义卷积核是什么,或者这是否是CNN“弄明白”的东西例如,在制作CNN时,您是否可以简单地定义一些5x5卷积内核,如下所示: 或者你会简单地告诉CNN找到一个5x5内核,然后在训练后它会想出一个好的5x5内核?

  • 所有数字都提供在一个透明背景的png文件中。如果我从它创建一个盒子文件,训练它等等-所有工作都很好! 正如你所看到的,数字是完全一样的,以及位置等等。与图像1的唯一区别是,我使用了黄色背景,从现在开始,没有什么工作了。我创建了一个框文件,我设置了与第一个图像相同的位置: 然后我训练了这个盒子,但是结果的。tr文件是完全空的。我没有在这里停下来,完成了所有其他步骤。结果字体无法使用! 所以我的问题是

  • 大家已经提到了这个,这个,这个和这个,但是仍然发现很难建立一个自定义的名字查找器模型。。以下是代码: 我在尝试执行命令行时不断出现错误: 让我把论点1改为 然后我收到一个运行时错误,说你不能强制转换这个。这是我在线程“main”中强制转换 第二个问题是: 给出一个语法错误。不确定这里出了什么问题。如果有任何帮助,我将不胜感激,因为我已经尝试了上述链接上的所有代码片段。 祝好