当前位置：首页 > 面试题库 >

识别图像中的数字

郑翰海

2023-03-14

问题内容：

我一直在寻找网络上图像识别数字的资源。我发现许多链接提供了有关该主题的大量资源。但不幸的是，这比提供帮助更令人困惑，我不知道从哪里开始。

我有一个带有5个数字的图像，没有打扰（没有验证码或类似的东西）。数字在白色背景上为黑色，以标准字体书写。

我的第一步是分离数字。我当前使用的算法非常简单，它只是检查一列是否完全为白色，因此是否为空格。然后，它会修剪每个字符，以使其周围没有白色边框。这很好。

但是现在我对数字的实际识别感到困惑。我不知道猜测正确的最佳方法是什么。我不认为直接与字体进行比较是个好主意，因为如果数字仅略有不同，它将不再起作用。

谁能给我一个有关如何完成此操作的提示？

这个问题无关紧要，但是我将用C＃或Java实现。我找到了一些可以完成这项工作的库，但是我想自己实现它，以学习一些东西。

问题答案：

为什么不考虑使用Tesseract之类的开源OCR引擎呢？

http://code.google.com/p/tesseract-ocr/

Tesseract的C＃包装器

http://www.pixel-technology.com/freeware/tessnet2/

Tesseract的Java包装器

http://sourceforge.net/projects/tessocrinjava/

尽管您可能不考虑自己使用第三方库来实现它，但仅集成第三方工具就有大量工作要做。还请记住，看似简单的事情（识别数字5与数字6）通常非常复杂；我们正在谈论成千上万行复杂的代码。至少，请查看tesseract的源代码，这将为您提供充分利用第三方库的充分理由。

这是另一个SO问题，可为您提供有关所涉及算法的一些想法：
https
: //stackoverflow.com/questions/850717/what-are-some-popular-ocr-
algorithms

类似资料：

TensorFlow识别图像

TensorFlow包含图像识别的特殊功能，这些图像存储在特定文件夹中。出于安全目的，经常要识别相同的图像，这个逻辑很容易实现。图像识别代码实现的文件夹结构如下所示 - dataset_image 文件夹中包含需要加载的相关图像。这里将专注于图像识别，其中定义了徽标。加载“load_data.py”脚本，它记录各种图像识别模块。图像的训练用于将可识别的图案存储在指定的文件夹中。上面的代码行生
图像识别-Tensorflow

我正在使用卷积神经网络（CNN）对30种不同的水果进行图像检测。我目前拥有的数据集由“训练”和“测试”文件夹组成，每个文件夹都有30个不同类的子目录。 “train”文件夹共有671个jpg文件，“test”文件夹共有300个jpg文件。我编写的实现图像检测的Python代码如下- 当我尝试执行此代码时，我得到以下消息- 使用TensorFlow后端。找到了属于30个类别的671张图片。找到了3
无法识别图像文件中的数据

我有以下问题。我生成。使用外部应用程序的GIF文件。对我来说，GIF看起来不错，我可以毫无问题地打开它们。然而，使用要将图像添加到Tkinter标签，会出现以下错误： Tcl错误：无法识别图像文件“C:\Users\D8W\Python\hoang\combi ne\u model\u neu\test\u bauteile\SQTR-VO\prev\u F45\u SQTR.GIF”中的数据
1.5.20 人脸识别/图像识别/OCR

更新时间：2019-07-19 10:48:36 节点简介人脸识别/图像识别/OCR节点属于智能节点，区别在于封装的云市场api功能不同。人脸识别节点主要有人数检测、人脸身份证对比、性别年龄情绪识别等功能。图像识别节点主要有烟雾火焰火灾识别、动物识别、植物识别、植物花卉识别等功能。OCR节点主要有驾驶证识别、车牌识别、身份证识别等功能。使用场景如果您需要进行人数检测、人脸身份证对比、性别年龄
Tkinter错误：无法识别图像文件中的数据

我想把一张jpg图片放到tkinter画布上。tkinter给了我这个错误：无法识别图像文件中的数据我使用文档中的代码： png图像也是如此。甚至尝试将图像放入标签小部件，但也出现了相同的错误。发生了什么？我在Mac上使用Python3。Python文件和图像位于同一文件夹中。
Python图像识别+KNN求解数独的实现

本文向大家介绍Python图像识别+KNN求解数独的实现，包括了Python图像识别+KNN求解数独的实现的使用技巧和注意事项，需要的朋友参考一下 Python-opencv+KNN求解数独最近一直在玩数独，突发奇想实现图像识别求解数独，输入到输出平均需要0.5s。整体思路大概就是识别出图中数字生成list，然后求解。输入输出demo 数独采用的是微软自带的Microsoft sudoku软

相关阅读

Image.open（）无法识别图像文件-Python？使用Java识别2个相同的图像如何训练libsvm格式的图像（像素）数据以用于Java识别 python实现连连看辅助（图像识别）C#识别出图片里的数字和字母

相关文章

物联网生物识别领域 PHP 图像处理 Bootstrap4 图像形状 Bootstrap5 图像形状 Matplotlib图像处理

相关问答

字符识别前的OpenCV图像预处理（tesseract）TIFF图像支持表单识别器 Python人脸识别图像比较：Reg 图QL突变中无法识别的参数 R光栅识别黑色光栅图像

相关工具

iOS 语音识别树洞 OCR 文字识别讯飞语音识别 ReKognition云端人脸识别API 利用CoreImage进行人脸识别

相关文档

Linkface 人脸识别技术帮助文档知识图谱技术与应用知识图谱：方法、实践与应用 Python OpenCV 图像和视频分析 JavaScript 高级的知识点