当前位置: 首页 > 面试题库 >

将文本图像分离为组成字符图像

马哲
2023-03-14
问题内容

我想将文本图像分成组成字符,也作为图像。例如,使用下面的示例,我最终得到14张图像。

我只会在一行上使用文本,因此y高度并不重要-我需要找到的是每个字母的开头和结尾,并裁剪到这些坐标。这样,我还可以避免出现“ i”,“ j”等问题。

我是图像处理的新手,我不确定该怎么做。某种形式的边缘检测?有没有办法确定连续的单色区域?任何帮助都很棒。

为了提高我的Python技能和对许多可用库的熟悉程度,所以我使用了Python Imaging
Library(PIL)
,但我也了解了OpenCV。

样本图片:

这是一些文字


问题答案:

这不是一件容易的事,尤其是在背景不均匀的情况下。如果您拥有的是已经像示例一样的二进制图像,则它会稍微简单一些。

如果您的图片不是二进制图像,则可以开始应用阈值算法(Otsu自适应阈值效果很好)

之后,可以使用标记算法来识别形成形状的每个像素“岛”(在这种情况下为每个字符)。

当您有噪音时,就会出现问题。标记过但您不感兴趣的形状。在这种情况下,您可以使用某种启发式方法来确定形状何时为字符(如果文本位于定义明确的位置,则可以使用归一化区域,对象的位置等)。如果这还不够,您将需要处理更复杂的人员,例如形状特征提取算法和某种模式识别算法,例如多层感知器。

最后,这似乎是一项容易的任务,但是取决于图像的质量,可能会变得更加困难。此处引用的算法可以在Internet上轻松找到,也可以在某些库(如OpenCv)中实现。

还有更多帮助,请问,我当然可以帮忙;)



 类似资料:
  • 问题内容: 我正在尝试将base64图像字符串转换为图像文件。 使用以下代码将其转换为图像文件: 但是我遇到了错误,这是怎么了? 问题答案: 问题是编码内容中包含该内容。当base64函数对其进行解码时,这将导致无效的图像数据。像这样在解码字符串之前先删除函数中的数据。

  • 问题内容: 这是一个有趣的话题。基本上,我有一个包含一些文本的图像。如何从图像中提取文本? 我已经尝试了很多事情,但是我所做的一切都很繁琐,通常无法正常工作。我只是想知道是否有一个相当简单的方法来做到这一点。 我遇到了这个问题:http : //sourceforge.net/projects/javaocr/。我已经尝试了好几个小时,但是我无法将其从图像中转换为文本。 谢谢大家! 问题答案: 您

  • 问题内容: 我有一个包含HTML标记的字符串变量。该HTML标记基本上表示电子邮件内容。 现在,我想从该字符串内容创建一个图像,该图像实际上包含HTML标记。我不想通过将这些内容写入它们来创建HTML文件。我只想使用此字符串创建图像文件。 这是我所拥有的: 如何从该字符串内容创建图像? 问题答案: 感谢大家的回应。我使用HtmlRenderer外部dll(库)来实现相同目的,并在下面的代码中找到了

  • 问题内容: 我正在尝试使用jQuery插件即crop.js裁剪/调整用户个人资料图像的大小,该插件通过ajax将用户图像作为base64发送给我的控制器 但我无法解码此base64 字符串作为图像,你们可以指导我如何将base64字符串作为图像保存在服务器上吗? 问题答案: 假设有几件事,您知道输出文件名是什么,并且您的数据以字符串形式出现。我确定您可以修改以下内容以满足您的需求: 请注意,这只是

  • 我正在尝试使用jquery插件裁剪/调整用户配置文件图像的大小,即crop.js,它将用户图像作为base64通过ajax发送到我的控制器

  • 问题内容: 一周前,我开始学习python,并希望编写一个小程序将电子邮件转换为图像(.png),以便可以在论坛上共享它,而不必冒大量垃圾邮件的风险。 似乎python标准库不包含可以执行此操作的模块,但我发现有一个适用于此的模块()。 我的问题是我似乎无法正常工作。 所以基本上我的问题是: 如何在图像上绘制文本。 如何创建空白(白色)图像 有没有一种方法可以在不实际创建文件的情况下执行此操作,以