当前位置: 首页 > 面试题库 >

Python-如何消除数独方块中的凸度缺陷?

冷翼
2023-03-14
问题内容

我当时在做一个有趣的项目:使用OpenCV(如Google护目镜等)从输入图像中解决数独。我已经完成了任务,但是最后我发现了一个我来到这里的小问题。

我使用OpenCV 2.3.1的Python API进行了编程。

以下是我所做的:

  1. 读取图像
  2. 找到轮廓
  3. 选择一个具有最大面积的((也有些等同于正方形))。
  4. 找到拐角点。

例如下面给出:

(请注意,绿线正确地与数独的真实边界重合,因此数独可以正确变形。请检查下一张图片)

  1. 使图像变形为完美的正方形

例如图片:

在此处输入图片说明

  1. 执行OCR(为此我使用了我在OpenCV-Python的简单数字识别OCR中给出的方法)

而且该方法效果很好。

问题:

在此图像上执行步骤4会得到以下结果:

画出的红线是原始轮廓,是数独边界的真实轮廓。

画出的绿线是近似轮廓,它将是变形图像的轮廓。

数独顶部的绿线和红线之间当然有区别。因此,在扭曲时,我并没有获得数独的原始边界。

我的问题 :

如何在数独的正确边界(即红线)上扭曲图像,或者如何消除红线和绿线之间的差异?OpenCV中有什么方法吗?


问题答案:

我有一个可行的解决方案,但是你必须自己将其转换为OpenCV。它用Mathematica编写。

第一步是通过将每个像素除以关闭操作的结果来调整图像的亮度:

src = ColorConvert[Import["http://davemark.com/images/sudoku.jpg"], "Grayscale"];
white = Closing[src, DiskMatrix[5]];
srcAdjusted = Image[ImageData[src]/ImageData[white]]

下一步是找到数独区域,因此我可以忽略(遮罩)背景。为此,我使用了连通成分分析,并选择了具有最大凸面面积的成分:

components = 
  ComponentMeasurements[
    ColorNegate@Binarize[srcAdjusted], {"ConvexArea", "Mask"}][[All, 
    2]];
largestComponent = Image[SortBy[components, First][[-1, 2]]]

通过填充此图像,我得到了数独网格的蒙版:

mask = FillingTransform[largestComponent]

现在,我可以使用二阶导数滤波器在两个单独的图像中查找垂直线和水平线:

lY = ImageMultiply[MorphologicalBinarize[GaussianFilter[srcAdjusted, 3, {2, 0}], {0.02, 0.05}], mask];
lX = ImageMultiply[MorphologicalBinarize[GaussianFilter[srcAdjusted, 3, {0, 2}], {0.02, 0.05}], mask];

我再次使用连接的分量分析从这些图像中提取网格线。网格线比数字长得多,因此我可以使用卡尺长度来仅选择与网格线相连的组件。按位置对它们进行排序,对于图像中的每个垂直/水平网格线,我得到2x10的蒙版图像:

verticalGridLineMasks = 
  SortBy[ComponentMeasurements[
      lX, {"CaliperLength", "Centroid", "Mask"}, # > 100 &][[All, 
      2]], #[[2, 1]] &][[All, 3]];
horizontalGridLineMasks = 
  SortBy[ComponentMeasurements[
      lY, {"CaliperLength", "Centroid", "Mask"}, # > 100 &][[All, 
      2]], #[[2, 2]] &][[All, 3]];

接下来,我将每对垂直/水平网格线进行放大,将它们相乘,计算出像素间的交点,并计算结果的中心。这些点是网格线的交点:

centerOfGravity[l_] := 
 ComponentMeasurements[Image[l], "Centroid"][[1, 2]]
gridCenters = 
  Table[centerOfGravity[
    ImageData[Dilation[Image[h], DiskMatrix[2]]]*
     ImageData[Dilation[Image[v], DiskMatrix[2]]]], {h, 
    horizontalGridLineMasks}, {v, verticalGridLineMasks}];

最后一步是为通过这些点的X / Y映射定义两个插值函数,并使用这些函数变换图像:

fnX = ListInterpolation[gridCenters[[All, All, 1]]];
fnY = ListInterpolation[gridCenters[[All, All, 2]]];
transformed = 
 ImageTransformation[
  srcAdjusted, {fnX @@ Reverse[#], fnY @@ Reverse[#]} &, {9*50, 9*50},
   PlotRange -> {{1, 10}, {1, 10}}, DataRange -> Full]

所有操作都是基本的图像处理功能,因此在OpenCV中也应该可行。基于样条的图像转换可能会更困难,但我认为你并不是真的需要它。可能使用你现在在每个单个单元格上使用的透视变换,将获得足够好的结果。



 类似资料:
  • 我在做一个有趣的项目:使用OpenCV(如谷歌护目镜等)从输入图像中求解数独。我已经完成了任务,但最后我发现了一个小问题,我来到这里。 我使用OpenCV 2.3.1的Python API进行编程。 以下是我所做的: > 读取图像 找到轮廓 选择面积最大的一个,(也有点等同于正方形)。 找到角点。 e、 g.如下所示: (请注意,这里的绿线与数独的真实边界正确重合,因此可以正确扭曲数独。请查看下一

  • 从“反应”中导入{useEffects, useState}; 常量使用斯皮斯 = () = } 导出默认使用小工具;

  • 两天前,我得到了一个我试图用Python 3解决的数独问题。我被告知确实存在一个解决方案,但我不确定是否存在多个解决方案。 问题如下:一个9x9的数独网格完全是空的。然而,它确实包含彩色框,在这些框中,数字的总和必须是一个平方数。除此之外,通常的数独规则也适用。 这里的问题不是解决一个数独谜题,而是生成一个可行的谜题,满足彩色框的规则。 我的策略 使用numpy数组,我将网格划分为81个索引,这些

  • 问题内容: 我正在编写一个应用程序,该应用程序必须从几个模块(.py文件)中获取元数据(author,version..etc)并显示它们。用户选择一个脚本并执行该脚本。(可以像插件系统一样从目标文件夹中添加新脚本,并从目标文件夹中获取旧脚本)。 首先,我导入一个脚本,然后取出元数据,然后继续下一步。但是我想取消导入除用户选择的模块以外的所有其他模块。 我该如何实施? 我尝试了这些 后者不起作用。

  • 我有一个85列的大数据框。丢失的数据已编码为。我的目标是获得每列中缺少的数据量。所以我写了一个for循环来创建一个列表来获取金额。但它不起作用。 以下是我的代码: 我尝试使用循环中的代码,通过将更改为某一列的名称,来生成该列缺少的值的数量,然后代码运行并给出该列缺少的数据的数量。 因此,我不知道如何更正for循环代码。有人能帮我吗?我非常感谢你的帮助。

  • 本文向大家介绍Python读取数据集并消除数据中的空行方法,包括了Python读取数据集并消除数据中的空行方法的使用技巧和注意事项,需要的朋友参考一下 如下所示: 以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程。