当前位置: 首页 > 知识库问答 >
问题:

删除opencv中文本周围的黑线

于恺
2023-03-14

我试图删除文本周围的黑线(如果有)。我的目的是让图像有足够的部分来提取其中的每个字符。当我试图提取字符时,额外的黑线是噪声。

我尝试过在opencv中使用泛滥填充,但图像在左上角的黑线开始之前包含一些白色像素。所以它没有结果。我尝试通过寻找轮廓来裁剪,但即使这样也不起作用。图像如下:

import cv2
import numpy as np

img = cv2.imread('./Cropped/22.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,1,255,cv2.THRESH_BINARY)
contours,hierarchy = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnt = contours[0]
x,y,w,h = cv2.boundingRect(cnt)
crop = img[y:y+h,x:x+w]

cv2.imshow('Image',img)
cv2.imshow('Cropped Image',crop)
cv2.waitKey(0)

并利用洪水填埋场

img = cv2.imread('./Cropped/22.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# threshold the gray image to binarize, and negate it
gray = cv2.bitwise_not(gray)
w = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, \
                          cv2.THRESH_BINARY, 15, -2)

# find external contours of all shapes
contours,h = cv2.findContours(bw, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)

# create a mask for floodfill function, see documentation
h,w,_ = img.shape
mask = np.zeros((h+2,w+2), np.uint8)

# determine which contour belongs to a square or rectangle
for cnt in contours:
    poly = cv2.approxPolyDP(cnt, 0.02*cv2.arcLength(cnt,True),True)
    if len(poly) == 4:
        # if the contour has 4 vertices then floodfill that contour with black color
        cnt = np.vstack(cnt).squeeze()
        _,binary,_,_ = cv2.floodFill(bw, mask, tuple(cnt[0]), 0)
# convert image back to original color
binary = cv2.bitwise_not(binary)        

cv2.imshow('Image', binary)
cv2.waitKey(0)
cv2.destroyAllWindows()

这两种情况的结果如下

但似乎没有什么变化

不会删除任何边框。这两个代码的思想都是从对类似问题的堆栈溢出回答中获得的。

编辑

我在@rayryeng的评论中提到了解决方案。但是当我输入裁剪图像进行数字提取时,我得到了这些图像和错误的结果。我想一些嘈杂的像素没有被删除。这是原始图像原始图像。阈值图像是阈值图像。提取的轮廓如下第一轮廓、第二轮廓、第三轮廓、第四轮廓。如果能有一个通用的解决方案,那就太好了。

共有1个答案

计泉
2023-03-14

请注意,黑线所占的面积明显小于文本本身。此外,我们可以利用文本紧密相连这一事实。因此,我可以建议将文本blob合并在一起,使它们成为一个大blob。利用顶部有一个斑点,底部有一个斑点的事实,一旦我们检测到轮廓,我们希望有三个斑点,然后选择面积最大的斑点,并围绕其形成一个边界矩形。

您可以将二进制blob与形态学关闭连接在一起,然后找到轮廓并提取它们的区域。作为额外的处理,让我们也稍微放大blob,以便在裁剪之前可以看到更多的文本背景。之后,选择面积和裁剪最大的blob。

请注意,我不仅要对图像设置阈值,还要在黑色区域变为白色时执行反向阈值,反之亦然。此外,我必须将阈值从1更改为128。将无符号8位图像的阈值设置为1意味着您正在创建一个几乎所有内容都是白色的二进制图像。对于这样的图像,您必须增加容差。最后,cv2。在OpenCV 2.4之间,findContours的调用方式略有不同。x和OpenCV 3。x、 总之,该方法还有一个额外的输出,它是您提供给该方法的源图像,因此您可以安全地忽略它。

import cv2
import numpy as np

img = cv2.imread('MgPg8.jpg') # Image saved offline on my computer
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,128,255,cv2.THRESH_BINARY_INV) # Change

# Perform morphological closing
out = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, 255*np.ones((11, 11), dtype=np.uint8))
# Perform dilation to expand the borders of the text to be sure
out = cv2.dilate(thresh, 255*np.ones((11, 11), dtype=np.uint8))

# For OpenCV 3.0
_,contours,hierarchy = cv2.findContours(out,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) # Change
# For OpenCV 2.4.x
# contours,hierarchy = cv2.findContours(out,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

# Find the area made by each contour
areas = [cv2.contourArea(c) for c in contours]

# Figure out which contour has the largest area
idx = np.argmax(areas)

# Choose that contour, then get the bounding rectangle for this contour
cnt = contours[idx]
x,y,w,h = cv2.boundingRect(cnt)

# Crop
crop = img[y:y+h,x:x+w]

cv2.imshow('Image',img)
cv2.imshow('Thresholded Image',thresh)
cv2.imshow('Closed Image',out)
cv2.imshow('Cropped', crop)
cv2.imwrite('thresh.png', thresh)
cv2.imwrite('binary.png', out)
cv2.imwrite('crop.png', crop)
cv2.waitKey(0)
cv2.destroyAllWindows()

对于阈值图像、经过形态学处理的图像以及最后的裁剪图像,我得到以下结果:

 类似资料:
  • 我想检查一下我可以使用哪些方法来删除匿名蓝色轮廓

  • 问题内容: 我尝试在鼠标光标位于帮助图标上时显示跨度。 它可以工作,但是尽管如此,我还是无法删除图标周围的边框。 我的CSS: 光盘 问题答案: 尝试这个: 您还可以通过以下方式限制范围并仅删除某些图像上的边框: 可以在此处找到有关border css属性的更多信息。 编辑:将边框从更改为。如注释中所述,对于的单位是多余的。

  • 问题内容: 我需要拍摄图像并经过一些处理将其保存。显示该图形时,它看起来不错,但是保存该图形后,在保存的图像周围有一些空白。我尝试过方法的选项,也没有用。编码: 我正在尝试通过在图上使用NetworkX绘制基本图形并将其保存。我意识到没有图它会起作用,但是当添加一个图时,在保存的图像周围会出现空白; 问题答案: 我不能说我确切知道我的“解决方案”为什么起作用或如何起作用,但是当我想将几个机翼截面的

  • $format = new \Vtiful\Kernel\Format($fileHandle); $style = $format->strikeout()->toResource();

  • 尝试在SVG文本周围设置边框,但我得到的结果不一样。 HTML:(使用mute类) CSS:

  • 在预览和电话中,它看起来像: 你可以在底部区域的按钮上看到,那里有一些填充。 我怎样才能摆脱那个,让按钮完全填满底部区域?