当前位置: 首页 > 文档资料 > OpenCV 中文文档 >

3.1 图片基本操作

优质
小牛编辑
127浏览
2023-12-01

目标

  • 获取像素的值并更改它们
  • 获取图像属性
  • 设置感兴趣的区域(Region of Interest,ROI)
  • 分割和合并图像

几乎所有这些操作都和 Numpy 相关而和 OpenCV 没什么关系。精通 Numpy 对于写高度优化的 OpenCV 代码是必要的。

(例子将使用 Python 控制台,因为它们中大多数程序都只是一行代码)

获取和更改像素的值

让我们先读取一个彩色图片:

>>> import cv2
>>> import numpy as np

>>> img = cv2.imread('messi5.jpg')

你可以使用一个像素的横纵坐标获取一个像素。对于BGR格式的图片,它会返回一个由蓝色、绿色和红色值组成的数组。对于灰度图片,只会返回对应的亮度。

>>> px = img[100,100]
>>> print(px) # [157 166 200]

# 只获取蓝色的像素
>>> blue = img[100,100,0]
>>> print( blue ) # 157

你可以用同样的方式修改像素的值。

>>> img[100,100] = [255,255,255]
>>> print(img[100,100]) # [255 255 255]

警告

Numpy是一个针对数组计算高度优化过的库。所以简单地获取每个像素的值并修改它是很慢的,我们不推荐这样做。

上面提到的方法常常用来选择数组的一个区域,比如说前5行或者最后三列这样。对于单个像素,Numpy数组方法array.item()array.itemset()更合适些。但这两个函数总是返回一个标量。所以如果你想要获取所有B、G、R的值,你需要对每种颜色分别调用array.item()

更好地像素获取和编辑方法:

# 获取红色的值
>>> img.item(10,10,2) # 59

# 修改红色的值
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2) # 100

获取图片信息

图片信息包含行数、列数、通道数、图像数据类型、像素数量等等。

图片的形状使用img.shape获取。它返回一个包含行数、列数和通道数(如果图片是彩色的)的元组。

>>> print( img.shape ) # (342, 548, 3)

如果图片是灰度图像,这个元组只会包含行数和列数。所以这是个检查图片是彩色图还是灰度图的好方法。

可以通过img.size查询像素总数:

>>> print( img.size ) # 562248

图片数据的类型是用img.dtype表示的:

>>> print( img.dtype ) # uint8

注意img.dtype在调试程序的过程中是很重要的,因为很多OpenCV-Python代码中的问题都是不合法的数据类型造成的。

图片的 ROI

有时候,你会希望只关注图片的某一个部分。例如对于在图片中检测眼睛,首先可以先进行面部检测,当发现面部时,我们会选择面部区域,然后只在这个区域里检测眼睛,而非搜索整个图片。这能提高我们程序的准确率(因为眼睛总长在脸上:D )和运行效率(因为我们寻找的区域减小了)。

ROI也是用Numpy索引来表示的。这里我们选择这幅图里的球并将它复制到图片的另外一个区域里:

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball

分割和合并图片的通道

有时候你需要分割开图片的B、G、R通道来完成工作。这时候你就需要将BGR颜色的图片分成不同的层。另一些时候,你需要把独立的通道合并成BGR的图片,你可以简单地这样做:

>>> b,g,r = cv2.split(img)
>>> img = cv2.merge((b,g,r))

或者

>>> b = img[:,:,0]

假如你要把所有像素的红色值设置为0,你不需要将它分离开来然后再将其置为0,你只需要简单地使用Numpy索引,这样做更快。

>>> img[:,:,2] = 0

警告

cv2.split()会花费很多时间。所以只在你真的需要的时候再使用它。否则就使用Numpy索引。

给图片加边框(Padding)

如果你想要给图片加一个边框,像相框那样,你可以使用 cv2.copyMakeBorder() 函数。这个函数也有其他应用,像卷积操作、用0值进行padding等等。这个函数接受下面的参数:

  • src - 输入图片
  • topbuttonleftright - 相应方向上的边框宽度
  • borderType - 决定边框类型的Flag,可以取下面这些值:
    • cv2.BORDER_CONSTANT - 加一个单色边框,边框颜色需要在下一个参数中给出
    • cv2.BORDER_REFLECT - 边缘将会是边缘元素的镜像,像这样:fedcba|abcdefgh|hgfedcb
    • cv2.BORDER_REFLECT_101cv2.BORDER_REFLECT_101 - 和上面的方法只有一个细微的差别,像这样:gfedcb|abcdefgh|gfedcba
    • cv2.BORDER_REPLICATE - 最后一个元素被不断地重复,像这样:aaaaaa|abcdefgh|hhhhhhh
    • cv2.BORDER_WRAP - 非常复杂,难以描述,看例子,像这样:cdefgh|abcdefgh|abcdefg
  • value - cv2.BORDER_CONSTANT所需要的的颜色值

下面是为了更好地理解而创建的代码示例:

import cv2
import numpy as np
from matplotlib import pyplot as plt
BLUE = [255,0,0]
img1 = cv2.imread('opencv-logo.png')
replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)
plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
plt.show()