教程 - 图像教程

优质
小牛编辑
159浏览
2023-12-01

原文:Image tutorial

启动命令

首先,让我们启动 IPython。 它是 Python 标准提示符的最好的改进,它与 Matplotlib 配合得相当不错。 在 shell 或 IPython Notebook 上都可以启动 IPython。

随着 IPython 启动,我们现在需要连接到 GUI 事件循环。 它告诉 IPython 在哪里(以及如何显示)绘图。 要连接到 GUI 循环,请在 IPython 提示符处执行%matplotlib魔法。 在 IPython 的 GUI 事件循环文档中有更多的细节。

如果使用 IPython Notebook,可以使用相同的命令,但人们通常以特定参数使用%matplotlib

  1. In [1]: %matplotlib inline

这将打开内联绘图,绘图图形将显示在笔记本中。 这对交互性有很重要的影响。 对于内联绘图,在单元格下方的单元格中输出绘图的命令不会影响绘图。 例如,从创建绘图的单元格下面的单元格更改颜色表是不可能的。 但是,对于其他后端,例如 qt4,它们会打开一个单独的窗口,那些创建绘图的单元格下方的单元格将改变绘图 - 它是一个内存中的活对象。

本教程将使用matplotlib的命令式绘图接口pyplot。 该接口维护全局状态,并且可用于简单快速地尝试各种绘图设置。 另一种是面向对象的接口,这也非常强大,一般更适合大型应用程序的开发。 如果你想了解面向对象接口,使用上的常见问题是一个用于起步的不错的页面。 现在,让我们继续使用命令式方式:

  1. In [2]: import matplotlib.pyplot as plt
  2. In [3]: import matplotlib.image as mpimg
  3. In [4]: import numpy as np

将图像数据导入到 NumPy 数组

加载图像数据由 Pillow 库提供支持。 本来,matplotlib只支持 PNG 图像。 如果本机读取失败,下面显示的命令会回退到 Pillow。

此示例中使用的图像是 PNG 文件,但是请记住你自己的数据的 Pillow 要求。

下面是我们要摆弄的图片:

图像教程 - 图1

它是一个 24 位 RGB PNG 图像(每个 R,G,B 为 8 位)。 根据你获取数据的位置,你最有可能遇到的其他类型的图像是 RGBA 图像,拥有透明度或单通道灰度(亮度)的图像。 你可以右键单击它,选择Save image as(另存为)为本教程的剩余部分下载到你的计算机。

现在我们开始…

  1. In [5]: img=mpimg.imread('stinkbug.png')
  2. Out[5]:
  3. array([[[ 0.40784314, 0.40784314, 0.40784314],
  4. [ 0.40784314, 0.40784314, 0.40784314],
  5. [ 0.40784314, 0.40784314, 0.40784314],
  6. ...,
  7. [ 0.42745098, 0.42745098, 0.42745098],
  8. [ 0.42745098, 0.42745098, 0.42745098],
  9. [ 0.42745098, 0.42745098, 0.42745098]],
  10. ...,
  11. [[ 0.44313726, 0.44313726, 0.44313726],
  12. [ 0.4509804 , 0.4509804 , 0.4509804 ],
  13. [ 0.4509804 , 0.4509804 , 0.4509804 ],
  14. ...,
  15. [ 0.44705883, 0.44705883, 0.44705883],
  16. [ 0.44705883, 0.44705883, 0.44705883],
  17. [ 0.44313726, 0.44313726, 0.44313726]]], dtype=float32)

注意这里的dtype - float32。 Matplotlib 已将每个通道的8位数据重新定标为 0.0 和 1.0 之间的浮点数。 作为旁注,Pillow 可以使用的唯一数据类型是uint8。 Matplotlib 绘图可以处理float32uint8,但是对于除 PNG 之外的任何格式的图像,读取/写入仅限于uint8数据。 为什么是 8 位呢? 大多数显示器只能渲染每通道 8 位的颜色渐变。 为什么他们只能渲染每通道 8 位呢? 因为这会使所有人的眼睛可以看到。 更多信息请见(从摄影的角度):Luminous Landscape 位深度教程

每个内部列表表示一个像素。 这里,对于 RGB 图像,有 3 个值。 由于它是一个黑白图像,R,G 和 B 都是类似的。 RGBA(其中 A 是阿尔法或透明度)对于每个内部列表具有 4 个值,而且简单亮度图像仅具有一个值(因此仅是二维数组,而不是三维数组)。 对于 RGB 和 RGBA 图像,matplotlib支持float32uint8数据类型。 对于灰度,matplotlib只支持float32。 如果你的数组数据不符合这些描述之一,则需要重新缩放它。

将 NumPy 数组绘制为图像

所以,你将数据保存在一个numpy数组(通过导入它,或生成它)。 让我们渲染它吧。 在 Matplotlib 中,这是使用imshow()函数执行的。 这里我们将抓取plot对象。 这个对象提供了一个简单的方法来从提示符处理绘图。

  1. In [6]: imgplot = plt.imshow(img)

图像教程 - 图2

你也可以绘制任何 NumPy 数组。

对图像绘图应用伪彩色方案

伪彩色可以是一个有用的工具,用于增强对比度和更易于可视化你的数据。 这在使用投影仪对你的数据进行演示时尤其有用 - 它们的对比度通常很差。

伪彩色仅与单通道,灰度,亮度图像相关。 我们目前有一个RGB图像。 由于R,G 和 B 都是相似的(见上面或你的数据),我们可以只选择一个通道的数据:

  1. In [7]: lum_img = img[:,:,0]

这是数组切片,更多信息请见NumPy 教程

  1. In [8]: plt.imshow(lum_img)

图像教程 - 图3

现在,亮度(2D,无颜色)图像应用了默认颜色表(也称为查找表,LUT)。 默认值称为jet。 有很多其他方案可以选择。

  1. In [9]: plt.imshow(lum_img, cmap="hot")

图像教程 - 图4

请注意,你还可以使用set_cmap()方法更改现有绘图对象上的颜色:

  1. In [10]: imgplot = plt.imshow(lum_img)
  2. In [11]: imgplot.set_cmap('spectral')

图像教程 - 图5

但是,请记住,在带有内联后端的 IPython notebook 中,你不能对已经渲染的绘图进行更改。 如果你在一个单元格中创建了imgplot,你不能在以后的单元格中调用set_cmap(),并且改变前面的绘图。 请确保你在相同单元格中一起输入这些命令。plt命令不会更改先前单元格的绘图。

有许多可选的其它颜色表,请见颜色表的列表和图像

颜色刻度参考

了解颜色代表什么值对我们很有帮助。 我们可以通过添加颜色条来做到这一点。

  1. In [12]: imgplot = plt.imshow(lum_img)
  2. In [13]: plt.colorbar()

图像教程 - 图6

这会为你现有的图形添加一个颜色条。 如果你更改并切换到不同的颜色映射,则不会自动更改 - 你必须重新创建绘图,并再次添加颜色条。

检查特定数据范围

有时,你想要增强图像的对比度,或者扩大特定区域的对比度,同时牺牲变化不大,或者无所谓的颜色细节。 找到有趣区域的最好工具是直方图。 要创建我们的图像数据的直方图,我们使用hist()函数。

  1. In [14]: plt.hist(lum_img.ravel(), bins=256, range=(0.0, 1.0), fc='k', ec='k')

图像教程 - 图7

通常,图像的『有趣』部分在峰值附近,你可以通过剪切峰值上方和/或下方的区域获得额外的对比度。 在我们的直方图中,看起来最大值处没有太多有用的信息(图像中有很多不是白色的东西)。 让我们调整上限,以便我们有效地『放大』直方图的一部分。 我们通过将clim参数传递给imshow来实现。 你也可以通过对图像绘图对象调用set_clim()方法来做到这一点,但要确保你在使用 IPython Notebook 的时候,和plot命令在相同的单元格中执行 - 它不会改变之前单元格的图。

  1. In [15]: imgplot = plt.imshow(lum_img, clim=(0.0, 0.7))

图像教程 - 图8

数组插值方案

插值根据不同的数学方案计算像素『应有』的颜色或值。 发生这种情况的一个常见的场景是调整图像的大小。 像素的数量会发生变化,但你想要相同的信息。 由于像素是离散的,因此存在缺失的空间。 插值就是填补这个空间的方式。 这就是当你放大图像时,你的图像有时会出来看起来像素化的原因。 当原始图像和扩展图像之间的差异较大时,效果更加明显。 让我们加载我们的图像并缩小它。 我们实际上正在丢弃像素,只保留少数几个像素。 现在,当我们绘制它时,数据被放大为你屏幕的大小。 由于旧的像素不再存在,计算机必须绘制像素来填充那个空间。

我们将使用用来加载图像的 Pillow 库来调整图像大小。

  1. In [16]: from PIL import Image
  2. In [17]: img = Image.open('../_static/stinkbug.png')
  3. In [18]: img.thumbnail((64, 64), Image.ANTIALIAS) # resizes image in-place
  4. In [19]: imgplot = plt.imshow(img)

图像教程 - 图9

这里我们使用默认插值,双线性,因为我们没有向imshow()提供任何插值参数。

让我们试试一些其它的东西:

最邻近

  1. In [20]: imgplot = plt.imshow(img, interpolation="nearest")

图像教程 - 图10

双立方

  1. In [21]: imgplot = plt.imshow(img, interpolation="bicubic")

图像教程 - 图11

双立方插值通常用于放大照片 - 人们倾向于模糊而不是过度像素化。