5.6 用于角点检测的FAST算法

优质

小牛编辑

133浏览

2023-12-01

目标

在本章中，

我们将了解FAST算法的基础知识。
我们将使用OpenCV功能对FAST算法进行探索。

理论

我们看到了几个特征检测器，其中很多真的很棒。但是，从实时应用程序的角度来看，它们不够快。最好的例子是计算资源有限的SLAM（同时定位和制图）移动机器人

作为对此的解决方案，Edward Rosten和Tom Drummond在2006年的论文“用于高速拐角检测的机器学习”中提出了FAST（加速分段测试的特征）算法（后来在2010年对其进行了修订）。该算法的基本内容如下。有关更多详细信息，请参阅原始论文（所有图像均取自原始论文）。

使用FAST进行特征检测

选择图像中是否要识别为兴趣点的像素$p$，使其强度为$I_p$
选择适当的阈值$t$
考虑被测像素周围有16个像素的圆圈。（见下图）
现在，如果圆中存在一组（共16个像素）$n$个连续的像素，它们均比$I_p + t$亮，或者比$I_p-t$都暗，则像素$p$是一个角。（在上图中显示为白色虚线）。n被选为12。
建议使用高速测试以排除大量的非角区域。此测试仅检查1、9、5和13处的四个像素（如果第一个1和9太亮或太暗，则对其进行测试。如果是，则检查5和13）。如果p是一个角，则其中至少三个必须全部比$I_p + t$亮或比$I_p-t$暗。如果以上两种情况都不是，则$p$不能为角。然后，可以通过检查圆中的所有像素，将完整的分段测试标准应用于通过的候选项。该检测器本身具有很高的性能，但有几个缺点：
- 它不会拒绝n <12的候选对象。
- 像素的选择不是最佳的，因为其效率取决于问题的顺序和角落外观的分布。
- 高速测试的结果被丢弃了。
- 彼此相邻地检测到多个特征。

机器学习的方法解决了前三点。使用非最大抑制来解决最后一个问题。

让机器学习一个角检测器

选择一组图像进行训练（最好从目标应用程序域中进行训练）
在每个图像中运行FAST算法以查找特征点。
对于每个特征点，将其周围的16个像素存储为矢量。对所有图像执行此操作以获得特征向量P。
这16个像素中的每个像素（例如$x$）可以具有以下三种状态之一：

取决于这些状态，特征矢量$P$被细分为3个子集，$P_d$, $P_s$, $P_b$。
定义一个新的布尔变量$K_p$，如果$p$是一个角，则为true，否则为false。
使用ID3算法（决策树分类器）使用变量$K_p$查询每个子集，以获取有关真实类的知识。它选择x，该x通过$K_p$的熵测得的有关候选像素是否为角的信息最多。
递归地将其应用于所有子集，直到其熵为零为止。
这样创建的决策树用于其他图像的快速检测。

非最大抑制

在相邻位置检测多个兴趣点是另一个问题。通过使用非极大抑制来解决。

计算所有检测到的特征点的得分函数$V$。$V$是$p$与16个周围像素值之间的绝对差之和。
考虑两个相邻的关键点并计算它们的$V$值。
丢弃较低$V$值的那个。

总结

它比其他现有的拐角检测器快几倍。

但是它对高水平的噪声并不鲁棒。它取决于阈值。

OpenCV中的高速拐角检测器

它被称为OpenCV中的任何其他特征检测器。如果需要，您可以指定阈值，是否要应用非极大抑制，要使用的邻域等。对于邻域，定义了三个标志，分别为cv.FAST_FEATURE_DETECTOR_TYPE_5_8，cv.FAST_FEATURE_DETECTOR_TYPE_7_12和cv.FAST_FEATURE_DETECTOR_TYPE_9_16。以下是有关如何检测和绘制FAST特征点的简单代码。

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt
img = cv.imread('simple.jpg',0)
# 用默认值初始化FAST对象
fast = cv.FastFeatureDetector_create()
# 寻找并绘制关键点
kp = fast.detect(img,None)
img2 = cv.drawKeypoints(img, kp, None, color=(255,0,0))
# 打印所有默认参数
print( "Threshold: {}".format(fast.getThreshold()) )
print( "nonmaxSuppression:{}".format(fast.getNonmaxSuppression()) )
print( "neighborhood: {}".format(fast.getType()) )
print( "Total Keypoints with nonmaxSuppression: {}".format(len(kp)) )
cv.imwrite('fast_true.png',img2)
# 关闭非极大抑制
fast.setNonmaxSuppression(0)
kp = fast.detect(img,None)
print( "Total Keypoints without nonmaxSuppression: {}".format(len(kp)) )
img3 = cv.drawKeypoints(img, kp, None, color=(255,0,0))
cv.imwrite('fast_false.png',img3)

查看结果。第一张图片显示了带有nonmaxSuppression的FAST，第二张图片显示了没有nonmaxSuppression的FAST：

附加资源

Edward Rosten and Tom Drummond, “Machine learning for high speed corner detection” in 9th European Conference on Computer Vision, vol. 1, 2006, pp. 430–443.
Edward Rosten, Reid Porter, and Tom Drummond, "Faster and better: a machine learning approach to corner detection" in IEEE Trans. Pattern Analysis and Machine Intelligence, 2010, vol 32, pp. 105-119.