opencv及opencv_contrib各模块功能简介,以opencv4.2.0为例

锺离飞鸣
2023-12-01

opencv

  • calib3d——主要包含相机标定和立体视觉等功能,例如物体位姿估计、三维重建、摄像头标定等。
  • core——核心功能模块,主要包含opencv库的基础结构和基本操作,例如opencv基本数据结构、绘图函数、数组操作相关函数、动态数据结构等。
  • dnn——深度学习模块,主要包括构建神经网络、加载序列化网络模型等。
  • features2d——功能主要为处理图像特征点,例如特征检测、描述与匹配等。
  • flann——Fast Library for Approximate Nearest Neighbors(快速近似最近邻库)的缩写,是高维的近似近邻快速搜索算法库,主要包含快速近似近邻搜索与聚类等。
  • gapi——opencv4中新加模块,用来加速常规的图像处理,主要充当框架,并不是特定的计算机视觉算法。
  • highgui——高层GUI,包含创建和操作显示图像的窗口、处理鼠标事件和键盘命令、提供图形交互可视化界面等。、
  • imgcodecs——图像文件的读取与保存模块,主要用于图像文件的读取与保存,
  • imgproc——图像处理模块,主要包括图像滤波、几何变换、直方图、特征检测与目标检测等。
  • ml——机器学习模块,主要为统计分类、回归和数据聚类等。
  • objdetect——目标检测模块,主要用于图像目标检测。
  • photo——计算摄影模块,主要包含图像修复与去噪等。
  • stiching——图像拼接模块,主要包含特征点寻找与匹配图像、估计旋转、自动校准、接缝估计等图像拼接相关内容。
  • video——视频分析模块,主要包含运动估计、背景分离、对象跟踪等内容。
  • videoio——视频输入/输出模块,主要用于读取/写入视频或者图像序列。

opencv_contrib

  • aruco——一个检测二进制marker的库。

  • bgsegm——改进的背景-前景分割方法。

  • bioinspired——受生物学启发的视觉模型和衍生工具,包含生物视觉系统模型(人类视觉系统和其他),它还提供利用这些仿生模型的衍生对象。

  • ccalib——用于 3D 重建的自定义校准模式。

  • cnn_3dobj——3D目标识别和姿态估计API。

  • cuda——利用GPU处理图像,结合nvidia的CUDA编程,包含以下部分。

    cudaarithm——矩阵运算。

    cudabgsegm——背景分割。

    cudacodec——视频编/解码。

    cudafeatures2d——特征检测与描述。

    cudafilters——图像滤波,用于对2D图像执行各种线性或非线性滤波操作。

    cudaimgproc——图像处理。

    cudalegacy——传统支持。

    cudaobjdetect——目标检测。

    cudaoptflow——光流算法。

    cudastereo

    cudawarping——图像变形。

  • cudev——设备层。

  • cvv——计算机视觉程序交互式可视化调试GUI。

  • datasets——处理不同数据集的框架,用于处理不同数据集的类:加载数据、评估不同算法、包含基准测试等。

  • dnn_objdetect——用于目标检测的DNN。

  • dnn_superres——用于超分辨率的DNN,包含通过卷积神经网络放大图像的功能。

  • dpm——基于可变形零件的模型。

  • face——人脸分析。

  • freetype——使用 freetype/harfbuzz 绘制 UTF-8 字符串。

  • fuzzy——基于模糊数学的图像处理。

  • hdf——分层数据格式 I/O 例程。

  • hfs——用于高效图像分割的分层特征选择,包含一种高效的图像分割算法。

  • img_hash——提供提取图像散列的算法,以及快速计算出海量数据集中最相似图像的方法。

  • line_descriptor——在图像中寻找一种新的代表性信息,并为其提取和表示提供功能。特别地,与先前用于检测图像内相关元素的方法不同,提取线代替点;定义了一个新类,用于汇总线的特性,以便于重用和打印。

  • optflow——光流算法。

  • ovis——OGRE 3D 可视化。

  • phase_unwrapping——相位展开的API。

  • plot——用于Mat 数据的绘图函数。

  • quality——图像质量分析(IQA)API。

  • reg——实现了参数化图像配准。实现的方法是直接对齐。

  • rgbd——RGB-深度处理。

  • saliency——提供一个独特的接口、一个独特的使用框架和插件服务器显著性算法。

  • sfm——包含从2d图像执行3d重建的算法。

  • shape——形状距离与匹配。

  • stereo——立体对应算法。

  • structured_light——结构光API。

  • superres——超级分辨率。

  • surface_matching——面匹配。

  • text——场景文本检测和识别。

  • tracking——追踪API,该API是一个独特的接口,可用于插入多种算法并对其进行比较。

  • videostab——包含一组可用于解决视频稳定问题的函数和类。

  • viz——三维可视化工具。

  • xfeatures2d——额外2D功能框架,对应前面的feature2d模块。

  • ximgproc——扩展图像处理,对应前面的imgproc模块。

  • xobjdetect——拓展目标检测,对应前面的objdetect模块。

  • xphoto——其他照片处理算法,对应前面的photo模块。

参考文献

[1] 冯振, 郭延宁,吕跃勇. OpenCV4快速入门[M]. 人民邮电出版社, 2020.

[2] https://docs.opencv.org/4.2.0/

 类似资料: