1.OpenCV简介
课程介绍
本课程是从事CV方向工作的基础课程,以OpenCV基础,介绍传统的图像处理算法,为图像处理算法工作打下坚实的基础。
课程内容
OpenCV是应用广泛的开源图像处理库,我们以其为基础,介绍相关的图像处理方法:包括基本的图像处理方法:几何变换,形态学变换,图像平滑,直方图操作,模板匹配,霍夫变换等;特征提取和描述方法:理解角点特征,Harris和Shi-Tomas算法,SIFT/SURF算法,Fast算法,ORB算法等;还有OpenCV在视频操作中的应用,最后的案例是使用OpenCV进行人脸检测。
OpenCV简介
Open Source Computer Vision
学习目标
-
了解OpenCV是什么
-
能够独立安装OpenCV
OpenCV是一款由Intel公司俄罗斯团队发起并参与和维护的一个计算机视觉处理开源软件库,支持与计算机视觉和机器学习相关的众多算法,并且正在日益扩展。
OpenCV的优势:
-
编程语言
OpenCV基于C++实现,同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API,结合了OpenCV C++ API和Python语言的最佳特性。
-
跨平台
可以在不同的系统平台上使用,包括Windows,Linux,OS X,Android和iOS。基于CUDA和OpenCL的高速GPU操作接口也在积极开发中
-
活跃的开发团队
-
丰富的API
完善的传统计算机视觉算法,涵盖主流的机器学习算法,同时添加了对深度学习的支持。
OpenCV-Python
OpenCV-Python是一个Python绑定库,旨在解决计算机视觉问题。
Python是一种由Guido van Rossum开发的通用编程语言,它很快就变得非常流行,主要是因为它的简单性和代码可读性。它使程序员能够用更少的代码行表达思想,而不会降低可读性。
与C / C++等语言相比,Python速度较慢。也就是说,Python可以使用C / C++轻松扩展,这使我们可以在C / C++中编写计算密集型代码,并创建可用作Python模块的Python包装器。这给我们带来了两个好处:首先,代码与原始C / C++代码一样快(因为它是在后台工作的实际C++代码),其次,在Python中编写代码比使用C / C++更容易。OpenCV-Python是原始OpenCV C++实现的Python包装器。
OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库,具有MATLAB风格的语法。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。
OpenCV安装
安装OpenCV之前需要先安装numpy, matplotlib。
创建Python虚拟环境cv, 在cv中安装即可。
先安装OpenCV-Python, 由于一些经典的算法被申请了版权,新版本有很大的限制,所以选用3.4.3以下的版本
pip install opencv-python==3.4.2.17
如果我们要利用SIFT和SURF等进行特征提取时,还需要安装:
pip install opencv-contrib-python==3.4.2.17
注意,我学习的时候不在乎专利,所以使用的最新版本:
# 安装OpenCV基础库
pip install opencv-python
# 安装OpenCV contrib扩展库(包含SIFT、SURF等模块)
pip install opencv-contrib-python
现在可以测试下是否安装成功,运行以下代码无报错则说明安装成功。
import cv2
# 读一个图片并进行显示(图片路径需自己指定)
lena=cv2.imread("1.jpg")
cv2.imshow("image",lena)
cv2.waitKey(0)
总结
-
OpenCV是计算机视觉的开源库
优势:
-
支持多种编程语言
-
跨平台
-
活跃的开发团队
-
丰富的API
-
-
能够独立的安装OpenCV-python
OpenCV的模块
下图列出了OpenCV中包含的各个模块:
其中core、highgui、imgproc是最基础的模块,该课程主要是围绕这几个模块展开的,分别介绍如下:
对于图像处理其他更高层次的方向及应用,OpenCV也有相关的模块实现
- features2d模块用于提取图像特征以及特征匹配,nonfree模块实现了一些专利算法,如sift特征。
- objdetect模块实现了一些目标检测的功能,经典的基于Haar、LBP特征的人脸检测,基于HOG的行人、汽车等目标检测,分类器使用Cascade Classification(级联分类)和Latent SVM等。
- stitching模块实现了图像拼接功能。
- FLANN模块(Fast Library for Approximate Nearest Neighbors),包含快速近似最近邻搜索FLANN 和聚类Clustering算法。
- ml模块机器学习模块(SVM,决策树,Boosting等等)。
- photo模块包含图像修复和图像去噪两部分。
- video模块针对视频处理,如背景分离,前景检测、对象跟踪等。
- calib3d模块即Calibration(校准)3D,这个模块主要是相机校准和三维重建相关的内容。包含了基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。
- G-API模块包含超高效的图像处理pipeline引擎
总结
-
OpenCV 的模块
core:最核心的数据结构
highgui:视频与图像的读取、显示、存储
imgproc:图像处理的基础方法
features2d:图像特征以及特征匹配
4.X版本更新说明
高级功能模块(更新要点)
features2d & xfeatures2d(特征检测)
- 关键更新:
xfeatures2d
需单独安装opencv_contrib- SIFT/SURF专利算法移至xfeatures2d(需启用
OPENCV_ENABLE_NONFREE
) - 新增: ORB替代SIFT(无专利问题)、AKAZE、BRISK
- 深度学习特征: VGG/BoostDesc等(需DNN支持)
objdetect(目标检测)
- 传统算法:
Haar/LBP人脸检测(速度优化) - 深度学习整合:
- DNN模块无缝协作(YOLO/SSD/EfficientDet)
- QR码检测(专用API)
- HOG行人检测GPU加速
dnn(深度学习)
- 核心跨框架支持:
TensorFlow/PyTorch/ONNX/Caffe模型导入 - 推理加速:
- OpenVINO™ 工具套件集成
- CUDA/TensorRT后端支持
- 模型优化: INT8量化/层融合
video(视频分析)
- 新增算法:
- DIS光流(Dense Inverse Search)
- ViBe背景建模
- DaSiamRPN跟踪器(深度学习)
- 背景消除:MOG2/KNN改进版
gapi(图运算引擎)
- 革命性优化:
- 异构硬件自动调度(CPU/GPU/FPGA)
- 零拷贝内存管道
- 实时视频分析性能提升5-10倍
(示例:pipeline = GaussianBlur → Sobel → HoughLines
)
新增重要模块
模块 | 功能说明 |
---|---|
rapid | 高速3D物体姿态估计(工业机器人场景) |
wechat_qrcode | 微信开源QR码检测/解码模块 |
bioinspired | 仿生视觉模型(视网膜模型处理) |
intensity_transform | HDR成像/自动对比度调整 |
模块依赖关系优化(4.x版本)
部署建议
- 基础开发:
core + imgproc + highgui + dnn
- 嵌入式场景:启用OpenCV Tiny(精简至800KB)
- 实时分析:G-API流水线设计 + OpenVINO™加速
- 贡献模块:需从opencv/opencv_contrib源码编译
版本变化提示:
- OpenCV 3.x后
nonfree
模块废弃→迁移至xfeatures2d
ml
(机器学习)模块支持ONNX Runtime集成- 图像编码解码统一由
imgcodecs
处理
建议查阅官方文档获取最新API:https://docs.opencv.org/4.x/