全部文章

1.OpenCV简介

课程介绍

本课程是从事CV方向工作的基础课程,以OpenCV基础,介绍传统的图像处理算法,为图像处理算法工作打下坚实的基础。

课程内容

OpenCV是应用广泛的开源图像处理库,我们以其为基础,介绍相关的图像处理方法:包括基本的图像处理方法:几何变换,形态学变换,图像平滑,直方图操作,模板匹配,霍夫变换等;特征提取和描述方法:理解角点特征,Harris和Shi-Tomas算法,SIFT/SURF算法,Fast算法,ORB算法等;还有OpenCV在视频操作中的应用,最后的案例是使用OpenCV进行人脸检测。

OpenCV简介

Open Source Computer Vision

学习目标

  • 了解OpenCV是什么

  • 能够独立安装OpenCV

OpenCV是一款由Intel公司俄罗斯团队发起并参与和维护的一个计算机视觉处理开源软件库,支持与计算机视觉和机器学习相关的众多算法,并且正在日益扩展。

官网:https://docs.opencv.org

OpenCV的优势:

  1. 编程语言

    OpenCV基于C++实现,同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API,结合了OpenCV C++ API和Python语言的最佳特性。

  2. 跨平台

    可以在不同的系统平台上使用,包括Windows,Linux,OS X,Android和iOS。基于CUDA和OpenCL的高速GPU操作接口也在积极开发中

  3. 活跃的开发团队

  4. 丰富的API

    完善的传统计算机视觉算法,涵盖主流的机器学习算法,同时添加了对深度学习的支持。

OpenCV-Python

OpenCV-Python是一个Python绑定库,旨在解决计算机视觉问题。

Python是一种由Guido van Rossum开发的通用编程语言,它很快就变得非常流行,主要是因为它的简单性和代码可读性。它使程序员能够用更少的代码行表达思想,而不会降低可读性。

与C / C++等语言相比,Python速度较慢。也就是说,Python可以使用C / C++轻松扩展,这使我们可以在C / C++中编写计算密集型代码,并创建可用作Python模块的Python包装器。这给我们带来了两个好处:首先,代码与原始C / C++代码一样快(因为它是在后台工作的实际C++代码),其次,在Python中编写代码比使用C / C++更容易。OpenCV-Python是原始OpenCV C++实现的Python包装器。

OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库,具有MATLAB风格的语法。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。

OpenCV安装

安装OpenCV之前需要先安装numpy, matplotlib。

创建Python虚拟环境cv, 在cv中安装即可。

先安装OpenCV-Python, 由于一些经典的算法被申请了版权,新版本有很大的限制,所以选用3.4.3以下的版本

pip install opencv-python==3.4.2.17

如果我们要利用SIFT和SURF等进行特征提取时,还需要安装:

pip install opencv-contrib-python==3.4.2.17
SIFT 算法的专利已到期,可以免费使用1。SURF 算法目前仍处于专利保护期内,使用时需谨慎。
SIFT 算法由加拿大教授 David G.Lowe 提出,其专利属于英属哥伦比亚大学,专利申请于 2000 年 3 月 6 日4。根据专利保护期限为 20 年的规定,该专利在 2020 年 3 月 6 日到期,此后任何人和组织都可以免费使用4。OpenCV 从 4.4.0 或 3.4.11 版本开始,已将 SIFT 相关代码从 opencv_contrib 仓库的非自由模块 xfeatures2d 移至主仓库的 features2d 模块,可直接使用。
而 SURF 算法作为 SIFT 的加速升级版,目前尚未有公开信息表明其专利到期,若要在商业项目或其他场景中使用,仍需考虑专利问题

注意,我学习的时候不在乎专利,所以使用的最新版本:

# 安装OpenCV基础库
pip install opencv-python

# 安装OpenCV contrib扩展库(包含SIFT、SURF等模块)
pip install opencv-contrib-python
  • 默认安装最新稳定版。
  • 如需指定版本(如 4.7.0):pip install opencv-python==4.7.0.72 opencv-contrib-python==4.7.0.72

现在可以测试下是否安装成功,运行以下代码无报错则说明安装成功。

import cv2
# 读一个图片并进行显示(图片路径需自己指定)
lena=cv2.imread("1.jpg")
cv2.imshow("image",lena)
cv2.waitKey(0)

 

总结

  1. OpenCV是计算机视觉的开源库

    优势:

    • 支持多种编程语言

    • 跨平台

    • 活跃的开发团队

    • 丰富的API

  2. 能够独立的安装OpenCV-python

OpenCV的模块

下图列出了OpenCV中包含的各个模块:

其中core、highgui、imgproc是最基础的模块,该课程主要是围绕这几个模块展开的,分别介绍如下:

  1. core 模块
    • 核心数据结构:Mat(矩阵)、UMat(支持 GPU 加速的内存管理)、PointRect等。及线性代数运算,如绘图函数、数组操作相关函数等。
    • 新增功能:
      • 并行计算:通过cv::parallel_for_支持多线程处理。
      • CUDA/OpenCL 后端:透明支持 GPU 加速(需编译时启用)。
      • 智能指针Ptr<T>类优化内存管理,减少手动释放资源。
  2. highgui 模块
    • 实现了视频与图像的读取、显示、存储等接口。
    • 交互功能:窗口显示、鼠标 / 键盘事件处理、滑块控件。
    • 拆分为 highgui + videoio + imgcodecs 三个子模块​
      • imgcodecs:图像读写(JPEG2000/WebP/TIFF等​​新增格式支持​​)
      • videoio:​​支持FFmpeg/GStreamer/DirectShow后端​​,多路摄像头/RTSP流处理
  3. imgproc 模块
    • 图像处理基础:滤波、几何变换、阈值分割、形态学操作、边缘检测、目标检测、运动分析和对象跟踪等。
    • 新增功能:
      • 快速实现:基于 OpenCL 的加速滤波(如bilateralFilter)。
      • 亚像素处理:更精确的角点检测(如cornerSubPix)。
      • 自适应阈值:优化光照不均场景(如adaptiveThreshold)。
      • 深度学习预处理(颜色空间转换/尺寸归一化)
      • 高级形态学操作(morphologyEx扩展)
      • ​基于深度学习的边缘检测(如DNN_EdgeDetector)​

对于图像处理其他更高层次的方向及应用,OpenCV也有相关的模块实现

  • features2d模块用于提取图像特征以及特征匹配,nonfree模块实现了一些专利算法,如sift特征。
  • objdetect模块实现了一些目标检测的功能,经典的基于Haar、LBP特征的人脸检测,基于HOG的行人、汽车等目标检测,分类器使用Cascade Classification(级联分类)和Latent SVM等。
  • stitching模块实现了图像拼接功能。
  • FLANN模块(Fast Library for Approximate Nearest Neighbors),包含快速近似最近邻搜索FLANN 和聚类Clustering算法。
  • ml模块机器学习模块(SVM,决策树,Boosting等等)。
  • photo模块包含图像修复和图像去噪两部分。
  • video模块针对视频处理,如背景分离,前景检测、对象跟踪等。
  • calib3d模块即Calibration(校准)3D,这个模块主要是相机校准和三维重建相关的内容。包含了基本的多视角几何算法,单个立体摄像头标定,物体姿态估计,立体相似性算法,3D信息的重建等等。
  • G-API模块包含超高效的图像处理pipeline引擎

总结

  1. OpenCV 的模块

    core:最核心的数据结构

    highgui:视频与图像的读取、显示、存储

    imgproc:图像处理的基础方法

    features2d:图像特征以及特征匹配

 

 4.X版本更新说明

高级功能模块(更新要点)​

​features2d & xfeatures2d​​(特征检测)

  • ​关键更新:​
    • xfeatures2d需单独安装​​opencv_contrib​
    • SIFT/SURF专利算法移至​​xfeatures2d​​(需启用OPENCV_ENABLE_NONFREE
    • ​新增:​​ ORB替代SIFT(无专利问题)、AKAZE、BRISK
    • ​深度学习特征:​​ VGG/BoostDesc等(需DNN支持)

​objdetect​​(目标检测)

  • ​传统算法:​
    Haar/LBP人脸检测(速度优化)
  • ​深度学习整合:​
    • ​DNN模块无缝协作​​(YOLO/SSD/EfficientDet)
    • ​QR码检测(专用API)​
    • HOG行人检测GPU加速

​dnn​​(深度学习)

  • ​核心跨框架支持:​
    TensorFlow/PyTorch/ONNX/Caffe模型导入
  • ​推理加速:​
    • OpenVINO™ 工具套件集成
    • CUDA/TensorRT后端支持
    • ​模型优化:​​ INT8量化/层融合

​video​​(视频分析)

  • ​新增算法:​
    • ​DIS光流(Dense Inverse Search)​
    • ​ViBe背景建模​
    • ​DaSiamRPN跟踪器(深度学习)​
  • 背景消除:MOG2/KNN改进版

​gapi​​(图运算引擎)

  • ​革命性优化:​
    • ​异构硬件自动调度​​(CPU/GPU/FPGA)
    • ​零拷贝内存管道​
    • 实时视频分析性能提升5-10倍
      (示例:pipeline = GaussianBlur → Sobel → HoughLines

​新增重要模块​

模块 功能说明
​rapid​ 高速3D物体姿态估计(工业机器人场景)
​wechat_qrcode​ 微信开源QR码检测/解码模块
​bioinspired​ 仿生视觉模型(视网膜模型处理)
​intensity_transform​ HDR成像/自动对比度调整

​模块依赖关系优化(4.x版本)​

 

 

部署建议​

  1. ​基础开发​​:core + imgproc + highgui + dnn
  2. ​嵌入式场景​​:启用​​OpenCV Tiny​​(精简至800KB)
  3. ​实时分析​​:​​G-API流水线设计 + OpenVINO™加速​
  4. ​贡献模块​​:需从opencv/opencv_contrib源码编译

​版本变化提示​​:

  • OpenCV 3.x后nonfree模块废弃→迁移至xfeatures2d
  • ml(机器学习)模块支持ONNX Runtime集成
  • 图像编码解码统一由imgcodecs处理

建议查阅官方文档获取最新API:https://docs.opencv.org/4.x/

 

posted @ 2025-07-05 16:07  指尖下的世界  阅读(42)  评论(0)    收藏  举报