使用Python,OpenCV的Meanshift 和 Camshift 算法来查找和跟踪视频中的对象

2021-10-26 10:07:44 浏览数 (1)

这篇博客将介绍如何使用 Meanshift 和 Camshift 算法来查找和跟踪视频中的对象。

**MeanShift:均移

Camshift(Continuously Adaptive Meanshift)持续自适应性均移**

  • cv2.meanShift(): Meanshift 均移总是能找到一个具有最大像素分布的窗口,并且追踪对象;
  • cv2.CamShift(): CAMshift 是 Meanshift的优化,它会持续性的自动调整窗口的大小,并且计算最佳拟合椭圆的方向。它再次应用具有新缩放搜索窗口和先前窗口位置的均值变换,直到达到所需的精度;

1. 效果图

官方示例——Meanshift 均移效果图如下:

官方示例——CAMshift持续自适应均移效果图如下:

可以看到Camshift会自动调整框的大小及旋转,能更好的拟合追踪的对象;

2. 源码

2.1 MeanShift

代码语言:javascript复制
# 使用MeanShift均移和 CAMshift(Continuously Adaptive Meanshift)持续自适应均移以寻找和追踪对象

# CAMshift 是 MeanShift的优化,它会持续性的自动调整窗口的大小,并且计算最佳拟合椭圆的方向。它再次应用具有新缩放搜索窗口和先前窗口位置的均值变换,直到达到所需的精度;
import numpy as np
import cv2

cap = cv2.VideoCapture('images/slow_traffic_small.mp4')

# 获取视频的第一帧
ret, frame = cap.read()

# 设置初始窗口位置
x, y, w, h = 300, 200, 100, 50  # 硬编码位置
track_window = (x, y, w, h)

# 对追踪对象设置ROI
roi = frame[y:y   h, x:x   w]

# 只考虑HSV的色调
hsv_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV)
# 为了避免由于低光导致的错误值,使用 cv2.inRange() 函数丢弃低光值。
mask = cv2.inRange(hsv_roi, np.array((0., 60., 32.)), np.array((180., 255., 255.)))
roi_hist = cv2.calcHist([hsv_roi], [0], mask, [180], [0, 180])
cv2.normalize(roi_hist, roi_hist, 0, 255, cv2.NORM_MINMAX)

# 设置终止标准,10 次迭代或移动至少 1pt
term_crit = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1)

while (1):
    ret, frame = cap.read()

    if ret == True:
        hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
        dst = cv2.calcBackProject([hsv], [0], roi_hist, [0, 180], 1)

        # 应用meanshift获取新位置
        ret, track_window = cv2.meanShift(dst, track_window, term_crit)

        # 在图像上绘制它
        x, y, w, h = track_window
        img2 = cv2.rectangle(frame, (x, y), (x   w, y   h), 255, 2)
        cv2.imshow('img2', img2)

        k = cv2.waitKey(60) & 0xff
        if k == 27:
            break
        else:
            cv2.imwrite(chr(k)   ".jpg", img2)

    else:
        break

cv2.destroyAllWindows()
cap.release()
复制代码

2.2 Camshift(Continuously Adaptive Meanshift)持续自适应性均移

代码语言:javascript复制
# 使用MeanShift均移和 CAMshift(Continuously Adaptive Meanshift)持续自适应均移以寻找和追踪对象
# CAMshift 是 MeanShift的优化,它会持续性的自动调整窗口的大小,并且计算最佳拟合椭圆的方向。它再次应用具有新缩放搜索窗口和先前窗口位置的均值变换,直到达到所需的精度;

import numpy as np
import cv2

cap = cv2.VideoCapture('images/slow_traffic_small.mp4')

# 获取视频的第一帧
ret, frame = cap.read()

# 设置初始窗口位置
x, y, w, h = 300, 200, 100, 50  # 硬编码位置
track_window = (x, y, w, h)

# 对追踪对象设置ROI
roi = frame[y:y   h, x:x   w]

hsv_roi = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV)
mask = cv2.inRange(hsv_roi, np.array((0., 60., 32.)), np.array((180., 255., 255.)))
roi_hist = cv2.calcHist([hsv_roi], [0], mask, [180], [0, 180])
cv2.normalize(roi_hist, roi_hist, 0, 255, cv2.NORM_MINMAX)

# 设置终止条件,迭代10次或者至少移动1pt
term_crit = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 1)

while (1):
    ret, frame = cap.read()

    if ret == True:
        hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
        dst = cv2.calcBackProject([hsv], [0], roi_hist, [0, 180], 1)

        # 应用camshift获取新位置
        # 返回一个旋转的矩形和框参数(用于在下一次迭代中作为搜索窗口传递)
        # 它首先应用均值变换。一旦meanshift收敛,它会更新窗口的大小,并且计算最佳拟合椭圆的方向。它再次应用具有新缩放搜索窗口和先前窗口位置的均值变换。该过程一直持续到满足所需的精度。
        ret, track_window = cv2.CamShift(dst, track_window, term_crit)

        # 绘制在图像上
        pts = cv2.boxPoints(ret)
        pts = np.int0(pts)
        img2 = cv2.polylines(frame, [pts], True, 255, 2)
        cv2.imshow('img2', img2)
        # cv2.waitKey(0)

        k = cv2.waitKey(60) & 0xff
        if k == 27:
            break
        else:
            cv2.imwrite(chr(k)   ".jpg", img2)

    else:
        break

cv2.destroyAllWindows()
cap.release()
复制代码

3. 参考

  • docs.opencv.org/3.0-beta/do…
  • github.com/opencv/open…
  • 可交互式的Camshift

0 人点赞