一、基本介绍
1、简介
- OpenCV是计算机视觉开源库,主要算法涉及图像处理和机器学习相关方法。
- 是Intel公司贡献出来的,俄罗斯工程师贡献大部分C/C 带代码。
- 在多数图像处理相关的应用程序中被采用,BSD许可,可以免费应用在商业和研究领域
- 最新版本是OpenCV 3.1.0,当前SDK支持语言包括了Java、Python、IOS和Android版本。
- 官方主页: http://opencv.org/opencv-3-1.html
- 其它Matlab、Halcon
2、核心模块
- HighGUI部分
- Image Process
- 2D Feature
- Camera Calibration and 3D reconstruction
- Video Analysis
- Object Detection
- Machine Learning
- GPU加速
3、安装(vs2015环境 && openCV 3.x)
点击博客地址
==如果有报无法找到opencv_world343.dll的Error,请把C:opencvbuildx64vc14bin下的opencv_world343.dll文件复制到C:Windows 目录下即可==
二、图像处理
1、加载、修改、保存图像
加载图像(用cv::imread)
imread功能是加载图像文件成为一个Mat对象,其中第一个参数表示图像文件名称
第二个参数,表示加载的图像是什么类型,支持常见的三个参数值
- IMREAD_UNCHANGED (<0) 表示加载原图,不做任何改变
- IMREAD_GRAYSCALE ( 0)表示把原图作为灰度图像加载进来
- IMREAD_COLOR (>0) 表示把原图作为RGB图像加载进来
==注意:== OpenCV支持JPG、PNG、TIFF等常见格式图像文件加载
显示图像 (cv::namedWindos 与cv::imshow)
- namedWindos功能是创建一个OpenCV窗口,它是由OpenCV自动创建与释放,你无需取销毁它。
- 常见用法namedWindow(“Window Title”, WINDOW_AUTOSIZE)
- WINDOW_AUTOSIZE会自动根据图像大小,显示窗口大小,不能人为改变窗口大小
- WINDOW_NORMAL,跟QT集成的时候会使用,允许修改窗口大小。
- imshow根据窗口名称显示图像到指定的窗口上去,第一个参数是窗口名称,第二参数是Mat对象
修改图像 (cv::cvtColor)
- cvtColor的功能是把图像从一个彩色空间转换到另外一个色彩空间,有三个参数,第一个参数表示源图像、第二参数表示色彩空间转换之后的图像、第三个参数表示源和目标色彩空间如:COLOR_BGR2HLS 、COLOR_BGR2GRAY 等
- cvtColor( image, gray_image, COLOR_BGR2GRAY );
保存图像(cv::imwrite)
- 保存图像文件到指定目录路径
- 只有8位、16位的PNG、JPG、Tiff文件格式而且是单通道或者三通道的BGR的图像才可以通过这种方式保存
- 保存PNG格式的时候可以保存透明通道的图片
- 可以指定压缩参数
2、矩阵的掩膜操作
获取图像像素指针
- CV_Assert(myImage.depth() == CV_8U);
- Mat.ptr(int i=0) 获取像素矩阵的指针,索引i表示第几行,从0开始计行数。
- 获得当前行指针const uchar* current= myImage.ptr(row );
- 获取当前像素点P(row, col)的像素值 p(row, col) =current[col]
像素范围处理saturate_cast
- saturate_cast(-100),返回 0。
- saturate_cast(288),返回255
- saturate_cast(100),返回100
- 这个函数的功能是确保RGB值得范围在0~255之间
c
代码语言:javascript复制#include<opencv2/opencv.hpp>
#include<iostream>
#include<math.h>
using namespace cv;
int main(int argc, char ** argv) {
Mat src, dst;
src = imread("C:\Users\15646\Pictures\雷军.jpg");
if (!src.data)
{
printf("no imagen");
return -1;
}
namedWindow("input img", CV_WINDOW_AUTOSIZE);
imshow("input img", src);
int cols = (src.cols-1)* src.channels();
int offsetx = src.channels();
int rows = src.rows;
dst = Mat(src.size(), src.type());
for (int row = 1; row < rows-1; row )
{
const uchar* current = src.ptr<uchar>(row);
const uchar* previous = src.ptr<uchar>(row - 1);
const uchar* next = src.ptr<uchar>(row);
uchar* output = dst.ptr<uchar>(row);
for (int col = offsetx; col<cols;col )
{
output[col] = saturate_cast<uchar>(5 * current[col] - (current[col - offsetx]
current[col offsetx] previous[col] next[col]));
}
}
namedWindow("contrast img ", CV_WINDOW_AUTOSIZE);
imshow("contrast img ", dst);
waitKey(0);
return 0;
}
函数调用filter2D功能
- 定义掩膜:Mat kernel = (Mat_(3,3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
- filter2D( src, dst, src.depth(), kernel );其中src与dst是Mat类型变量、src.depth表示位图深度,有32、24、8等。
c
代码语言:javascript复制 Mat kernel = (Mat_<char>(3, 3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
filter2D(src,dst,src.depth(),kernel);
3、Mat对象
Mat对象与IplImage对象
- Mat对象OpenCV2.0之后引进的图像数据结构、自动分配内存、不存在内存泄漏的问题,是面向对象的数据结构。分了两个部分,头部与数据部分
- IplImage是从2001年OpenCV发布之后就一直存在,是C语言风格的数据结构,需要开发者自己分配与管理内存,对大的程序使用它容易导致内存泄漏问题
==常用方法:==
代码语言:javascript复制void copyTo(Mat mat) 克隆
void convertTo(Mat dst, int type)
Mat clone() 克隆
int channels() 获取通道
int depth()
bool empty();
uchar* ptr(i=0) 获取指针
复制
- 部分复制:一般情况下只会复制Mat对象的头和指针部分,不会复制数据部分
c
代码语言:javascript复制Mat A= imread(imgFilePath);
Mat B(A) // 只复制
- 完全复制:如果想把Mat对象的头部和数据部分一起复制,可以通过如下两个API实现
c
代码语言:javascript复制Mat F = A.clone(); 或 Mat G; A.copyTo(G);
四个要点
- 输出图像的内存是自动分配的
- 使用OpenCV的C 接口,不需要考虑内存分配问题
- 赋值操作和拷贝构造函数只会复制头部分
- 使用clone与copyTo两个函数实现数
Mat对象的创建
c
代码语言:javascript复制cv::Mat::Mat构造函数
Mat M(2,2,CV_8UC3, Scalar(0,0,255))
其中前两个参数分别表示行(row)跟列(column)、第三个CV_8UC3中的8表示每个通道占8位、U表示无符号、C表示Char类型、3表示通道数目是3,
第四个参数是向量表示初始化每个像素值是多少,向量长度对应通道数目一致
创建多维数组cv::Mat::create
int sz[3] = {2,2,2};
Mat L(3,sz, CV_8UC1, Scalar::all(0));
定义小数组
c
代码语言:javascript复制Mat C = (Mat_<double>(3,3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
MATLAB风格写法
c
代码语言:javascript复制 Mat m2;
m2 = Mat::zeros(2, 2, CV_8UC1);
imshow("demo2", m2);
4、图像像素操作
读写像素
- 读一个GRAY像素点的像素值(CV_8UC1)
c
代码语言:javascript复制Scalar intensity = img.at<uchar>(y, x);
或者 Scalar intensity = img.at<uchar>(Point(x, y));
- 读一个RGB像素点的像素值
c
代码语言:javascript复制Vec3f intensity = img.at<Vec3f>(y, x);
float blue = intensity.val[0];
float green = intensity.val[1];
float red = intensity.val[2];
修改像素值
- 灰度图像
c
代码语言:javascript复制img.at<uchar>(y, x) = 128;
- RGB三通道图像c
img.at<Vec3b>(y,x)[0]=128; // blue
img.at<Vec3b>(y,x)[1]=128; // green
img.at<Vec3b>(y,x)[2]=128;
- 空白图像赋值c
img = Scalar(0);
- ROI选择c 、
Rect r(10, 10, 100, 100);
Mat smallImg = img(r);
示例代码
c
代码语言:javascript复制int main(int argc, char ** argo) {
Mat src, gray_src;
src = imread("C:\Users\Administrator\Pictures\girl.jpg");
if (src.empty())
{
cout <<" read img error!"<< endl ;
}
namedWindow("src img", CV_WINDOW_AUTOSIZE);
imshow("src img", src);
cvtColor(src, gray_src, CV_BGR2GRAY);
//namedWindow("gray_src img", CV_WINDOW_AUTOSIZE);
//imshow("gray_src img", gray_src);
int height = gray_src.rows;
int width = gray_src.cols;
for (int row =0;row<height;row )
{
for (int col = 0; col< width;col )
{
//获取像素值
int gray = gray_src.at<uchar>(row, col);
gray_src.at<uchar>(row, col) = 255 - gray;
}
}
namedWindow("gray_src_change img", CV_WINDOW_AUTOSIZE);
imshow("gray_src_change img", gray_src);
//Mat操作
Mat dst;
dst.create(src.size(), src.type());
height = src.rows;
width = src.cols;
//获取图片通道值
int nc = src.channels();
/*for (int row = 0; row < height; row )
{
for (int col = 0; col < width; col )
{
if (nc ==1)
{
int gray = gray_src.at<uchar>(row, col);
gray_src.at<uchar>(row, col) = 255 - gray;
}
else if(nc == 3)
{
int b = src.at<Vec3b>(row, col)[0];
int g = src.at<Vec3b>(row, col)[1];
int r = src.at<Vec3b>(row, col)[2];
dst.at<Vec3b>(row, col)[0] = 255 - b;
dst.at<Vec3b>(row, col)[1] = 255 - g;
dst.at<Vec3b>(row, col)[2] = 255 - r;
}
}
}*/
//上面的转换代码可以替换,效果相同
bitwise_not(src, dst);
imshow("gray_src_change_by_mat img", dst);
cout << "enter anything" << endl;
waitKey(0);
return 0;
}
5、图像混合
理论-线性混合操作
其中a的取值范围为0~1之间
相关API (addWeighted)
c
代码语言:javascript复制void addWeighted(InputArray src1,
double alpha,
InputArray src2,
double beta,
double gamma,
OutputArray dst,
int dtype = -1);
参数1:输入图像Mat – src1
参数2:输入图像src1的alpha值
参数3:输入图像Mat – src2
参数4:输入图像src2的alpha值
参数5:gamma值
参数6:输出混合图像
注意点:两张图像的大小和类型必须一致才可以
示例代码
c
代码语言:javascript复制//设置权重
double alpha = 0.5;
if (src1.rows==src2.rows && src1.cols==src2.cols && src1.type() == src2.type())
{
addWeighted(src1, alpha, src2, (1.0 - alpha), 0.0, dst);
//multiply(src1, src2, dst, 1.0); 图像相乘
imshow("dst", dst);
}
6、调整图像亮度与对比度
- 图像变换可以看作如下:
- 像素变换 – 点操作
- 邻域操作 – 区域
- 调整图像亮度和对比度属于像素变换-点操作
重要的API
c
代码语言:javascript复制Mat new_image = Mat::zeros( image.size(), image.type() ); 创建一张跟原图像大小和类型一致的空白图像、像素值初始化为0
saturate_cast<uchar>(value)确保值大小范围为0~255之间
Mat.at<Vec3b>(y,x)[index]=value 给每个像素点每个通道赋值
示例代码
c
代码语言:javascript复制int height = src1.rows; //高度
int width = src1.cols; //宽度
double alpha = 0.8;
int beta = 30;
//生成一个空的大小和src1一样大的图
output = Mat::zeros(src1.size(), src1.type());
for (int row = 0; row < height; row )
{
for (int col = 0; col < width; col )
{
if (src1.channels()==3)
{
//像素点变换,换值,达到调整亮度和对比度的效果
float b = src1.at<Vec3b>(row, col)[0]; //blue
float g = src1.at<Vec3b>(row, col)[1]; //green
float r = src1.at<Vec3b>(row, col)[2]; //red
output.at<Vec3b>(row, col)[0] = saturate_cast<uchar>(alpha*b beta);
output.at<Vec3b>(row, col)[1] = saturate_cast<uchar>(alpha*g beta);
output.at<Vec3b>(row, col)[2] = saturate_cast<uchar>(alpha*r beta);
}
else if(src1.channels()==1)
{
output.at<uchar>(row, col) = saturate_cast<uchar>(alpha*src1.at<uchar>(row, col) beta);
}
}
}
7、绘制形状与文字
使用cv::Point与cv::Scalar
c
代码语言:javascript复制Point表示2D平面上一个点x,y
Point p;
p.x = 10;
p.y = 8;
or
p = Pont(10,8);
Scalar表示四个元素的向量
Scalar(a, b, c);// a = blue, b = green, c = red表示RGB三个通道
绘制线、矩形、园、椭圆等基本几何形状
Code
代码语言:javascript复制画线 cv::line (LINE_4LINE_8LINE_AA)
画椭圆cv::ellipse
画矩形cv::rectangle
画圆cv::circle
画填充cv::fillPoly
==示例代码==
c
代码语言:javascript复制#include<opencv2opencv.hpp>
#include<iostream>
using namespace std;
using namespace cv;
Mat bgImage;
void Myline();
void MyRectangle();
void MyEllipse();
void MyCircle();
void MyPolygon();
int main() {
bgImage = imread("C:\Users\Administrator\Pictures\girl2.jpg");
if (!bgImage.data)
{
return -1;
}
Myline();
MyRectangle();
MyEllipse();
MyCircle();
MyPolygon();
imshow("bgImage", bgImage);
waitKey(0);
return 0;
}
//画线
void Myline() {
Point p1 = Point(20, 30);
Point p2;
p2.x = 300;
p2.y = 300;
//设置颜色
Scalar color = Scalar(0, 0, 255);
line(bgImage, p1, p2, color, 1, LINE_8);
}
//画矩形
void MyRectangle() {
Rect rect = Rect(150, 500, 300, 300);
Scalar color = Scalar(255, 0, 0);
rectangle(bgImage, rect, color, 2, LINE_8);
}
//绘制椭圆
void MyEllipse() {
Scalar color = Scalar(0, 255, 0);
ellipse(bgImage,
Point(bgImage.cols / 2, bgImage.rows / 2),
Size(bgImage.cols / 4, bgImage.rows / 8),
90,0,360,color,2,LINE_8);
}
//绘制圆
void MyCircle() {
Scalar color = Scalar(0, 255, 0);
Point center = Point(bgImage.cols / 2, bgImage.rows / 2);
circle(bgImage, center, 150, color, 2, LINE_8);
}
//绘制多边形
void MyPolygon() {
Point pts[1][5];
pts[0][0] = Point(100, 100);
pts[0][1] = Point(100, 200);
pts[0][2] = Point(200, 200);
pts[0][3] = Point(200, 100);
pts[0][4] = Point(100, 100);
const Point* ppts[] = {pts[0]};
int npt[] = { 5 };
Scalar color = Scalar(255, 140, 0);
fillPoly(bgImage, ppts, npt, 1, color, LINE_8);
}
随机数生成cv::RNG
Code
代码语言:javascript复制生成高斯随机数gaussian (double sigma)
生成正态分布随机数uniform (int a, int b)
==随机画线代码==
c
代码语言:javascript复制void RandomLineDemo() {
RNG rng(12345);
Point pt1, pt2;
Mat new_img = Mat::zeros(bgImage.size(), bgImage.type());
for (int i = 0; i < 100000;i )
{
//随机生成的两个端点
pt1.x = rng.uniform(0, bgImage.cols);
pt2.x = rng.uniform(0, bgImage.cols);
pt1.y = rng.uniform(0, bgImage.rows);
pt2.y = rng.uniform(0, bgImage.rows);
int num = rng.uniform(0, 255);
line(new_img, pt1, pt2, CV_RGB(rng.uniform(0, 255), rng.uniform(0, 255), rng.uniform(0, 255)), 1, LINE_8);
//延迟50ms
if (waitKey(50)>0)
{
break;
}
imshow("随机生成图片", new_img);
}
}
绘制添加文字
c
代码语言:javascript复制putText函数 中设置fontFace(cv::HersheyFonts),
putText(bgImage, "Hello World", Point(300, 300), CV_FONT_BLACK, 1.0, CV_RGB(255, 69, 0), 1, LINE_8);