阅读(4135) (0)

OpenCV离散傅里叶变换

2017-08-30 11:07:28 更新

目标

我们会为以下问题寻求答案:

源代码

您可以从这里下载,也可以在samples/cpp/tutorial_code/core/discrete_fourier_transform/discrete_fourier_transform.cppOpenCV源代码库中找到它。

以下是cv :: dft()的示例用法:

 #include "opencv2/core.hpp"
    2 #include "opencv2/imgproc.hpp"
    3 #include "opencv2/imgcodecs.hpp"
    4 #include "opencv2/highgui.hpp"
    5 
    6 #include <iostream>
    7 
    8 using namespace cv;
    9 using namespace std;
   10 
   11 static void help(char* progName)
   12 {
   13     cout << endl
   14         <<  "This program demonstrated the use of the discrete Fourier transform (DFT). " << endl
   15         <<  "The dft of an image is taken and it's power spectrum is displayed."          << endl
   16         <<  "Usage:"                                                                      << endl
   17         << progName << " [image_name -- default ../data/lena.jpg] "               << endl << endl;
   18 }
   19 
   20 int main(int argc, char ** argv)
   21 {
   22     help(argv[0]);
   23 
   24     const char* filename = argc >=2 ? argv[1] : "../data/lena.jpg";
   25 
   26     Mat I = imread(filename, IMREAD_GRAYSCALE);
   27     if( I.empty())
   28         return -1;
   29 
   30     Mat padded;                            //expand input image to optimal size
   31     int m = getOptimalDFTSize( I.rows );
   32     int n = getOptimalDFTSize( I.cols ); // on the border add zero values
   33     copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));
   34 
   35     Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
   36     Mat complexI;
   37     merge(planes, 2, complexI);         // Add to the expanded another plane with zeros
   38 
   39     dft(complexI, complexI);            // this way the result may fit in the source matrix
   40 
   41     // compute the magnitude and switch to logarithmic scale
   42     // => log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
   43     split(complexI, planes);                   // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
   44     magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
   45     Mat magI = planes[0];
   46 
   47     magI += Scalar::all(1);                    // switch to logarithmic scale
   48     log(magI, magI);
   49 
   50     // crop the spectrum, if it has an odd number of rows or columns
   51     magI = magI(Rect(0, 0, magI.cols & -2, magI.rows & -2));
   52 
   53     // rearrange the quadrants of Fourier image  so that the origin is at the image center
   54     int cx = magI.cols/2;
   55     int cy = magI.rows/2;
   56 
   57     Mat q0(magI, Rect(0, 0, cx, cy));   // Top-Left - Create a ROI per quadrant
   58     Mat q1(magI, Rect(cx, 0, cx, cy));  // Top-Right
   59     Mat q2(magI, Rect(0, cy, cx, cy));  // Bottom-Left
   60     Mat q3(magI, Rect(cx, cy, cx, cy)); // Bottom-Right
   61 
   62     Mat tmp;                           // swap quadrants (Top-Left with Bottom-Right)
   63     q0.copyTo(tmp);
   64     q3.copyTo(q0);
   65     tmp.copyTo(q3);
   66 
   67     q1.copyTo(tmp);                    // swap quadrant (Top-Right with Bottom-Left)
   68     q2.copyTo(q1);
   69     tmp.copyTo(q2);
   70 
   71     normalize(magI, magI, 0, 1, NORM_MINMAX); // Transform the matrix with float values into a
   72                                             // viewable image form (float between values 0 and 1).
   73 
   74     imshow("Input Image"       , I   );    // Show the result
   75     imshow("spectrum magnitude", magI);
   76     waitKey();
   77 
   78     return 0;
   79 }

说明

傅立叶变换将图像分解为其窦道和余弦分量。换句话说,它会将图像从其空间域转换到其频域。这个想法是任何函数可以用无限窦和余弦函数的和来精确地近似。傅立叶变换是一种如何做到这一点的方法。数学上二维图像傅立叶变换是:

OpenCV离散傅里叶变换

这里f是其空间域中的图像值,在其频域中是F。转换的结果是复数。可以通过实际图像和复杂图像或通过幅度和相位图像来显示这一点。然而,在整个图像处理算法中,只有幅面图像很有趣,因为它包含了我们所需要的关于图像几何结构的所有信息。然而,如果您打算以这些形式对图像进行一些修改,那么您需要重新转换它,您将需要保留这两种形式。

在本例中,我将展示如何计算和显示傅立叶变换的幅度图像。在数字图像是离散的情况下。这意味着它们可以占用给定域值的值。例如,在基本的灰度图像中,值通常在0和255之间。因此,傅里叶变换也需要是离散傅里叶变换,导致离散傅里叶变换(DFT)。当您需要从几何角度确定图像的结构时,您将需要使用它。以下是要遵循的步骤(在灰度输入图像I的情况下):


  • 将图像展开至最佳尺寸。DFT的性能取决于图像大小。对于数字二,三和五的倍数,图像尺寸趋向于最快。因此,为了获得最大的性能,通常最好将边框值填充到图像以获得具有这种特征的大小。该品种:: getOptimalDFTSize()返回这个最佳规模,我们可以使用CV :: copyMakeBorder()函数来扩大图像的边界:
Mat padded;                            //expand input image to optimal size
int m = getOptimalDFTSize( I.rows );
int n = getOptimalDFTSize( I.cols ); // on the border add zero pixels
copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

附加的像素被初始化为零。

  • 为复杂和真实的价值取得成就。傅里叶变换的结果是复杂的。这意味着对于每个图像值,结果是两个图像值(每个分量一个)。此外,频域范围远远大于其空间对应物。因此,我们通常至少以浮动格式存储它们。因此,我们将把我们的输入图像转换为这种类型,并用另一个通道来展开,以保持复杂的值:

Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
Mat complexI;
merge(planes, 2, complexI);         // Add to the expanded another plane with zeros

  • 进行离散傅里叶变换。可能的就地计算(与输出相同的输入):

dft(complexI, complexI);            // this way the result may fit in the source matrix

  • 将真实和复杂的值转化为大小。复数具有真实(Re)和复数(虚数Im)部分。DFT的结果是复数。DFT的大小是:

OpenCV离散傅里叶变换

翻译为OpenCV代码:

split(complexI, planes);                   // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
Mat magI = planes[0];

  • 切换到对数刻度。原来,傅里叶系数的动态范围太大,无法显示在屏幕上。我们有一些小而高的变化值,我们不能这样观察。因此,高价值将全部作为白点,而小的则为黑色。为了将灰度值用于可视化,我们可以将我们的线性比例变换为对数:

OpenCV离散傅里叶变换

翻译为OpenCV代码:

magI += Scalar::all(1);                    // switch to logarithmic scale
log(magI, magI);

  • 作物和重新排列。记住,在第一步,我们扩大了形象?那么现在是摒弃新推出的价值观的时候了。为了可视化的目的,我们还可以重新排列结果的象限,使原点(零,零)对应于图像中心。

magI = magI(Rect(0, 0, magI.cols & -2, magI.rows & -2));
int cx = magI.cols/2;
int cy = magI.rows/2;
Mat q0(magI, Rect(0, 0, cx, cy));   // Top-Left - Create a ROI per quadrant
Mat q1(magI, Rect(cx, 0, cx, cy));  // Top-Right
Mat q2(magI, Rect(0, cy, cx, cy));  // Bottom-Left
Mat q3(magI, Rect(cx, cy, cx, cy)); // Bottom-Right
Mat tmp;                           // swap quadrants (Top-Left with Bottom-Right)
q0.copyTo(tmp);
q3.copyTo(q0);
tmp.copyTo(q3);
q1.copyTo(tmp);                    // swap quadrant (Top-Right with Bottom-Left)
q2.copyTo(q1);
tmp.copyTo(q2);

  • 规范化。这再次为可视化目的而完成。我们现在有这样的大小,但是这仍然是我们的图像显示范围从零到一。我们使用cv :: normalize()函数将值归一化到此范围。

normalize(magI, magI, 0, 1, NORM_MINMAX); // Transform the matrix with float values into a
                                          // viewable image form (float between values 0 and 1).

结果

应用程序的想法将是确定图像中存在的几何取向。例如,让我们来看一下文本是否是横向的?看一些文字你会注意到,文本行的形式也是水平线,字母形成垂直线。在傅里叶变换的情况下,也可以看到文本片段的这两个主要组成部分。让我们使用这个水平这个旋转的图像关于一个文本。

在水平文本的情况下:

OpenCV离散傅里叶变换

在旋转文本的情况下:

OpenCV离散傅里叶变换

您可以看到频域中最有影响力的组件(幅度图像上最亮点)遵循图像上对象的几何旋转。由此,我们可以计算偏移量并执行图像旋转以纠正最终的错误对准。