正文共:1485 字 36 图 预计阅读时间: 4 分钟
前文推送
- 线性代数 -- MIT18.06(十三):第一部分复习
- 线性代数--MIT18.06(二十五):第二部分复习
- 线性代数--MIT18.06(二十六):对称矩阵和正定矩阵
- 线性代数--MIT18.06(二十七):复数矩阵和快速傅里叶变化
28. 正定矩阵和最小值
28.1 课程内容:正定矩阵和最小值
在第二十六讲已经讲解了正定矩阵的一些性质,这一讲将给出判断矩阵为正定矩阵的判定条件,同时给出几何解释
首先正定矩阵的基础性质可以作为判断条件,即
- 矩阵的特征值都大于 0
- 矩阵的所有行列式的值都大于 0
- 对矩阵消元之后的主元都大于 0
另外还可以根据
对于任意的
,其值大于 0 ,那么矩阵
是正定矩阵。
看一个二阶矩阵的例子
该矩阵为正定矩阵的条件即为
都大于 0 (特征值判断)
- ,并且 (各阶行列式的值判断)
- ,并且 (所有主元判断)
- 当然还有
, 这是最重要的判断方法。
举个例子,当
为
我们很容发现,使用行列式值的判定条件,当
时行列式的值为 0 ,此时我们称矩阵为半正定矩阵(positive semi-definite matrix),而当
时,矩阵就满足正定矩阵的条件。也就是说
是矩阵为正定矩阵的临界条件。
现在假设
,很容易就发现该矩阵满足正定矩阵的前三个判断条件,即所有特征值,所有阶行列式,消元之后的所有主元都大于0 ,那么从第四条正定矩阵的新定义出发,我们可以得到
我们发现将
看成函数的形式的话,是二阶方程,并且是可以转化为平方和的形式的。当
的时候,该二阶方程的最小值就是原点,对于该二阶方程,在微积分当中,我们来判断最小值,那就是求导数了,一阶导数为 0 并且二阶导数 大于 0 的地方,那就是函数的最小值,而在现在的矩阵形式当中,也就是二阶导数矩阵的行列式的值是大于 0 的。
而如果将该函数在轴上画出来,就是一个开口向上的碗的形状,如果函数值(也就是
的值)为 1 ,那就相当于在该函数图上在 函数值为 1 处做一个横切面,而这个切面就是一个椭圆,其中矩阵的特征值就可以表征该椭圆的轴的长度,而矩阵的特征向量就表征轴的方向! 由此,我们就将主元,行列式,特征值,特征向量, 以及最小值联系了起来。
那么推广到更高阶的情况,也是同样的道理,比如到三阶矩阵的情形,那么所得的几何体就是在 4 维空间中的一个椭球体,3 个轴的长度与矩阵的 3 个特征值相关,3 个轴的方向和3 个特征向量相关。
实际上在二维的情况下,如果是正定矩阵,那么函数图像的几何切面是一个椭圆,如果不是正定矩阵,那么切面的函数图像就是双曲线。
28.2 习题课
2011年判断矩阵为正定矩阵的条件习题课
(http://open.163.com/movie/2016/4/G/V/MBKJ0DQ52_MBQF4FBGV.html)
对于下列矩阵
,判断当
满足什么条件时,其为正定矩阵,何时为半正定矩阵。
解答
我们分别从各阶余子式的行列式的值 ,主元 ,
三种方法来求解该问题。
- 各阶行列式都大于 0
首先是 1 阶行列式就是 2, 2 阶行列式为
3阶行列式即为
如果
为正定矩阵,则需要各阶行列式的值都大于 0 ,即
, 而当行列式的值为 0 时,也就是正定矩阵的临界状态,即
时,矩阵
为半正定矩阵。
- 消元法判断主元
同样得到当
时,矩阵为半正定矩阵,当
时,矩阵为正定矩阵
- 正定矩阵新定义的方法
平方项的系数就是主元,因此结论和前两种方式的结论是一致的。