特征值和特征向量

2022-09-30 16:30:13 浏览数 (1)

特征值和特征向量是矩阵的重要性质,本文记录相关内容。 我们知道,矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。 实际上,上述的一段话既讲了矩阵变换特征值及特征向量的几何意义(图形变换)也讲了其物理含义。物理的含义就是运动的图景:特征向量在一个矩阵的作用下作伸缩运动,伸缩的幅度由特征值确定。特征值大于1,所有属于此特征值的特征向量身形暴长;特征值大于0小于1,特征向量身形猛缩;特征值小于0,特征向量缩过了界,反方向到0点那边去了。 关于特征值和特征向量,这里请注意两个亮点。这两个亮点一个是线性不变量的含义,二个是振动的谱含义。

——《线性代数的几何意义》

定义

  • 对于一个给定的方阵 {displaystyle A},定义它的特征向量(eigenvector,也译固有向量、本征向量)为非零向量{displaystyle v}v 经过这个线性变换{displaystyle A}之后,得到的新向量仍然与原来的 {displaystyle v} 保持在同一条直线上,但其长度或方向也许会改变,公式表示为:
A v = lambda v
  • lambda 为标量,即特征向量的长度在该线性变换下缩放的比例,称 {displaystyle lambda } 为方阵 A (或线性变换 A) 的特征值(eigenvalue,也译固有值、本征值)。
  • 解得的 {displaystyle lambda } 可能为重根,那么这个根重复的次数为 {displaystyle lambda } 的代数重数。

如果特征值为正,则表示 {displaystyle v} 在经过线性变换的作用后方向也不变;如果特征值为负,说明方向会反转;如果特征值为0,则是表示缩回零点。但无论怎样,仍在同一条直线上。

  • 特征值 lambda 解得的所有非零向量 v 均可称为 A 的特征向量,可以看作是关于系数 {displaystyle lambda } 的方程的非零解:
mathbf{T}(x)=lambda x
  • 矩阵的特征向量不是固定的,特征值 {displaystyle lambda } 对应的所有特征向量和零向量一起可以组成一个向量空间,这个空间称为 A 的一个特征空间。
  • 这个特征空间如果是有限维的,那么它的维数叫做 {displaystyle lambda } 的几何重数。
  • 模最大的特征值对应的特征向量为 {displaystyle A} 的主特征向量。
  • 有限维向量空间上的一个变换 {displaystyle A} 的所有特征值的集合称为 A 的谱。

计算特征值/特征向量

  • mathbf {A} 的特征向量 {displaystyle mathbf {x} } ,按照定义,是在变换 {displaystyle mathbf {A} }的作用下会得到mathbf {x} 自身的若干倍的非零向量。假设在 {displaystyle mathbf {A} }的作用下{displaystyle mathbf {x} } 变成了自身的 {displaystyle lambda },也就是
mathbf{A} mathbf{x}=lambda mathbf{x}
  • 在等式两边的左侧乘以单位矩阵 I,得到:

$$ begin{array} mathbf{I A} mathbf{x}=mathbf{I} cdot lambda mathbf{x} \ mathbf{A} mathbf{x}=(lambda I) mathbf{x} end{array} $$

  • 因此
(mathbf{A}-lambda mathbf{I}) mathbf{x}=0
  • 根据线性方程组理论,为了使这个方程有非零解,矩阵 {displaystyle mathbf {A} -lambda mathbf {I} }的行列式必须是零:
operatorname{det}(mathbf{A}-lambda mathbf{I})=0
  • 按照行列式的展开定义,上面式子的左端是一个关于 {displaystyle lambda } 的多项式,称为特征多项式。这个多项式的系数只和 {displaystyle mathbf {A} } 有关。
  • A 是一个 n×n 矩阵,则 {displaystyle p_{A}}n 次多项式,因而 A 最多有 n 个特征值。
  • 如果A的系数是在一个代数闭域里面(比如说复数域),那么代数基本定理说明这个方程刚好有 n 个根(如果重根也计算在内的话)。
  • 所有奇数次的多项式必有一个实数根,因此当 n 为奇数的时候,每个n维实系数矩阵至少有一个实数特征值。当矩阵系数是实数的时候,非实数的特征值会成共轭对出现。
  • 一旦找到特征值λ,相应的特征向量就可以通过求解如下方程得到:
(A-lambda I) v=0

特点

  1. 实系数的矩阵不一定有实数特征值
  • 考虑矩阵:

$$ left[begin{array}{cc}0 & 1 \ -1 & 0end{array}right] $$

  1. 对于 ntimes n 的矩阵 A 来说,复数域上特征值的代数重数的和为 n,几何重数小于等于代数重数
  • 考虑矩阵:

$$ A=left[begin{array}{ll}1 & 1 \ 0 & 1end{array}right] $$

  • 它只有一个特征值,也就是 λ = 1
  • 其特征多项式是 (lambda-1)^2,所以这个特征值代数重次为2。
  • 但是,相应特征空间是通常称为 x 轴的数轴,由向量 begin{bmatrix} 1 0 end{bmatrix} 线性生成,所以几何重数是1。
  • 该矩阵无法进行特征分解,即找不到 2 个正交的特征向量
  1. 一个 n×n 矩阵如果有 n不同特征值,则总是可以对角化的。
  2. 因为,也就是矩阵主对角线元素之和,在酉等价下不变,若尔当标准型说明它等于所有特征值之和
  3. 对于实对称矩阵或埃尔米特矩阵来说,不同特征值对应的特征向量必定正交(相互垂直)

参考资料

  • https://zh.m.wikipedia.org/zh-cn/特征值和特征向量#特征值方程

0 人点赞