机器学习的数学基础

2019-05-30 08:35:32 浏览数 (1)

高等数学

1.导数定义:

导数和微分的概念

(1)

或者:

(2)

2.左右导数导数的几何意义和物理意义

函数

处的左、右导数分别定义为:

左导数:

右导数:

3.函数的可导性与连续性之间的关系

Th1: 函数

处可微

处可导

Th2: 若函数在点

处可导,则

在点

处连续,反之则不成立。即函数连续不一定可导。

Th3:

存在

4.平面曲线的切线和法线

切线方程 :

法线方程:

5.四则运算法则 设函数

]在点

可导则 (1)

(2)

(3)

6.基本导数与微分表 (1)

(常数)

(2)

(

为实数)

(3)

特例:

(4)

特例:

(5)

(6)

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

(15)

(16)

7.复合函数,反函数,隐函数以及参数方程所确定的函数的微分法

(1) 反函数的运算法则: 设

在点

的某邻域内单调连续,在点

处可导且

,则其反函数在点

所对应的

处可导,并且有

(2) 复合函数的运算法则:若

在点

可导,而

在对应点

(

)可导,则复合函数

在点

可导,且

(3) 隐函数导数

的求法一般有三种方法: 1)方程两边对

求导,要记住

的函数,则

的函数是

的复合函数.例如

等均是

的复合函数. 对

求导应按复合函数连锁法则做. 2)公式法.由

,其中,

分别表示

的偏导数 3)利用微分形式不变性

8.常用高阶导数公式

(1)

(2)

(3)

(4)

(5)

(6)莱布尼兹公式:若

阶可导,则

,其中

9.微分中值定理,泰勒公式

Th1:(费马定理)

若函数

满足条件: (1)函数

的某邻域内有定义,并且在此邻域内恒有

,

(2)

处可导,则有

Th2:(罗尔定理)

设函数

满足条件: (1)在闭区间

上连续;

(2)在

内可导;

(3)

则在

内一存在个

,使

Th3: (拉格朗日中值定理)

设函数

满足条件: (1)在

上连续;

(2)在

内可导;

则在

内一存在个

,使

Th4: (柯西中值定理)

设函数

满足条件: (1) 在

上连续;

(2) 在

内可导且

均存在,且

则在

内存在一个

,使

10.洛必达法则 法则Ⅰ (

型) 设函数

满足条件:

;

的邻域内可导,(在

处可除外)且

;

存在(或

)。

则:

。 法则

(

型)设函数

满足条件:

;

存在一个

,当

时,

可导,且

;

存在(或

)。

则:

法则Ⅱ(

型) 设函数

满足条件:

;

的邻域内可导(在

处可除外)且

;

存在(或

)。则

同理法则

(

型)仿法则

可写出。

11.泰勒公式

设函数

在点

处的某邻域内具有

阶导数,则对该邻域内异于

的任意点

,在

之间至少存在 一个

,使得:

其中

称为

在点

处的

阶泰勒余项。

,则

阶泰勒公式

……(1) 其中

在0与

之间.(1)式称为麦克劳林公式

常用五种函数在

处的泰勒公式

(1)

(2)

(3)

(4)

(5)

12.函数单调性的判断 Th1: 设函数

区间内可导,如果对

,都有

(或

),则函数

内是单调增加的(或单调减少)

Th2: (取极值的必要条件)设函数

处可导,且在

处取极值,则

Th3: (取极值的第一充分条件)设函数

的某一邻域内可微,且

(或

处连续,但

不存在。) (1)若当

经过

时,

由“ ”变“-”,则

为极大值; (2)若当

经过

时,

由“-”变“ ”,则

为极小值; (3)若

经过

的两侧不变号,则

不是极值。

Th4: (取极值的第二充分条件)设

在点

处有

,且

,则 当

时,

为极大值; 当

时,

为极小值。 注:如果

,此方法失效。

13.渐近线的求法 (1)水平渐近线 若

,或

,则

称为函数

的水平渐近线。

(2)铅直渐近线 若

,或

,则

称为

的铅直渐近线。

(3)斜渐近线 若

,则

称为

的斜渐近线。

14.函数凹凸性的判断 Th1: (凹凸性的判别定理)若在I上

(或

),则

在I上是凸的(或凹的)。

Th2: (拐点的判别定理1)若在

,(或

不存在),当

变动经过

时,

变号,则

为拐点。

Th3: (拐点的判别定理2)设

点的某邻域内有三阶导数,且

,则

为拐点。

15.弧微分

16.曲率

曲线

在点

处的曲率

。 对于参数方程

17.曲率半径

曲线在点

处的曲率

与曲线在点

处的曲率半径

有如下关系:

线性代数

行列式

1.行列式按行(列)展开定理

(1) 设

,则:

其中:

(2) 设

阶方阵,则

,但

不一定成立。

(3)

,

阶方阵。

(4) 设

阶方阵,

(若

可逆),

(5)

为方阵,但

(6) 范德蒙行列式

阶方阵,

个特征值,则

矩阵

矩阵:

个数

排成

列的表格

称为矩阵,简记为

,或者

。若

,则称

阶矩阵或

阶方阵。

矩阵的线性运算

1.矩阵的加法

是两个

矩阵,则

矩阵

称为矩阵

的和,记为

2.矩阵的数乘

矩阵,

是一个常数,则

矩阵

称为数

与矩阵

的数乘,记为

3.矩阵的乘法

矩阵,

矩阵,那么

矩阵

,其中

称为

的乘积,记为

4.

三者之间的关系

(1)

(2)

不一定成立。

(3)

不一定成立。

(4)

5.有关

的结论

(1)

(2)

(3) 若

可逆,则

(4) 若

阶方阵,则:

6.有关

的结论

可逆

可以表示为初等矩阵的乘积;

7.有关矩阵秩的结论

(1) 秩

=行秩=列秩;

(2)

(3)

(4)

(5) 初等变换不改变矩阵的秩

(6)

特别若

则:

(7) 若

存在

存在

(8)

只有零解

8.分块求逆公式

这里

均为可逆方阵。

向量

1.有关向量组的线性表示

(1)

线性相关

至少有一个向量可以用其余向量线性表示。

(2)

线性无关,

线性相关

可以由

唯一线性表示。

(3)

可以由

线性表示

2.有关向量组的线性相关性

(1)部分相关,整体相关;整体无关,部分无关.

(2) ①

维向量

线性无关

维向量

线性相关

维向量线性相关。

③ 若

线性无关,则添加分量后仍线性无关;或一组向量线性相关,去掉某些分量后仍线性相关。

3.有关向量组的线性表示

(1)

线性相关

至少有一个向量可以用其余向量线性表示。

(2)

线性无关,

线性相关

可以由

唯一线性表示。

(3)

可以由

线性表示

4.向量组的秩与矩阵的秩之间的关系

,则

的秩

的行列向量组的线性相关性关系为:

(1) 若

,则

的行向量组线性无关。

(2) 若

,则

的行向量组线性相关。

(3) 若

,则

的列向量组线性无关。

(4) 若

,则

的列向量组线性相关。

5.

维向量空间的基变换公式及过渡矩阵

是向量空间

的两组基,则基变换公式为:

其中

是可逆矩阵,称为由基

到基

的过渡矩阵。

6.坐标变换公式

若向量

在基

与基

的坐标分别是

即:

,则向量坐标变换公式为

,其中

是从基

到基

的过渡矩阵。

7.向量的内积

8.Schmidt正交化

线性无关,则可构造

使其两两正交,且

仅是

的线性组合

,再把

单位化,记

,则

是规范正交向量组。其中

............

9.正交基及规范正交基

向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。

线性方程组

1.克莱姆法则

线性方程组

,如果系数行列式

,则方程组有唯一解,

,其中

是把

中第

列元素换成方程组右端的常数列所得的行列式。

2.

阶矩阵

可逆

只有零解。

总有唯一解,一般地,

只有零解。

3.非奇次线性方程组有解的充分必要条件,线性方程组解的性质和解的结构

(1) 设

矩阵,若

,则对

而言必有

,从而

有解。

(2) 设

的解,则

时仍为

的解;但当

时,则为

的解。特别

的解;

的解。

(3) 非齐次线性方程组

无解

不能由

的列向量

线性表示。

4.奇次线性方程组的基础解系和通解,解空间,非奇次线性方程组的通解

(1) 齐次方程组

恒有解(必有零解)。当有非零解时,由于解向量的任意线性组合仍是该齐次方程组的解向量,因此

的全体解向量构成一个向量空间,称为该方程组的解空间,解空间的维数是

,解空间的一组基称为齐次方程组的基础解系。

(2)

的基础解系,即:

的解;

线性无关;

的任一解都可以由

线性表出.

的通解,其中

是任意常数。

矩阵的特征值和特征向量

1.矩阵的特征值和特征向量的概念及性质

(1) 设

的一个特征值,则

有一个特征值分别为

且对应特征向量相同(

例外)。

(2)若

个特征值,则

,从而

没有特征值。

(3)设

个特征值,对应特征向量为

若:

,

则:

2.相似变换、相似矩阵的概念及性质

(1) 若

,则

,对

成立

3.矩阵可相似对角化的充分必要条件

(1)设

阶方阵,则

可对角化

对每个

重根特征值

,有

(2) 设

可对角化,则由

,从而

(3) 重要结论

,则

.

,则

,其中

为关于

阶方阵

的多项式。

为可对角化矩阵,则其非零特征值的个数(重根重复计算)=秩(

)

4.实对称矩阵的特征值、特征向量及相似对角阵

(1)相似矩阵:设

为两个

阶方阵,如果存在一个可逆矩阵

,使得

成立,则称矩阵

相似,记为

(2)相似矩阵的性质:如果

则有:

(若

均可逆)

为正整数)

,从而

有相同的特征值

,从而

同时可逆或者不可逆

不一定相似

二次型

1.

个变量

的二次齐次函数

,其中

,称为

元二次型,简称二次型. 若令

,这二次型

可改写成矩阵向量形式

。其中

称为二次型矩阵,因为

,所以二次型矩阵均为对称矩阵,且二次型与对称矩阵一一对应,并把矩阵

的秩称为二次型的秩。

2.惯性定理,二次型的标准形和规范形

(1) 惯性定理

对于任一二次型,不论选取怎样的合同变换使它化为仅含平方项的标准型,其正负惯性指数与所选变换无关,这就是所谓的惯性定理。

(2) 标准形

二次型

经过合同变换

化为

称为

的标准形。在一般的数域内,二次型的标准形不是唯一的,与所作的合同变换有关,但系数不为零的平方项的个数由

唯一确定。

(3) 规范形

任一实二次型

都可经过合同变换化为规范形

,其中

的秩,

为正惯性指数,

为负惯性指数,且规范型唯一。

3.用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性

正定

正定;

,

可逆;

,且

正定

正定,但

不一定正定

正定

的各阶顺序主子式全大于零

的所有特征值大于零

的正惯性指数为

存在可逆阵

使

存在正交矩阵

,使

其中

正定

正定;

可逆;

,且

概率论和数理统计

随机事件和概率

1.事件的关系与运算

(1) 子事件:

,若

发生,则

发生。

(2) 相等事件:

,即

,且

(3) 和事件:

(或

),

中至少有一个发生。

(4) 差事件:

发生但

不发生。

(5) 积事件:

(或

),

同时发生。

(6) 互斥事件(互不相容):

=

(7) 互逆事件(对立事件):

2.运算律 (1) 交换律:

(2) 结合律:

(3) 分配律:

3.德

摩根律

4.完全事件组

两两互斥,且和事件为必然事件,即

5.概率的基本公式 (1)条件概率:

,表示

发生的条件下,

发生的概率。 (2)全概率公式:

(3) Bayes公式:

注:上述公式中事件

的个数可为可列个。 (4)乘法公式:

6.事件的独立性 (1)

相互独立

(2)

两两独立

;

;

; (3)

相互独立

;

;

;

7.独立重复试验

将某试验独立重复

次,若每次实验中事件A发生的概率为

,则

次试验中

发生

次的概率为:

8.重要公式与结论

(5)条件概率

满足概率的所有性质, 例如:.

(6)若

相互独立,则

(7)互斥、互逆与独立性之间的关系:

互逆

互斥,但反之不成立,

互斥(或互逆)且均非零概率事件

不独立. (8)若

相互独立,则

也相互独立,其中

分别表示对相应事件做任意事件运算后所得的事件,另外,概率为1(或0)的事件与任何事件相互独立.

随机变量及其概率分布

1.随机变量及概率分布

取值带有随机性的变量,严格地说是定义在样本空间上,取值于实数的函数称为随机变量,概率分布通常指分布函数或分布律

2.分布函数的概念与性质

定义:

性质:(1)

(2)

单调不减

(3) 右连续

(4)

3.离散型随机变量的概率分布

4.连续型随机变量的概率密度

概率密度

;非负可积,且:

(1)

(2)

(3)

的连续点,则:

分布函数

5.常见分布

(1) 0-1分布:

(2) 二项分布:

(3) Poisson分布:

(4) 均匀分布

(5) 正态分布:

(6)指数分布:

(7)几何分布:

(8)超几何分布:

6.随机变量函数的概率分布

(1)离散型:

则:

(2)连续型:

则:

7.重要公式与结论

(1)

(2)

(3)

(4)

(5) 离散型随机变量的分布函数为阶梯间断函数;连续型随机变量的分布函数为连续函数,但不一定为处处可导函数。

(6) 存在既非离散也非连续型随机变量。

多维随机变量及其分布

1.二维随机变量及其联合分布

由两个随机变量构成的随机向量

, 联合分布为

2.二维离散型随机变量的分布

(1) 联合概率分布律

(2) 边缘分布律

(3) 条件分布律

3. 二维连续性随机变量的密度

(1) 联合概率密度

(2) 分布函数:

(3) 边缘概率密度:

(4) 条件概率密度:

4.常见二维随机变量的联合分布

(1) 二维均匀分布:

,

(2) 二维正态分布:

,

5.随机变量的独立性和相关性

的相互独立:

:

(离散型)

(连续型)

的相关性:

相关系数

时,称

不相关, 否则称

相关

6.两个随机变量简单函数的概率分布

离散型:

则:

连续型:

则:

7.重要公式与结论

(1) 边缘密度公式:

(2)

(3) 若

服从二维正态分布

则有:

相互独立

,即

不相关。

关于

的条件分布为:

关于

的条件分布为:

(4) 若

独立,且分别服从

则:

(5) 若

相互独立,

为连续函数, 则

也相互独立。

随机变量的数字特征

1.数学期望

离散型:

连续型:

性质:

(1)

(2)

(3) 若

独立,则

(4)

2.方差

3.标准差

4.离散型:

5.连续型:

性质:

(1)

(2)

相互独立,则

(3)

(4) 一般有

(5)

(6)

6.随机变量函数的数学期望

(1) 对于函数

为离散型:

为连续型:

(2)

;

;

;

7.协方差

8.相关系数

,

阶原点矩

;

阶中心矩

性质:

(1)

(2)

(3)

(4)

(5)

,其中

,其中

9.重要公式与结论

(1)

(2)

(3)

,其中

,其中

(4) 下面5个条件互为充要条件:

注:

独立为上述5个条件中任何一个成立的充分条件,但非必要条件。

数理统计的基本概念

1.基本概念

总体:研究对象的全体,它是一个随机变量,用

表示。

个体:组成总体的每个基本元素。

简单随机样本:来自总体

个相互独立且与总体同分布的随机变量

,称为容量为

的简单随机样本,简称样本。

统计量:设

是来自总体

的一个样本,

)是样本的连续函数,且

中不含任何未知参数,则称

为统计量。

样本均值:

样本方差:

样本矩:样本

阶原点矩:

样本

阶中心矩:

2.分布

分布:

,其中

相互独立,且同服从

分布:

,其中

相互独立。

分布:

,其中

相互独立。

分位数:若

则称

分位数

3.正态总体的常用样本分布

(1) 设

为来自正态总体

的样本,

则:

或者

4)

4.重要公式与结论

(1) 对于

,有

(2) 对于

,有

(3) 对于

,有

(4) 对于任意总体

,有

原文:http://www.ai-start.com/dl2017/html/math.html

0 人点赞