可使用蒙特卡洛法进行模拟,所谓“蒙特卡罗法”(Monte Carlo Methods,MC),是通过计算机模拟,从总体抽取大量随机样本的计算方法。
代码语言:javascript复制
* PRF 和 SRF:蒙特卡罗模拟
clear
set obs 30
set seed 10101
gen x = rnormal(3, 4)
gen e = rnormal(0, 9)
gen y = 1*x e //Data Generation Process
reg y x
tw function PRF = 1 2*x, range(-5 15) || ///
scatter y x || lfit y x, lp(dash)
在伍德里奇的教材中,定义总平方和(total sum of squares, SST)、解释平方和(explained sum of squares, SSE) 和残差平方和(residual sum of squares,SSR)。
在 Stata 汇报的结果中:解释平方和(SS of Model)、残差平方和(SS of Residual)和 总平方和(SS of Total)。
平方和分解公式:
【证明】 将离差
写为
,则可将 TSS 写为:
只需证明交叉项
即可,而这由 OLS 的正交性所保证:
如果没有常数项,则无法保证
,故平方和分解公式不成立。此时,使用非中心
(uncentered
)。
1.3 拟合优度
有常数项的情况下,拟合优度等于被解释变量
与拟合值
之间相关系数的平方,即
,故记为
。
只反映了拟合程度的好坏,评估回归方程是否显著应使用 F 检验。
1.4 无常数项的回归
无常数项的一元线性回归模型可以写为:
依然进行 OLS 估计,最小化残差平方和为:
一阶条件为:
消去方程左边
,可得:
求解
可得:
如果回归模型无常数项,则平方和分解公式不成立,不宜使用
来度量拟合优度。
记
,则正规方程可写为:
记拟合值为
,则容易证明残差仍与拟合值正交:
仍可利用 OLS 的正交性将
分解为:
为可由模型解释的部分,而
为模型不可解释的部分。
定义非中心
:
如果无常数项,Stata 汇报的
正是
。
1.5 Stata 命令及实例
1.5.1 简单线性回归的 Stata 实例
代码语言:javascript复制
use ${d}/grilic.dta, clear
/*
数据说明:此数据集包括 758 位美国年轻男子的教育投资回报率数据
*/
reg lnw s
reg lnw s, noc // 无常数项回归
1.5.2 PRF 与 SRF: 蒙特卡洛法
代码语言:javascript复制
/*
PRF: y_i = 1 2x_i epsilon_i quad (i=1, ..., 30)
解释变量:$x_i ~ N(3, 2^2)$,扰动项 $epsilon_i ~ N(0,3^2)$,样本容量为 30 。
*/
clear
set obs 30
set seed 10101
gen x = rnormal(3, 4)
gen e = rnormal(0, 9)
gen y = 1*x e
reg y x
tw function PRF = 1 2*x, range(-5 15) || ///
scatter y x || lfit y x, lp(dash)