![伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解](https://wfqqreader-1252317822.image.myqcloud.com/cover/896/27050896/b_27050896.jpg)
第一篇 横截面数据的回归分析
第2章 简单回归模型
2.1 复习笔记
一、简单回归模型的定义
1.简单线性回归模型
一个简单的方程是:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image028.png?sign=1739497881-UyJNvnzKQmdDtOLKQO8f7nlwWq1wtyF1-0-c3608ef700bd5a8db980c71da2954e00)
假定方程在所关注的总体中成立,它便定义了一个简单线性回归模型。因为它把两个变量x和y联系起来,所以又把它称为两变量或者双变量线性回归模型。变量u称为误差项或者干扰项,表示除x之外其他影响y的因素。就是y与x的关系式中的斜率参数,表示在其他条件不变的情况下,x变化一个单位y平均变化。
被称为截距参数,在一般的模型中除非有很强的理论依据说明模型没有截距项,否则一般情况下都要带上截距项。
2.回归术语
表2-1 简单回归的术语
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image031.jpg?sign=1739497881-nfIJ9xBtRNLWBcZA8jGH5ZPFmZpfMbg9-0-86c6c92156aaf184f7d3d9c81c799d5d)
3.零条件均值假定
(1)零条件均值
u的平均值与x值无关。可以把它写作:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image032.png?sign=1739497881-RxKpDyemVZ5nrh4wwXGsDNnf9TjDH7iq-0-f8921902b248fe2668461b10ba47e4c9)
当方程成立时,就说u的均值独立于x。
(2)零条件均值假定的意义
①零条件均值假定给出的另一种非常有用的解释。以x为条件取期望值,并利用
,便得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image034.png?sign=1739497881-UONMnC3TjaqqwEG2DElaaSsHRwMJhUYi-0-f006bdaccd6c7a417b9a95d6115399fa)
方程表明,总体回归函数(PRF)是x的一个线性函数,线性意味着x变化一个单位,将使y的期望值改变
。对任何给定的x值,y的分布都以
为中心。
就是斜率参数。
②给定零条件均值假定,把方程中的y看成两个部分是比较有用的。一部分是表示
的
,被称为y的系统部分,即由x解释的那一部分,另一个部分是被称为非系统部分的u,即不能由x解释的那一部分。
二、普通最小二乘法的推导
1.最小二乘估计值
从总体中找一个样本。令表示从总体中抽取的一个容量为n的随机样本。
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image038.png?sign=1739497881-nbFpvsSxbJK6dPOGGlPjM6DviaOqDWD8-0-b03633cbb5d30cceac180589a9f68adb)
在总体中,u与x不相关。因此有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image039.png?sign=1739497881-BCzvQbS6Hcjtv4QzsYDVnJQYTmR3x8fM-0-dcfd64624a367d4040a6b657c3cccdb6)
用可观测变量x和y以及未知参数和
表示为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image040.png?sign=1739497881-D1BXlKRbKjtCCxq1GhF3DyYljxTXiO4y-0-2732ee8433c7714da26d0212bfaab2e9)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image041.png?sign=1739497881-irqyqSzYJq1oW8COFlcjY7yeUIVzwVPn-0-b5c168d3dbe9e3f5e06263b0ac601eef)
得到
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image042.png?sign=1739497881-5O9F2anBPzv7cz3hhdrqUIcErcFUyy66-0-22942f793f5f1390d6ad7680d8c4e7b3)
和
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image043.png?sign=1739497881-gGmbCBYR4Ibug4JTOmlsYpP8BTajgGuR-0-8ade76cbe713efc97484e992f0e3adaa)
这两个方程可用来解出和
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image046.png?sign=1739497881-S0LYsrKXwLXKs1Q6t236rAO84ds0oW9e-0-51443585ca82d3e6c2f34bb94f7be675)
则
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image047.png?sign=1739497881-ukPpp77dlbWILs1b5irOSCdoc357A2aZ-0-0e3721c051e0765f0879ee92bb762885)
一旦得到斜率估计值,则有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image048.png?sign=1739497881-lq5WFk3vpj9QTsp4jNhpOJ0daT4usrTl-0-574880f67c98401d29046f054cce70a9)
整理后便得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image049.png?sign=1739497881-3bYYkUPTJO1RBBqdCbRU5HPCXOKYTb3d-0-b699aa78765b32fbdbfe0d3a3f154712)
根据求和运算的基本性质,有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image050.png?sign=1739497881-qBJPmBShfJ2XGQOzzc3Yaz2RX5bVywmy-0-355ce9002e956ec4bebc960434e90ce3)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image051.png?sign=1739497881-kbdDJ6aJWVrfR1Bt8IIAD99WGEFJr8Cu-0-dbf622d89b526d8cadae619944971153)
因此,只要有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image052.png?sign=1739497881-53C3u5XrIdFsDpFhhfsyvgq9YLn1rbrZ-0-1e2f28d885ac3571805ce9cbbd1acdb3)
估计的斜率就为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image053.png?sign=1739497881-2iIqGNJXG2hKG5tQswlej4N7LahNjhHX-0-456685ae03fc47c5d9954faeb3bc0f54)
所给出的估计值称为和
的普通最小二乘(OLS)估计值。
2.普通最小二乘估计的合理性
已知
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image054.png?sign=1739497881-W76f44MczF5oJESZyJCWOpdprM78RwTp-0-8971ae03dc835b20a6725279220b55b2)
第i次观测的残差是yi的实际值与其拟合值之差:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image055.png?sign=1739497881-SDuh8sYkocbws1R0f5BoetqTPWYSuiYv-0-4927ab7760508ce6392c8f58209079c1)
选择和
最小化残差平方和:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image056.png?sign=1739497881-e6HCptVDIOYm59v8TNs4yan26vLwfzgS-0-9a8198e87d2eaf0b134f5117fe12f81e)
“普通最小二乘法”之所以得名,就是因为这些估计值最小化了残差平方和。求得和
使得残差平方和最小,就是用上式对
和
分别求偏导,OLS估计的一阶条件为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image057.png?sign=1739497881-fo6DJAVcDCNRiwEbxeji58ypiOBH7afF-0-f699a2eb9e1e7d4dc99b861650a95b90)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image058.png?sign=1739497881-o6ij4w81kYSyKZYvUkQ2npxWwIR2lYNu-0-3909c140f79769982fcbeca5cd122ea6)
一旦确定了OLS截距和斜率估计值,就能够建立OLS回归线:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image059.png?sign=1739497881-1cefIc32Wkhg1xFcwaIY9bVigOvA1x6I-0-61ad94655b138f8f956fb309bc969adc)
方程又被称为样本回归函数(SRF),因为它是总体回归函数的一个样本估计。总体回归函数是固定而又未知的。而样本回归函数则是来自一组给定的数据样本,所以利用不同的样本将使得方程中产生不同的斜率和截距。
三、OLS的操作技巧
1.拟合值和残差
假定从给定数据样本中得到截距和斜率的估计值和
。给定
和
,能够获得每次观测的拟合值
。根据定义,
的每个拟合值都在OLS回归线上。
与第i次观测相联系的OLS残差是
与其拟合值之差。若
为正,则回归线低估了yi;若
为负,则回归线高估了yi。第i次观测最理想的情况是
,但在大部分情形中,并非每个残差都等于零。换言之,实际上没有一个数据点必须在OLS线上。OLS的思想就是使得这些数据点尽可能接近于OLS回归线。
2.OLS统计量的代数性质
(1)OLS残差和及其样本均值都为零。数学表述为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image065.png?sign=1739497881-T6oJyXsr9xguad7fl4DfovsgBPAfstze-0-f1a618b46198b866fc8cd6861cbe032a)
(2)回归元和OLS残差的样本协方差为零。
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image066.png?sign=1739497881-OxhnmLHdasUqitK6szsNAzTDquaDb5JZ-0-21dc2f8618a296f2f73d4b97b6498b9d)
(3)点总在OLS回归线上。
3.定义总平方和(SST)、解释平方和(SSE)和残差平方和(SSR)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image068.png?sign=1739497881-lMMKIWUZJA459kmFKme2RrgPxG14MACs-0-f1e882a2d389d93310cc3a64c5195dcf)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image069.png?sign=1739497881-wZtpvzYNUWFLNyyFEEln4txmvmkziYKQ-0-449137fdb542522ce083f01eff093b9a)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image070.png?sign=1739497881-SuiEN5okxtFAN6gsiPIKfOhflEaLS3Ew-0-3b4e98a1831115d2651a361cb2cd3253)
SST度量了yi中的总样本变异;这就是说,它度量了yi在样本中的分散程度,称为总平方和。SSE度量了yi的样本变异,即样本的变异中能由回归方程所能解释的部分,因此称为解释平方和。SSE度量了ui的样本变异,即不能由回归线解释的部分,称为残差平方和。y的总变异SST总能表示成解释了的变异SSE和未解释的变异SSR之和,即有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image071.png?sign=1739497881-XqcStP52eoy0G3zDzM6wiXFJFFBoHpIq-0-b3c95ceaee9928ee4914fa18ac2abad5)
不能把残差平方称为“误差平方和”,因为误差和残差是不同的两个量。
4.拟合优度
拟合优度R2,有时又称为判定系数,被定义为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image072.png?sign=1739497881-J8fdl0ktXUrH0hBi9lWD5RCTHfb7rzeB-0-b7f7f518260c5c2df7ae35faffbf6771)
R2是解释变异与总变异之比,因此被解释成y的样本变异中被x解释的部分。因为SSE不可能大于SST,所以R2的值总介于0和1之间。
R2的值越接近于1表示回归线对样本数据拟合的越好,因此R2可以用来作为评价一个模型拟合好坏的标准,但是不能仅仅根据R2的大小来选择一个模型,因为在社会科学中,回归方程中的R2过低是很正常的,对于横截面分析来说,一个看似很低的R2值,并不意味着OLS回归方程没有用。
四、度量单位和函数形式
1.改变度量单位对OLS统计量的影响
(1)当因变量的度量单位改变时,很容易计算出截距和斜率估计值的变化。若因变量乘以一个常数c(意味着样本中的每个数据都乘以c),则OLS截距和斜率的估计值都扩大为原来的c倍。
(2)若自变量被除以或乘以一个非零常数c,则OLS斜率系数也会分别被乘以或者除以c。
(3)一般地,仅改变自变量的度量单位,不会影响截距估计值。
(4)模型的拟合优度不依赖于变量的度量单位。利用R2的定义可知,R2事实上不因y或x的单位变化而改变。
2.在简单回归中加入非线性因素
一个给出百分比影响(近似)为常数的模型是:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image073.png?sign=1739497881-juv0ObN9a1wd28Y5Ei25ghuR3e6X4RQi-0-cf714d493d62beca5efc3dd531259b26)
特别地,若,则
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image075.png?sign=1739497881-e24pUVDX9Rc8PGQhxSAmxpjnoV3gjTVy-0-31378b0ee735992b8143f3a3f250b457)
自然对数的另一个应用,是得到一个常弹性模型:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image076.png?sign=1739497881-Hs5cpaFzMXDTLixim37gk0xx2gS3Q5Xq-0-f03444870d32fbc5d17535a157fb3ff9)
定义因变量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image077.png?sign=1739497881-1uB6PQoNTp3uwmPJq8Rjk2XZEBUMYDf3-0-c944b932d3c5d2459e4a8f51954b0036)
自变量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image078.png?sign=1739497881-NLMic3vjS1UwsRIHVu2XMlmQWV4Cs2NP-0-ec13df9c1b1736ef16846593ebb6d63d)
这个模型就变成了简单回归模型。双对数回归模型的斜率参数表示x为对y的弹性。
3.含对数的函数的几种形式
表2-2 含对数的函数形式总览
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image079.jpg?sign=1739497881-P9TM2lXh1NlY2cf7xq8nr1m6VJbWC4ms-0-74e4d055506a1d1fd32b23e63e531766)
4.“线性”回归的含义
一般线性模型同样允许非线性关系的存在。“线性”的含义是对参数为线性,即方程中的参数和
是线性形式的,至于被解释变量和解释变量是什么形式,并没有限制,可以是线性的也可以是非线性的。
五、OLS估计量的期望值和方差
1.OLS的无偏性
(1)相关假定
①假定SLR.1(线性于参数)
在总体模型中,因变量y与自变量x和误差(干扰)u的关系如下:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image080.png?sign=1739497881-vZSllFxJ6Hi818TssObKNEaxZP3vEdtt-0-1ef20c21e5c15cedfd914c7a19f8f0cc)
其中,和
分别表示总体的截距和斜率参数。
②假定SLR.2(随机抽样)
具有一个服从总体模型方程的随机样本,其样本容量为n。
③假定SLR.3(解释变量的样本有变异)
x的样本结果即不是完全相同的数值。
④假定SLR.4(零条件均值)
给定解释变量的任何值,误差的期望值都为零,。
(2)与
的差异
斜率估计量为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image083.png?sign=1739497881-itKMZtUeEgSpUs8y9ISA0ojFJyvhZwz8-0-97312283a86a83862d2ebfdbe4c34da4)
将代入,分子变为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image085.png?sign=1739497881-o0NArSzZvnLHznT07AWOBcGIvCJzP1H4-0-703198197ee8072be8a60c656a16c8ee)
因为,所以
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image087.png?sign=1739497881-JppX7FqBOQ8yvnceGTsDIT5gBYc13El2-0-0cd2c746b3b4fbbab23ac3223d7e2d7b)
故上式可转换为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image088.png?sign=1739497881-rvbyRjLAOnMJcRf5YBtHu2id1txeL7VX-0-b802f951c8cbfe79f9bc6ca2dc1194b9)
其中
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image089.png?sign=1739497881-6HAjO9Gp4jMEOI7HNZRIFjSCWTBiDexk-0-8abee7a969e2cd2ee7280ec68f8c3fbb)
可以看到,的估计量等于总体斜率
加上误差
的一个线性组合。以xi的值为条件,
的随机性完全来自于样本中的误差。这些误差一般都不为零的事实,正是
与
有差异的原因。
(3)定理2.1:OLS的无偏性
利用假定SLR.1~SLR.4,对任意和
,
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image091.png?sign=1739497881-stFHmMJ5jbyAFVvkI0BH5TB9EZpIa8cB-0-26e560ba9abe21e8f0fee04b42dd0e84)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image092.png?sign=1739497881-N2fFptSIS6cPj2yTADAb3mTu44RgMNE5-0-8da7bdb0c04206c6004d2530d362c0cc)
成立,即对
、
对
而言是无偏的。
(4)证明OLS的无偏性
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image093.png?sign=1739497881-ix0Xs6xbkhUORFFDljBhIBJOTSNT3LrO-0-8b8fa1d8d689e5d5b77985c81b3c0927)
根据假定SLR.2和SLR.4有,故以xi的值为条件,有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image095.png?sign=1739497881-VTSUOIdxgUw1kvEBJHrPX3SSs7Xt9F6C-0-75d97013e9f6dff37fb34dc8a31a38f6)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image096.png?sign=1739497881-aB8hbNuR4sIQpfGH66TG680aF2FxFvHF-0-6107790864523ed02d1a1aef65b75659)
由OLS的无偏性有,即
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image098.png?sign=1739497881-DxFiZ8VG7q0SNKORwdTwWMOxdfMMqbzX-0-d5ec8c54b6e8c9e46932db414d9531e2)
因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image099.png?sign=1739497881-EtweOdiWlu6ACEndMXz4joTGNhz9DlDH-0-dc20ffd45a7b3fad244930df5ff8b8c9)
2.OLS估计量的方差
(1)相关假定
假定SLR.5(同方差性)
给定解释变量的任何值,误差都具有相同的方差
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image100.png?sign=1739497881-rvlcLKaurBMxyoWZ0IkaDFo2Ikf91fuY-0-e2bb207c6c56f0e0ded8da2677d6ed5c)
(2)定理2.2:OLS估计量的抽样方差
在假定SLR.1~SLR.5下,以样本值为条件,有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image102.png?sign=1739497881-7agOjVyf46A3igfs0H2OFDGHx9cE1TtN-0-34f5cad1f85d03b4667660102639dc6b)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image103.png?sign=1739497881-lfIVfrKKynSPs4mWHP10sLPj971OQnVp-0-bea1f1ce663816840be9c4e1d44c6ac0)
(3)证明
因为只是一个常数,而且以xi为条件,所以SSTx和di=xi-x也是非随机的。而且,ui在i上(根据随机抽样)是独立的随机变量,故和的方差就是方差的和。所以:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image104.png?sign=1739497881-yD0fqr3AHl0LWeeFCV4R5ELcM0bOpFMb-0-d6a7210b773986d06ed00e84f2b4ece0)
3.误差方差的估计
(1)误差与残差的区分
利用随机样本观测把总体模型写成
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image105.png?sign=1739497881-GzfKZQKNb0diMJA4xjky8POwxazFQSTw-0-c59a5b2e79c9082ab83e6747b31fb8fa)
其中ui是第i次观测的误差。还可以将yi用其拟合值和残差表示出来:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image106.png?sign=1739497881-nPxSFtsDqNibW3MapMZlbAZE4LlhnGbU-0-9db44da25d8cd074ee01468b24b707ab)
比较这两个方程可知,误差出现在包含总体参数和
的方程中,残差则出现在使用
和
的估计方程中。由于总体参数未知,误差是无法观测的,但残差却可以从数据中计算出来。
把残差写成误差的函数:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image107.png?sign=1739497881-1Ucs32AKUAaYC6XtKfs9RVdtddzx2pu7-0-4a2f02d0a74c4fa88b6a027474a3a222)
或者
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image108.png?sign=1739497881-kNUeqgqZvPePvmPN52A5LeiBBTIO4k75-0-722293ee5fa3c56346d6098a527bd14d)
尽管的期望值等于
,
的期望值也等于
,
却不等于ui。但二者之差的期望值为零。
(2)的无偏估计量
对自由度进行调整:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image110.png?sign=1739497881-h2Iom4R6PHaqWHX2nb1o9EOEqB0G8H3z-0-8d7aadcbb97173c2fec6bf5d001e3b25)
(3)定理2.3:的无偏估计
在假定SLR.1~SLR.5下,有
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image111.png?sign=1739497881-buQNqIABJw0Tfb7Vqlo6EjMgxIkD3gFg-0-64cfe3432b3f1af3249f76c87b4a3229)
证明:如果把方程对所有i进行平均,并利用OLS残差均值为零的结论,便得到
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image113.png?sign=1739497881-9L9JMcJK9XkjLgXUffKEAGckpw5vCoEI-0-d9e9fe53658c15253a709f943f1fd223)
从原方程中减去它,则得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image114.png?sign=1739497881-3QFy2wPNJPFKBmp03Mb0T1zLb1KowlaP-0-924f1a1cac0339954ee784bd924f7ce9)
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image115.png?sign=1739497881-l2OEK8KoJ88u7MzMLP2lO6ZlTtNl98qf-0-05f96d3c54b0faf9ce207c6c13631cf1)
对所有i求和,又得到:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image116.png?sign=1739497881-EgNuaqJoKfpx4ZjHunYY7oCQHvslh2MB-0-95cf6fe6ba52710dc09d66dab0e985af)
等式右边第一项的期望值是。第二项的期望值是
,第三项的期望是
,则有:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image119.png?sign=1739497881-37GwrMWqLlgTsTZAs7rpkgaiq70F2w8B-0-42b895d52d5acc5c9815e5057d5720a9)
因此
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image120.png?sign=1739497881-gQnttCmTm9g4aQlXSLuKq7G4XETlYWni-0-bcce51f44cfcbd93ed7e91d0804fd13c)
的自然估计量为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image122.png?sign=1739497881-qQbuArA8tDiH1DQByRgUCcp1fdm3e73h-0-8f6196944a0cec2b0572213bd53ebff6)
并被称为回归标准误差(SER)。尽管不是
的无偏估计量,但能够证明它是
的一致估计量。
的标准误差为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image124.png?sign=1739497881-8mjnG7kAVP0lA7BmoJRGt3gm39Pr79cr-0-380bf6ee60816cca0da3f6e3221b6edc)
六、过原点回归及对常数回归
规范地,选择一个斜率估计量(称之为)和如下形式的一条线
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image126.png?sign=1739497881-BFRG3l4PKssHxSYDR44kG6ta17qUIklI-0-9341ac77cec96aaacd4b8ec9b0a80f0c)
因为直线经过点,
,所以得到的方程又被称为过原点回归。
使用普通最小二乘法,此时最小化的残差平方和为
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image129.png?sign=1739497881-V6CckFnwEl0CO1gG8zH7tzhZSFcF65vg-0-803ec45f70195c794b736657f21dbfe1)
利用一元微积分可以证明,必须满足一阶条件
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image130.png?sign=1739497881-R6EXslBcIOo7obJgZU8etvDLky2iEZl2-0-98e4572d014e64609b9a4e2d9efd67ea)
从而解出为:
![](https://epubservercos.yuewen.com/A80292/15436656305560306/epubprivate/OEBPS/Images/image131.png?sign=1739497881-4gruMwddxm4FEwdQLmub2yv2IzUQ6A1G-0-e5f1e979328cdc9f834ca0b94ca91740)
当且仅当时,这个估计值与带截距项的OLS估计量才是相同的。
过原点回归的R2是通过得到的,即在计算SST时不消除yi的样本均值。分子部分作为残差平方和是有意义的,而分母部分在已知y的总体均值为零时成立。
如果通过常规方法,即来计算R2,则结果有可能为负值。
如果为负值,意味着用样本均值
来预测yi的拟合优度高于过原点回归。
由上述讨论引出的问题是对常数回归。将y只对一个常数回归即设定斜率为零并只估计截距项,由于使方差最小的常数必为样本均值,因此估计的截距项必为yi样本均值。式的符号可以看作过原点回归和对常数回归之间的比较。