计量经济学课后习题答案
第二章练习题及参考解答
2.1 为研究中国的货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相互依存关系,分析表中1990年—2007年中国货币供应量(M2)和国内生产总值(GDP)的有关数据:
表2.9 1990年—2007年中国货币供应量和国内生产总值(单位:亿元)
资料来源:中国统计年鉴2008,中国统计出版社
对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。
练习题2.1 参考解答:
计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:
计算方法: rXY
nXYXY
或 rX,Y计算结果:
(X)(Y)
M2
M2
1
GDP
0.[1**********]6
GDP
0.[1**********]6 1
经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.996426,线性相关程度相当高。
2.2 为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软饮料公司的有关数据
表2.10 美国软饮料公司广告费用与销售数量
资料来源:(美) Anderson D R等. 商务与经济统计.机械工业出版社.1998. 405
绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程度。能否在此基础上建立回归模型作回归分析?
练习题2.2参考解答
美国软饮料公司的广告费用X与销售数量Y的散点图为
说明美国软饮料公司的广告费用X与销售数量Y正线性相关。
若以销售数量Y为被解释变量,以广告费用X为解释变量,可建立线性回归模型
Yi12Xiui 利用EViews估计其参数结果为
经t检验表明, 广告费用X对美国软饮料公司的销售数量Y确有显著影响。回归结果表明,广告费用X每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。
2.3 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
表2.11 深圳市地方预算内财政收入与国内生产总值
资料来源: 深圳市统计年鉴2008. 中国统计出版社
(1)建立深圳地方预算内财政收入对本市生产总值GDP的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验。
(4)若是2008年深圳市的本市生产总值为8000亿元,试对 2008年深圳市的财政收入作出点预测和区间预测 (0.05)。
练习题2.3参考解答: 1、 建立深圳地方预算内财政收入对GDP的回归模型,建立EViews文件,利用地
方预算内财政收入(Y
)和GDP的数据表,作散点图
可看出地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型: Yt12GDPtut
利用EViews估计其参数结果为
ˆ20.46110.0850GDP 即 Ytt
(9.8674) (0.0033)
t=(2.0736) (26.1038) R2=0.9771 F=681.4064
经检验说明,深圳市的GDP对地方财政收入确有显著影响。R0.9771,说明GDP解释了地方财政收入变动的近98%,模型拟合程度较好。
模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。 当2008年GDP 为7500亿元时,地方财政收入的点预测值为:
2
ˆ20.46110.08508000700.4611(亿元) Y2008
区间预测:
为了作区间预测,取0.05,Yf平均值置信度95%的预测区间为:
ˆ
Yf
t2利用EViews由GDP数据的统计量得到 则有
6 2300.7 7 3 n=18 x2031.2 6
x
2
i2x(n1)2031.2662(181)70142706.5669
(Xf1)2(80002300.773)232481188.3976
ˆ700.4611,t(18-2)=2.120平均值置信度95%的预测区间为: 取0.05,Y0.0252008
Yf
^
t2
^
GDP20088000时 700.46112.12027.2602 700.461141.6191(亿元)
Yf个别值置信度95%的预测区间为:
Yf
^
t2^
即
700.46112.12027.2602 700.461171.2181(亿元)
2.4 为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:
表2.12 中国国民总收入与最终消费 (单位:亿元)
资料来源:中国统计年鉴2008. 中国统计出版社,2008.
(1) 以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。
ˆ和可决系数R。 (2) 计算回归估计的标准误差
(3) 对回归系数进行显著性水平为5%的显著性检验。
(4) 如果2008年全年国民总收入为300670亿元,比上年增长9.0%,预测可能达到的最终 消费水平,并对最终消费的均值给出置信度为95%的预测区间。
练习题2.4参考解答:
(1)以最终消费为被解释变量Y,以国民总收入为解释变量X,建立线性回归模型: Yi12Xiui 利用EViews估计参数并检验
2
回归分析结果为:
ˆ3044.3430.530112X Ytt
(895.4040) (0.00967) t= (3.3999) (54.8208)
R0.9908 n=30
2
ˆ(2)
回归估计的标准误差即估计的随机扰动项的标准误差ˆ3580.903, 可决系数为0.9908。 计参数和检验结果得
由EViews估
(3)由t分布表可查得t0.025(302)2.048,由于t254.8208t0.025(28)2.048 ,或由P值=0.000可以看出, 对回归系数进行显著性水平为5%的显著性检验表明, 国民总收入对
最终消费有显著影响。
(4)如果2008年全年国民总收入为300670亿元,预测可能达到的最终消费水平为:
ˆ3044.3430.530112300670162433.1180(亿元) Y2008
对最终消费的均值置信度为95%的预测区间为:
Yf
^
t2
^
由Eviews计算国民总收入X变量样本数据的统计量得:
7 n=30 x68765.51 63270. 0
则有
x
2
i2
x2(n1)68765.51(301)2
2
1371321 65601.2429
(Xf)(30067063270.07)[1**********].0049
ˆ162433.1180,t(30-2)=2.048,
已知 ˆ3580.903,平均值置信取0.05,Y0.0252008
度95%的预测区间为:
Yf
^
t2
^
=162433.11802.0483580.903 =162433.11884888.4110(亿元)
2.5 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下1。 1
资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社
表2.13 美国各航空公司业绩的统计数据
资料来源:(美) Anderson D R等.商务与经济统计. 机械工业出版社.1998,405.
(1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。 (4)对估计的回归方程斜率的意义作出解释。
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
练习题2.5参考解答:
美国各航空公司航班正点到达比率X和每10万名乘客投诉次数Y的散点图为
由图形看出航班正点到达比率和每10万名乘客投诉次数呈现负相关关系, 利用
建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程:
Yi12Xiui 利用EViews估计其参数结果为
ˆ6.0178320.070414即 YXi i
(1.017832)(-0.014176)
t=(5.718961) (-4.967254) R2=0.778996 F=24.67361
从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。
这说明当航班正点到达比率每提1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。
如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为
ˆ6.0178320.070414 Y(次) 800.384712i
2.6 表2.34中是16支公益股票某年的每股帐面价值Y和当年红利X的数据:
表2.14 某年16支公益股票每股帐面价值和当年红利
(1)分析每股帐面价值和当年红利的相关性? (2) 建立每股帐面价值和当年红利的回归方程; (3)解释回归系数的经济意义。
练习题2.6参考解答:
1.分析每股帐面价值和当年红利的相关性 作散布图:
从图形看似乎具有一定正相关性,计算相关系数:
每股帐面价值和当年红利的相关系数为0.708647
2.建立每股帐面价值X和当年红利Y的回归方程:
Yi12Xiui
回归结果:
参数2的t检验:t值为3.7580,查表t0.025(162)2.145
平均说来公司的股票每股红利增加1元,当年帐面价值将增加6.8942元
2.7 设销售收入X为解释变量,销售成本Y为被解释变量。现已根据某百货公司某年12个月的有关资料计算出以下数据:(单位:万元)
(X
t
2
8)425053.73 647.8t
2
(Y)(X
t
262855.25 549.8
)(Yt)334229.09
(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。 (2) 计算可决系数和回归估计的标准误差。 (3) 对2进行显著水平为5%的显著性检验。
(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出
置信度为95%的预测区间。
练习题2.7参考解答:
(1)建立回归模型: Yi12Xiui
ˆ用OLS法估计参数: 2
(X)(Y)xy
(X)x
i
i
i
2
i
2
i
i
334229.09
0.7863
425053.73
ˆˆ549.80.7863647.8866.2872 12ˆ66.28720.7863X 估计结果为: Yii
说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。 (2)计算可决系数和回归估计的标准误差 可决系数为:
R
2
ˆy
y
2
2i2i
ˆx)(
y
2i2i
2
ˆ2x2i
2
y
2
i
0.7863425053.73262796.99
0.999778
262855.25262855.25
可得
由 r
2
e
1
y
2i2i
e
2i
(1R2)yi2
e
2i
(1R2)yi2(10.999778)262855.2558.3539
ˆ回归估计的标准误差
:
2.4157
(3) 对2进行显著水平为5%的显著性检验
t
*
ˆ22ˆ)SE(2
^
ˆˆ2ˆ)SE(2
^
~t(n
2)
ˆ)SE(2
^
2.4157
0.0037 651.9614 t
*
ˆ2ˆ)SE(2
^
0.7863
212.5135
0.0037
*
查表得 0.05时,t0.025(122)2.228
表明2显著不为0,销售收入对销售成本有显著影响.
(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置
信度为95%的预测区间。
ˆ66.28720.7863X66.28720.7863800695.3272万元 Yii
ˆˆ预测区间为
: YFYFt2
Y695.32722.2282.4157 F695.32721.9978
2.8 表2.15中是1992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据: 表2.15 1992年亚洲各国人均寿命等数据
资料来源:联合国发展规划署. 人的发展报告. 1993
(1)分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。
(2)对所建立的多个回归模型进行检验。 (3)分析对比各个简单线性回归模型。
练习题2.8参考解答:
(1) 分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁
儿童疫苗接种率的数量关系: 1) 人均寿命与人均GDP关系 Yi12X1iui 估计检验结果
:
2) 人均寿命与成人识字率关系
3) 人均寿命与一岁儿童疫苗接种率关系
(2)对所建立的多个回归模型进行检验
由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t检验值均明确大于其临界值,而且从对应的P值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响.
(3)分析对比各个简单线性回归模型 人均寿命与人均GDP回归的可决系数为0.5261 人均寿命与成人识字率回归的可决系数为0.7168 人均寿命与一岁儿童疫苗接种率的可决系数为0.5379 相对说来,人均寿命由成人识字率作出解释的比重更大一些
2.9 按照“弗里德曼的持久收入假说”: 持久消费Y正比于持久收入X,依此假说建立的计量模型没有截距项,设定的模型应该为:Yi2Xiui,这是一个过原点的回归。
ˆ的计算公式是什么?对该模在古典假定满足时,证明过原点的回归中2的OLS估计量2
型是否仍有
e0和eX
i
i
i
0?对比有截距项模型和无截距项模型参数的OLS估计
有什么不同?
练习题2.9参考解答:
没有截距项的过原点回归模型为: Yi2Xiu 因为
2ˆX)2 e(Yii2i
ei2
ˆX)(X)2eX 2(Yi求偏导 ii2ii
2
ei2
ˆX)(X)0 令 2(Yi2ii
2
ˆ得 2
XYX
ii2i
ˆ 而有截距项的回归为2
xy
x
i2i
i
对于过原点的回归,由OLS原则:
e0已不再成立, 但是eX
i
i
i
0是成立的。
ˆ)还可以证明对于过原点的回归 Var(2
ˆ)而有截距项的回归为 Var(2
2
X
2
2
i
2i
ˆ ,
2
e
e
2i
n1
2i
x
,
ˆ
2
n2
2.10 练习题2.3中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或同时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有什么区别? 你能从中总结出什么规律性吗?
练习题2.10参考解答:
如果将“地方财政收入Y”和“本市生产总值GDP”数据的计量单位分别或同时由”亿元”改为”万元”,数据变为:
深圳市地方预算内财政收入与国内生产总值
A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为:
ˆ20.461060.084965GDP Y1t1t
(9.867440) (0.003255)
t=(2.073593) (26.10376) R2=0.977058
B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元” 时:
ˆ20.461060.00000850GDP Y1t2t
(9.867440)(0.000000325)
t=(2.073593) (26.10376) R2=0.977058
C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元” 时:
ˆ204610.6849.6520GDP Y2t1t
(98674.40) (32.54902)
t=(2.073593) (26.10376) R2=0.977058
D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元” 时:
ˆ204610.60.084965GDP Y2t2t
(98674.40) (0.0032549)
t=(2.073593) (26.10376) R2=0.977058
可以总结出,变量度量单位对回归影响的一般规律为:
1)当被解释变量测量单位改变(扩大或缩小常数c倍),而解释变量测量单位不变时:OLS截距和斜率的估计值及标准误差都缩小或扩大为原来的c倍. (如C的情况)
2)当解释变量测量单位改变(扩大或缩小常数c倍),而被解释变量测量单位不变时:OLS斜率的估计值及标准误差扩大或缩小为原来的c倍,但不影响截距的估计. (如B的情况)3)当被解释变量和解释变量测量单位同时改变相同倍数时,OLS的截距估计值及标准误差扩大为原来的c倍,但不影响斜率的估计. (如D的情况)
4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有维度,所以不随计量单位而变化。
第三章练习题参考解答
练习题
3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:
ˆ151.02630.1179X1.5452X Yi1i2i
t=(-3.066806) (6.652983) (3.378064)
R2=0.934331 0.92964 F=191.1894 n=31 (1) 从经济意义上考察估计模型的合理性。
(2) 在5%显著性水平上,分别检验参数1,2的显著性。 (3) 在5%显著性水平上,检验模型的整体显著性。
3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:
2
3 367.69, 1402.76, 28.0, n15, 0
(Y)
2
i
9 66042.,26
(X
i
1i
1)284855.096,
1i
2
(X)2i2280.000, (Y)(X(X
1i
1)74778.346,
4796. 000
(Y)(X
i
2i
2)4250.900, 1)(Xi22)
3.3 经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据:
(2)利用样本数据估计模型的参数;
(3)检验户主受教育年数对家庭书刊消费是否有显著影响;
(4)分析所估计模型的经济意义和作用
3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve)”模型:
Yt12X2t3X3tut
其中:Yt=实际通货膨胀率(%);X2t=失业率(%);X3t=预期的通货膨胀率(%)
下表为某国的有关数据,
表1. 1970-1982年某国实际通货膨胀率Y(%),
失业率X
(1)对此模型作估计,并作出经济学和计量经济学的说明。 (2)根据此模型所估计结果,作计量经济学的检验。 (3)计算修正的可决系数(写出详细计算过程)。
3.5某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指
利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。
3.6下表给出的是1960—1982年间7个OECD国家的能源需求指数(Y)、实际GDP指
(1)建立能源需求与收入和价格之间的对数需求函数
lnYt01lnX1t2lnX2tut,解释各回归系数的意义,用P值检验所估计回
归系数是否显著。
(2) 再建立能源需求与收入和价格之间的线性回归模型
Yt01X1t2X2tu,解释各回归系数的意义,用P值检验所估计回归系数是
否显著。
(3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?
练习题参考解答
练习题3.1参考解答 有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数
增加1万人次,旅游外汇收入增加1.5452百万美元。 取0.05,查表得t0.025(313)2.048
因为3个参数t统计量的绝对值均大于t0.025(313)2.048,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。 取0.05,查表得F0.05(2,28)3.34,由于F199.1894F0.05(2,28)3.34,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。
练习题3.3参考解答
(1)建立家庭书刊消费的计量经济模型: Yi12Xi3Tiui
其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数 (2)估计模型参数,结果为
ˆ50.01620.08645即 YXi52.3703Ti i
(49.46026)(0.02936) (5.20217)
t= (-1.011244) (2.944186) (10.06702) R2=0.951235 0.944732 F=146.2974
(3) 检验户主受教育年数对家庭书刊消费是否有显著影响:
由估计检验结果, 户主受教育年数参数对应的t 统计量为10.06702, 明显大于t的临界值
2
t0.025(183)2.131,同时户主受教育年数参数所对应的P值为0.0000,明显小于
0.05,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。
(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,家
庭书刊年消费支出将增加52.37元。
练习题3.5参考解答
(1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型:
Yt12Xt3Ttut (2)估计参数结果
由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值t0.025(113)2.306;而且对应的P值为0.0000,也明显小于0.05。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。
但是,该地区耐用消费品价格指数的参数的t检验值为-0.921316,其绝对值小于临界值
t0.025(113)2.306;而且对应的P值为0.3838,也明显大于0.05。这说明该地区耐
用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响
第四章
4.1 假设在模型Yi12X2i3X3iui中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归:
Yi12X2iu1iYi13X3iu2i
ˆ且ˆ?为什么? ˆ2ˆ3(1)是否存在23
ˆ会等于ˆ1或ˆ1或两者的某个线性组合吗?(2) 1
ˆvarˆvarˆ2且varˆ3? (3)是否有var23
练习题4.1参考解答:
ˆ且ˆ。 ˆ2ˆ3(1) 存在23
ˆ因为
2
yxxyxx
xxxxi2i
23i
i3i
22i
23i
2
2i
3i
23i
2i
x3i
当X2与X3之间的相关系数为零时,离差形式的
x
2i3i
x0
ˆ有2
yxxyx
xxx
i2i
i
22i
23i
2i
22i
ˆ2
ˆ ˆ3同理有:3
ˆ会等于ˆ1或ˆ1的某个线性组合 (2) 1
ˆˆˆ,且ˆ1ˆ22,ˆ1ˆ33 因为 12233ˆ且ˆ,则 ˆ2ˆ3由于23
ˆˆ1ˆ22 22ˆˆ1ˆ33 33
ˆ2ˆ3
ˆ1
2
ˆ1 3
ˆ1ˆ1ˆˆˆˆ1ˆ1 则 3122332
2
3
ˆvarˆvarˆ2且varˆ3。 (3) 存在var23ˆ因为var2
x1r2
2i
223
2
ˆ当r230时,var2
x1rx
2
2i
223
2
2
22i
ˆ2 var
ˆvarˆ3 同理,有var3
4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?
练习题4.2参考解答:
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。
表4.11 中国商品进口额、国内生产总值、居民消费价格指数
资料来源:《中国统计年鉴》,中国统计出版社2000年、
2008年。
请考虑下列模型:lnYt1+2lnGDPt3lnCPItui 1)利用表中数据估计此模型的参数。 2)你认为数据中有多重共线性吗? 3)进行以下回归:
lnYtA1+A2lnGDPtv1ilnYtB1+B2lnCPItv2ilnGDPtC1C2lnCPItv3i
根据这些回归你能对数据中多重共线性的性质说些什么?
ˆ和ˆ在5%水平上个别地显著,并且总的F检验也是显4)假设数据有多重共线性,但23
著的。对这样的情形,我们是否应考虑共线性的问题?
练习题4.3参考解答: (1) 参数估计结果如下
ln(进口)3.0601.657ln(GDP)1.057ln(CPI)
(0.337) (0.092) (0.215)R20.992 20.991 F1275.093
(括号内为标准误)
(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且CPI与进口之间的简单相关系数呈现正向变动。可能数据中有多重共线性。 计算相关系数:
(3)最大的CI=108.812,表明GDP与CPI之间存在较高的线性相关。
(4)分别拟合的回归模型如下:
lnY4.09071.2186ln(GDP) t= (-10.6458) (34.6222)
R20.9828 20.9820 F
1198.698
lnY5.44242.6637ln(CPI) t= (-4.3412) (11.6809)
R20.8666 20.8603 F136.4437
ln(GDP)1.43802.2460ln(CPI) t=(-1.9582) (16.8140)
R20.9309 20.9276 F282.7107
单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。
4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?
练习题4.4参考解答:
本题很灵活,主要应注意以下问题:
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
ˆ8.1331.059X10.452X20.121X3Y (8.92) (0.17) (0.66) (1.09) R20.95 F107.37
括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的
问题。
练习题4.5参考解答:
从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:
2
t0
8.133
0.91,8.92
t1
1.059
6.10,0.17
t2
0.452
0.69,0.66
t3
0.121
0.111.09
除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。
表4.12 1985~2007年统计数据
资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。
要求:
1)建立对数多元线性回归模型,分析回归结果。
2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么? 3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。
练习题4.6参考解答:
(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下: 生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7. 作全部变量对数线性多元回归,结果为:
从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。
(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。
解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下
:
可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下:
A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如
lny9.9320.421lnx6 (0.116) (0.026)
R20.926 20.922 F261.551
B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作lnY对
lnX1,lnX2,lnX3,lnX4,lnX5,lnX6,lnX7的一元回归,结果如下:
一元回归结果:
其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:
lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数
的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。
如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。作逐步回归:
可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:
0.
可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。
4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示
(资料来源:《中国统计年鉴2008》,中国统计出版社2008年版)试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?
练习题4.7参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减低共线性。
第五章
5.1 设消费函数为
Yi12X2i3X3iui
式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差项,并且E(ui)0,Var(ui)X2i(其中为常数)。试解答以下问题:
2
2
2
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
练习题5.1参考解答:
2
(1)因为f(Xi)X2i,所以取W2i
1
,用W2i乘给定模型两端,得 X2i
YiXu11233ii
X2iX2iX2i X2i
上述模型的随机误差项的方差为一固定常数,即
Var(
ui1
)2Var(ui)2X2iX2i
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
ˆ*ˆ*ˆ*12233
ˆ2
W
2i
**2****
yi*x2iW2ix3iW2iyix3iW2ix2ix3i**W2ix2*2iW2ix3*2iW2ix2ix3i
2
ˆ3
其中
W
2i
**2****yi*x3iW2ix2iW2iyix2iW2ix2ix3i**W2ix2*2iW2ix3*2iW2ix2ix3i
2
*2
WX
W
2i2i
2i
,*3
WX
W
2i2i
3i
,*
WY
W
2ii2i
**xX2i2 2i
**
x3Xi3i3
y*Yi*
5.2 下表是消费Y与收入X的数据,试根据所给数据资料完成以下问题: (1)估计回归模型Y12Xu中的未知参数1和2,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性; (3)选用合适的方法修正异方差。
表5.8 某地区消费Y与收入X的数据(单位:亿元)
练习题5.2参考解答:
(1)该模型样本回归估计式的书写形式为
ˆ9.347522+0.637069XYii
t= (2.569104) (32.00881)
R22=0.945500 F=1024.564 DW=1.790431
(2)首先,用Goldfeld-Quandt法进行检验。
将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即
n1n222。
分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
ee
求F统计量为
2122
603.01482495.840
2221
eF
e
2495.84
4.1390
603.0148
给定0.05,查F分布表,得临界值为F0.05(20,20)2.12。
c.比较临界值与F统计量值,有F=4.1390>F0.05(20,20)2.12,说明该模型的随机误
差项存在异方差。
其次,用White法进行检验。具体结果见下表
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 08/05/05 Time: 12:37 Sample: 1 60
X 0.165977 1.619856 0.102464 Adjusted R-squared 0.152332 S.D. dependent var S.E. of regression 102.3231 Akaike info criterion Sum squared resid 596790.5 Schwarz criterion Log likelihood -361.2856 F-statistic 0.9187 111.1375 12.14285 12.24757 6.301373 给定0.05,在自由度为2下查卡方分布表,得25.9915。比较临界值与卡方统计量值,即nR210.864025.9915,同样说明模型中的随机误差项存在异方差。 (2)用权数W1
Dependent Variable: Y Method: Least Squares
Date: 08/05/05 Time: 13:17 Sample: 1 60
Included observations: 60 Adjusted R-squared 0.197845 S.D. dependent var S.E. of regression 7.778892 Akaike info criterion Sum squared resid 3509.647 Schwarz criterion Log likelihood -207.2041 F-statistic Adjusted R-squared 0.945410 S.D. dependent var S.E. of regression 9.039689 Sum squared resid 1
,作加权最小二乘估计,得如下结果 X
8.685376 6.973470 7.043282 1159.176 38.68984 4739.526
用White法进行检验得如下结果:
White Heteroskedasticity Test: F-statistic 3.138491 Probability 0.050925 给定0.05,在自由度为2下查卡方分布表,得25.9915。比较临界值与卡方统计量值,即nR25.951910
ˆ10.37050.6309XY
t(3.943587) (34.04667)
R22=0.197845 DW=0.958467 F=1159.176
5.3 下表是2007年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据
表5.9 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元)
(1)试根据上述数据建立2007年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。
(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。 (3)如果存在异方差,用适当方法加以修正。
练习题5.3参考解答:
解: (1)建立样本回归函数。
ˆ179.1916+0.7195X Y
(0.808709)(15.74411) R20.895260, F=247.8769
(2)利用White方法检验异方差,则White检验结果见下表:
Heteroskedasticity Test: White F-statistic
7.194463 Prob. F(2,28)
0.0030 0.0052 0.0000
Obs*R-squared Scaled explained SS
10.52295 Prob. Chi-Square(2) 30.08105 Prob. Chi-Square(2)
由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。
(3)用加权最小二乘法修正异方差,
分别选择权数w1过试算,认为用权数w3的效果最好。结果如下:
11,w2w32,经XX
书写结果为
ˆ787.28470.5615XY
(4.5325)(10.0747) R20.9461,F101.4992
5.4 下表是某一地区31年中个人储蓄和个人收入数据资料 表5.10 个人储蓄和个人收入数据(单位:元)
(1)建立一元回归函数,判断有无异方差存在,并说明存在异方差的原因。 (2)用适当方法修正异方差。 练习题5.4参考解答:
(1)建立样本回归函数。
ˆ-648.1236+0.0847X Y
(-5.485018)(17.34164) R0.912050, F=300.7324
从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模型是否存在异方差。
首先,用图形法。从残差平方对解释变量散点图可以看出(见下图),模型很可能存在异方差。
2
其次,用运用Goldfeld-Quanadt检验异方差。 第一,对变量X取值以升序排序。
第二,构造子样本。由于本例的样本容量为31,删除1/4观测值,约7个,余下部分分得两个样本区间:1—12和20—31,它们的样本个数均是12个。
第三,在样本区为1—12,所计算得到的残茶平方和为20—31,所计算得到的残茶平方和为
e
22i21i
21i
162899.2;在样本区为
e
22i
981744.6。
981744.6
6.0267。
162899.2
e第四,根据Goldfeld-Quanadt检验,F统计量为Fe
第五,判断。在显著性水平为0.05条件下,分子分母的自由度均为10,查F分布表得临界值为F0.05(10,10)2.98,因为F6.0267F0.05(10,10)2.98,所以拒绝原假设,表明模型存在异方差。
最后,用ARCH方法检验异方差,则ARCH检验结果见下表:
Heteroskedasticity Test: ARCH
F-statistic Obs*R-squared
6.172299 Prob. F(1,28) 5.418686 Prob. Chi-Square(1)
0.0192 0.0199
由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。
(2
)分别用权数w1
11,w2w32,发现用权数w2求加权最小二乘估计XX
效果最好,即
ˆ706.69860.0873XY
(8.0399)(20.1399) R20.8735,F405.6164
5.5 下表的数据是2007年我国建筑业总产值(X)和建筑业企业利润总额(Y)。试根据资料建立回归模型,并对模型判断是否存在异方差,如果有异方差,选用适当方法修正。
表5.11 各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:万元)
数据来源:国家统计局网站
练习题5.5参考解答:
(1)求Y对X的回归,得如下估计结果
ˆ28992.820.0323XY
(0.8009)(20.8233) R20.9373,F433.6077
用怀特检验的修正方法,即建立如下回归模型
ˆYˆ2ei212Yi3ivi
通过计算得到如下结果:
注意,表中E2为残差平方et2。 即
ˆ0.0138Yˆ2 ˆi26.34(E09)65144.33Yeii
对该模型系数作判断,运用F或LM检验,可发现存在异方差。
ˆ后,ˆ和具体EViews操作如下:在得到Y的估计Y进一步得到残差平方ei2,然后建立ei2对Yˆ2的线性回归模型。再通过上述回归对Yˆ和Yˆ2前的系数是否为零进行判断,从而检验原模Y
型中是否存在异方差。在上表界面,按路径:VIEW/COEFFIEICENT TESTS/REDUANDANT VARIABLES,得到如下窗口,并输入变量名“YF YF^2”,即
然后“OK”即得到检验结果为
从表中F统计量值和LM统计量值看,拒绝原假设,表明原模型存在异方差。
(2)通过对权数的试算,
最后选择权数w原后的结果)
用加权最小二乘法得到如下估计(还ˆ9038.8750.0311XY
(0.5912)
(17.6011)
R20.9144,F309.7983,DW2.0975
对该模型进行检验,发现已无异方差。
5.6 下表为四川省农村人均纯收入、人均生活费支出、商品零售价格指数1978年至2008年时间序列数据。试根据该资料建立回归模型,并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。
表5.12 1978——2008四川省农村人均纯收入、人均生活费支出、商品零售价格指数
资料来源:中经网统计数据库
练习题5.6参考解答:
(1)设Y表示人均生活费支出,X表示农村人均纯收入,则建立样本回归函数 Y71.61407+0.761445X (3.944029)(69.98227) R0.994113, F=4897.518
从估计结果看,各项检验指标均显著,但从经济意义看,改革开放以来,四川省农村经济发生了巨大变化,农村家庭纯收入的差距也有所拉大,使得农村居民的消费水平的差距也有所加大,在这种情况下,尽管是时间序列数据,也有可能存在异方差问题。而且从残差平方对解释变量的散点图可以看出,模型很可能存在异方差(见下图)。
2^
进一步作利用ARCH方法检验异方差,得ARCH检验结果(见下表)
(2
)运用加权最小二乘法,选权数为w
^
Y35.69419+0.789972X
(3.435081)(59.91014)
R20.991985, F=3589.224
经检验,时模型的异方差问题有了明显的改进。
5.7 在5.6题的数据表里,如果考虑物价因素,则对异方差性的修正应该怎样进行?
练习题5.7参考解答:
剔除物价上涨因素后的回归结果如下
ˆ0.4310010.727487XY11t(6.888037) (55.52690)
R220.990361 F=3083.237
其中,Y1代表实际消费支出,X1代表实际可支配收入。
用ARCH方法来检验模型是否存在异方差:
在显著性水平为0.01的条件下,接收原假设,模型不存在异方差。表明剔除物价上涨因素之后,异方差的问题有所改善。
第六章
6.1 下表给出了美国1960-1995年36年间个人实际可支配收入X和个人实际消费支出Y的数据。
表6.6 美国个人实际可支配收入和个人实际消费支出 (单位:百亿美元)
注:资料来源于Economic Report of the President,数据为1992年价格。
要求:(1)用普通最小二乘法估计收入—消费模型;
练习题6.1参考解答:
(1)收入—消费模型为
Yt12X2ut
(2)检验收入—消费模型的自相关状况(5%显著水平); (3)用适当的方法消除模型中存在的问题。
ˆ9.42870.9359 YXt t
Se = (2.5043) (0.0075) t = (-3.7650) (125.3411)
R2 = 0.9978,F = 15710.39,d f = 34,DW = 0.5234
(2)对样本量为36、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.411,
dU= 1.525,模型中DW
(3)采用广义差分法
et= 0.72855 et-1
ˆ*3.78310.9484X* Ytt
Se(1.8710) (0.0189)
t = (-2.0220) (50.1682)
R2 = 0.9871 F = 2516.848 d f = 33 DW = 2.0972
查5%显著水平的DW统计表可知dL = 1.402,dU = 1.519,模型中DW = 2.0972> dU,说明广义差分模型中已无自相关。同时,可决系数R、t、F统计量均达到理想水平。
2
ˆ1
3.7831
13.9366
10.72855
最终的消费模型为 Y t = 13.9366+0.9484 X t
6.2 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型
模型1 Yt01tut 模型2 Yt01t2t2ut
其中,Y为劳动投入,t为时间。据1949-1964年数据,对初级金属工业得到如下结果:
ˆ0.45290.0041模型1 Yt t
t = (-3.9608)
R2 = 0.5284 DW = 0.8252
ˆ0.47860.0127模型2 Yt0.0005t2 t
t = (-3.2724)(2.7777) R2 = 0.6629
DW = 1.82
其中,括号内的数字为t统计量。
问:(1)模型1和模型2中是否有自相关;
(2)如何判定自相关的存在?
(3)怎样区分虚假自相关和真正的自相关。
练习题6.2参考解答:
(1)模型1中有自相关,模型2中无自相关。 (2)通过DW检验进行判断。
模型1:dL=1.077, dU=1.361, DW
dU, 因此无自相关。
(3)如果通过改变模型的设定可以消除自相关现象,则为虚假自相关,否则为真正自相关。
6.3下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据。
要求:(1)建立居民收入—消费函数;
练习题6.3参考解答:
(1)收入—消费模型为
(2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。
ˆ79.9300.690XYtt
Se(12.399)(0.013)t(6.446)(53.621)
(6.38)
R20.994DW0.575
(2)DW=0.575,取5%,查DW上下界dL1.18,dU1.40,DW1.18,说明误差项存在正自相关。
(3)采用广义差分法
ˆ,得 使用普通最小二乘法估计的估计值
et0.657et1Se(0.178)t(3.701)
ˆ*36.0100.669X*Ytt
Se(8.105)(0.021)t(4.443)(32.416)R20.985DW1.830
DW=1.830,已知dU1.40,dUDW2。因此,在广义差分模型中已无自相关。据
ˆ(1ˆ)36.010,可得: 1
ˆ1
因此,原回归模型应为
36.010
104.985
10.657
Yt104.9850.669Xt
其经济意义为:北京市人均实际收入增加1元时,平均说来人均实际生活消费支出将增加0.669元。
6.4 下表给出了日本工薪家庭实际消费支出与可支配收入数据 表6.8 日本工薪家庭实际消费支出与实际可支配收入
单位:1000日元
计量经济学课后习题答案
第二章练习题及参考解答
2.1 为研究中国的货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相互依存关系,分析表中1990年—2007年中国货币供应量(M2)和国内生产总值(GDP)的有关数据:
表2.9 1990年—2007年中国货币供应量和国内生产总值(单位:亿元)
资料来源:中国统计年鉴2008,中国统计出版社
对货币供应量与国内生产总值作相关分析,并说明相关分析结果的经济意义。
练习题2.1 参考解答:
计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:
计算方法: rXY
nXYXY
或 rX,Y计算结果:
(X)(Y)
M2
M2
1
GDP
0.[1**********]6
GDP
0.[1**********]6 1
经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.996426,线性相关程度相当高。
2.2 为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软饮料公司的有关数据
表2.10 美国软饮料公司广告费用与销售数量
资料来源:(美) Anderson D R等. 商务与经济统计.机械工业出版社.1998. 405
绘制美国软饮料公司广告费用与销售数量的相关图, 并计算相关系数,分析其相关程度。能否在此基础上建立回归模型作回归分析?
练习题2.2参考解答
美国软饮料公司的广告费用X与销售数量Y的散点图为
说明美国软饮料公司的广告费用X与销售数量Y正线性相关。
若以销售数量Y为被解释变量,以广告费用X为解释变量,可建立线性回归模型
Yi12Xiui 利用EViews估计其参数结果为
经t检验表明, 广告费用X对美国软饮料公司的销售数量Y确有显著影响。回归结果表明,广告费用X每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。
2.3 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据:
表2.11 深圳市地方预算内财政收入与国内生产总值
资料来源: 深圳市统计年鉴2008. 中国统计出版社
(1)建立深圳地方预算内财政收入对本市生产总值GDP的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验。
(4)若是2008年深圳市的本市生产总值为8000亿元,试对 2008年深圳市的财政收入作出点预测和区间预测 (0.05)。
练习题2.3参考解答: 1、 建立深圳地方预算内财政收入对GDP的回归模型,建立EViews文件,利用地
方预算内财政收入(Y
)和GDP的数据表,作散点图
可看出地方预算内财政收入(Y)和GDP的关系近似直线关系,可建立线性回归模型: Yt12GDPtut
利用EViews估计其参数结果为
ˆ20.46110.0850GDP 即 Ytt
(9.8674) (0.0033)
t=(2.0736) (26.1038) R2=0.9771 F=681.4064
经检验说明,深圳市的GDP对地方财政收入确有显著影响。R0.9771,说明GDP解释了地方财政收入变动的近98%,模型拟合程度较好。
模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。 当2008年GDP 为7500亿元时,地方财政收入的点预测值为:
2
ˆ20.46110.08508000700.4611(亿元) Y2008
区间预测:
为了作区间预测,取0.05,Yf平均值置信度95%的预测区间为:
ˆ
Yf
t2利用EViews由GDP数据的统计量得到 则有
6 2300.7 7 3 n=18 x2031.2 6
x
2
i2x(n1)2031.2662(181)70142706.5669
(Xf1)2(80002300.773)232481188.3976
ˆ700.4611,t(18-2)=2.120平均值置信度95%的预测区间为: 取0.05,Y0.0252008
Yf
^
t2
^
GDP20088000时 700.46112.12027.2602 700.461141.6191(亿元)
Yf个别值置信度95%的预测区间为:
Yf
^
t2^
即
700.46112.12027.2602 700.461171.2181(亿元)
2.4 为研究中国改革开放以来国民总收入与最终消费的关系,搜集到以下数据:
表2.12 中国国民总收入与最终消费 (单位:亿元)
资料来源:中国统计年鉴2008. 中国统计出版社,2008.
(1) 以分析国民总收入对消费的推动作用为目的,建立线性回归方程,并估计其参数。
ˆ和可决系数R。 (2) 计算回归估计的标准误差
(3) 对回归系数进行显著性水平为5%的显著性检验。
(4) 如果2008年全年国民总收入为300670亿元,比上年增长9.0%,预测可能达到的最终 消费水平,并对最终消费的均值给出置信度为95%的预测区间。
练习题2.4参考解答:
(1)以最终消费为被解释变量Y,以国民总收入为解释变量X,建立线性回归模型: Yi12Xiui 利用EViews估计参数并检验
2
回归分析结果为:
ˆ3044.3430.530112X Ytt
(895.4040) (0.00967) t= (3.3999) (54.8208)
R0.9908 n=30
2
ˆ(2)
回归估计的标准误差即估计的随机扰动项的标准误差ˆ3580.903, 可决系数为0.9908。 计参数和检验结果得
由EViews估
(3)由t分布表可查得t0.025(302)2.048,由于t254.8208t0.025(28)2.048 ,或由P值=0.000可以看出, 对回归系数进行显著性水平为5%的显著性检验表明, 国民总收入对
最终消费有显著影响。
(4)如果2008年全年国民总收入为300670亿元,预测可能达到的最终消费水平为:
ˆ3044.3430.530112300670162433.1180(亿元) Y2008
对最终消费的均值置信度为95%的预测区间为:
Yf
^
t2
^
由Eviews计算国民总收入X变量样本数据的统计量得:
7 n=30 x68765.51 63270. 0
则有
x
2
i2
x2(n1)68765.51(301)2
2
1371321 65601.2429
(Xf)(30067063270.07)[1**********].0049
ˆ162433.1180,t(30-2)=2.048,
已知 ˆ3580.903,平均值置信取0.05,Y0.0252008
度95%的预测区间为:
Yf
^
t2
^
=162433.11802.0483580.903 =162433.11884888.4110(亿元)
2.5 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下1。 1
资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社
表2.13 美国各航空公司业绩的统计数据
资料来源:(美) Anderson D R等.商务与经济统计. 机械工业出版社.1998,405.
(1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)估计描述投诉率如何依赖航班按时到达正点率的回归方程。 (4)对估计的回归方程斜率的意义作出解释。
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
练习题2.5参考解答:
美国各航空公司航班正点到达比率X和每10万名乘客投诉次数Y的散点图为
由图形看出航班正点到达比率和每10万名乘客投诉次数呈现负相关关系, 利用
建立描述投诉率(Y)依赖航班按时到达正点率(X)的回归方程:
Yi12Xiui 利用EViews估计其参数结果为
ˆ6.0178320.070414即 YXi i
(1.017832)(-0.014176)
t=(5.718961) (-4.967254) R2=0.778996 F=24.67361
从检验结果可以看出, 航班正点到达比率对乘客投诉次数确有显著影响。
这说明当航班正点到达比率每提1个百分点, 平均说来每10万名乘客投诉次数将下降0.07次。
如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数为
ˆ6.0178320.070414 Y(次) 800.384712i
2.6 表2.34中是16支公益股票某年的每股帐面价值Y和当年红利X的数据:
表2.14 某年16支公益股票每股帐面价值和当年红利
(1)分析每股帐面价值和当年红利的相关性? (2) 建立每股帐面价值和当年红利的回归方程; (3)解释回归系数的经济意义。
练习题2.6参考解答:
1.分析每股帐面价值和当年红利的相关性 作散布图:
从图形看似乎具有一定正相关性,计算相关系数:
每股帐面价值和当年红利的相关系数为0.708647
2.建立每股帐面价值X和当年红利Y的回归方程:
Yi12Xiui
回归结果:
参数2的t检验:t值为3.7580,查表t0.025(162)2.145
平均说来公司的股票每股红利增加1元,当年帐面价值将增加6.8942元
2.7 设销售收入X为解释变量,销售成本Y为被解释变量。现已根据某百货公司某年12个月的有关资料计算出以下数据:(单位:万元)
(X
t
2
8)425053.73 647.8t
2
(Y)(X
t
262855.25 549.8
)(Yt)334229.09
(1) 拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。 (2) 计算可决系数和回归估计的标准误差。 (3) 对2进行显著水平为5%的显著性检验。
(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出
置信度为95%的预测区间。
练习题2.7参考解答:
(1)建立回归模型: Yi12Xiui
ˆ用OLS法估计参数: 2
(X)(Y)xy
(X)x
i
i
i
2
i
2
i
i
334229.09
0.7863
425053.73
ˆˆ549.80.7863647.8866.2872 12ˆ66.28720.7863X 估计结果为: Yii
说明该百货公司销售收入每增加1元,平均说来销售成本将增加0.7863元。 (2)计算可决系数和回归估计的标准误差 可决系数为:
R
2
ˆy
y
2
2i2i
ˆx)(
y
2i2i
2
ˆ2x2i
2
y
2
i
0.7863425053.73262796.99
0.999778
262855.25262855.25
可得
由 r
2
e
1
y
2i2i
e
2i
(1R2)yi2
e
2i
(1R2)yi2(10.999778)262855.2558.3539
ˆ回归估计的标准误差
:
2.4157
(3) 对2进行显著水平为5%的显著性检验
t
*
ˆ22ˆ)SE(2
^
ˆˆ2ˆ)SE(2
^
~t(n
2)
ˆ)SE(2
^
2.4157
0.0037 651.9614 t
*
ˆ2ˆ)SE(2
^
0.7863
212.5135
0.0037
*
查表得 0.05时,t0.025(122)2.228
表明2显著不为0,销售收入对销售成本有显著影响.
(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置
信度为95%的预测区间。
ˆ66.28720.7863X66.28720.7863800695.3272万元 Yii
ˆˆ预测区间为
: YFYFt2
Y695.32722.2282.4157 F695.32721.9978
2.8 表2.15中是1992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据: 表2.15 1992年亚洲各国人均寿命等数据
资料来源:联合国发展规划署. 人的发展报告. 1993
(1)分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。
(2)对所建立的多个回归模型进行检验。 (3)分析对比各个简单线性回归模型。
练习题2.8参考解答:
(1) 分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁
儿童疫苗接种率的数量关系: 1) 人均寿命与人均GDP关系 Yi12X1iui 估计检验结果
:
2) 人均寿命与成人识字率关系
3) 人均寿命与一岁儿童疫苗接种率关系
(2)对所建立的多个回归模型进行检验
由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t检验值均明确大于其临界值,而且从对应的P值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响.
(3)分析对比各个简单线性回归模型 人均寿命与人均GDP回归的可决系数为0.5261 人均寿命与成人识字率回归的可决系数为0.7168 人均寿命与一岁儿童疫苗接种率的可决系数为0.5379 相对说来,人均寿命由成人识字率作出解释的比重更大一些
2.9 按照“弗里德曼的持久收入假说”: 持久消费Y正比于持久收入X,依此假说建立的计量模型没有截距项,设定的模型应该为:Yi2Xiui,这是一个过原点的回归。
ˆ的计算公式是什么?对该模在古典假定满足时,证明过原点的回归中2的OLS估计量2
型是否仍有
e0和eX
i
i
i
0?对比有截距项模型和无截距项模型参数的OLS估计
有什么不同?
练习题2.9参考解答:
没有截距项的过原点回归模型为: Yi2Xiu 因为
2ˆX)2 e(Yii2i
ei2
ˆX)(X)2eX 2(Yi求偏导 ii2ii
2
ei2
ˆX)(X)0 令 2(Yi2ii
2
ˆ得 2
XYX
ii2i
ˆ 而有截距项的回归为2
xy
x
i2i
i
对于过原点的回归,由OLS原则:
e0已不再成立, 但是eX
i
i
i
0是成立的。
ˆ)还可以证明对于过原点的回归 Var(2
ˆ)而有截距项的回归为 Var(2
2
X
2
2
i
2i
ˆ ,
2
e
e
2i
n1
2i
x
,
ˆ
2
n2
2.10 练习题2.3中如果将“地方财政收入”和“本市生产总值”数据的计量单位分别或同时由”亿元”改为”万元”,重新估计参数,对比参数估计及检验结果与计量单位更改之前有什么区别? 你能从中总结出什么规律性吗?
练习题2.10参考解答:
如果将“地方财政收入Y”和“本市生产总值GDP”数据的计量单位分别或同时由”亿元”改为”万元”,数据变为:
深圳市地方预算内财政收入与国内生产总值
A.当“地方财政收入”和“本市生产总值”数据的计量单位均为“亿元”时估计检验结果为:
ˆ20.461060.084965GDP Y1t1t
(9.867440) (0.003255)
t=(2.073593) (26.10376) R2=0.977058
B.当“地方财政收入” 的计量单位为“亿元”,“本市生产总值” 的计量单位为“万元” 时:
ˆ20.461060.00000850GDP Y1t2t
(9.867440)(0.000000325)
t=(2.073593) (26.10376) R2=0.977058
C.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“亿元” 时:
ˆ204610.6849.6520GDP Y2t1t
(98674.40) (32.54902)
t=(2.073593) (26.10376) R2=0.977058
D.当“地方财政收入” 的计量单位为“万元”,“本市生产总值” 的计量单位为“万元” 时:
ˆ204610.60.084965GDP Y2t2t
(98674.40) (0.0032549)
t=(2.073593) (26.10376) R2=0.977058
可以总结出,变量度量单位对回归影响的一般规律为:
1)当被解释变量测量单位改变(扩大或缩小常数c倍),而解释变量测量单位不变时:OLS截距和斜率的估计值及标准误差都缩小或扩大为原来的c倍. (如C的情况)
2)当解释变量测量单位改变(扩大或缩小常数c倍),而被解释变量测量单位不变时:OLS斜率的估计值及标准误差扩大或缩小为原来的c倍,但不影响截距的估计. (如B的情况)3)当被解释变量和解释变量测量单位同时改变相同倍数时,OLS的截距估计值及标准误差扩大为原来的c倍,但不影响斜率的估计. (如D的情况)
4)当被解释变量和解释变量测量单位改变时,不会影响拟合优度.可决系数是纯数没有维度,所以不随计量单位而变化。
第三章练习题参考解答
练习题
3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:
ˆ151.02630.1179X1.5452X Yi1i2i
t=(-3.066806) (6.652983) (3.378064)
R2=0.934331 0.92964 F=191.1894 n=31 (1) 从经济意义上考察估计模型的合理性。
(2) 在5%显著性水平上,分别检验参数1,2的显著性。 (3) 在5%显著性水平上,检验模型的整体显著性。
3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:
2
3 367.69, 1402.76, 28.0, n15, 0
(Y)
2
i
9 66042.,26
(X
i
1i
1)284855.096,
1i
2
(X)2i2280.000, (Y)(X(X
1i
1)74778.346,
4796. 000
(Y)(X
i
2i
2)4250.900, 1)(Xi22)
3.3 经研究发现,家庭书刊消费受家庭收入几户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据:
(2)利用样本数据估计模型的参数;
(3)检验户主受教育年数对家庭书刊消费是否有显著影响;
(4)分析所估计模型的经济意义和作用
3.4 考虑以下“期望扩充菲利普斯曲线(Expectations-augmented Phillips curve)”模型:
Yt12X2t3X3tut
其中:Yt=实际通货膨胀率(%);X2t=失业率(%);X3t=预期的通货膨胀率(%)
下表为某国的有关数据,
表1. 1970-1982年某国实际通货膨胀率Y(%),
失业率X
(1)对此模型作估计,并作出经济学和计量经济学的说明。 (2)根据此模型所估计结果,作计量经济学的检验。 (3)计算修正的可决系数(写出详细计算过程)。
3.5某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指
利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。
3.6下表给出的是1960—1982年间7个OECD国家的能源需求指数(Y)、实际GDP指
(1)建立能源需求与收入和价格之间的对数需求函数
lnYt01lnX1t2lnX2tut,解释各回归系数的意义,用P值检验所估计回
归系数是否显著。
(2) 再建立能源需求与收入和价格之间的线性回归模型
Yt01X1t2X2tu,解释各回归系数的意义,用P值检验所估计回归系数是
否显著。
(3 )比较所建立的两个模型,如果两个模型结论不同,你将选择哪个模型,为什么?
练习题参考解答
练习题3.1参考解答 有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数
增加1万人次,旅游外汇收入增加1.5452百万美元。 取0.05,查表得t0.025(313)2.048
因为3个参数t统计量的绝对值均大于t0.025(313)2.048,说明经t检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。 取0.05,查表得F0.05(2,28)3.34,由于F199.1894F0.05(2,28)3.34,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。
练习题3.3参考解答
(1)建立家庭书刊消费的计量经济模型: Yi12Xi3Tiui
其中:Y为家庭书刊年消费支出、X为家庭月平均收入、T为户主受教育年数 (2)估计模型参数,结果为
ˆ50.01620.08645即 YXi52.3703Ti i
(49.46026)(0.02936) (5.20217)
t= (-1.011244) (2.944186) (10.06702) R2=0.951235 0.944732 F=146.2974
(3) 检验户主受教育年数对家庭书刊消费是否有显著影响:
由估计检验结果, 户主受教育年数参数对应的t 统计量为10.06702, 明显大于t的临界值
2
t0.025(183)2.131,同时户主受教育年数参数所对应的P值为0.0000,明显小于
0.05,均可判断户主受教育年数对家庭书刊消费支出确实有显著影响。
(4)本模型说明家庭月平均收入和户主受教育年数对家庭书刊消费支出有显著影响,家庭月平均收入增加1元,家庭书刊年消费支出将增加0.086元,户主受教育年数增加1年,家
庭书刊年消费支出将增加52.37元。
练习题3.5参考解答
(1) 建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型:
Yt12Xt3Ttut (2)估计参数结果
由估计和检验结果可看出,该地区人均年可支配收入的参数的t检验值为10.54786,其绝对值大于临界值t0.025(113)2.306;而且对应的P值为0.0000,也明显小于0.05。说明人均年可支配收入对该地区城镇居民人均全年耐用消费品支出确实有显著影响。
但是,该地区耐用消费品价格指数的参数的t检验值为-0.921316,其绝对值小于临界值
t0.025(113)2.306;而且对应的P值为0.3838,也明显大于0.05。这说明该地区耐
用消费品价格指数对城镇居民人均全年耐用消费品支出并没有显著影响
第四章
4.1 假设在模型Yi12X2i3X3iui中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归:
Yi12X2iu1iYi13X3iu2i
ˆ且ˆ?为什么? ˆ2ˆ3(1)是否存在23
ˆ会等于ˆ1或ˆ1或两者的某个线性组合吗?(2) 1
ˆvarˆvarˆ2且varˆ3? (3)是否有var23
练习题4.1参考解答:
ˆ且ˆ。 ˆ2ˆ3(1) 存在23
ˆ因为
2
yxxyxx
xxxxi2i
23i
i3i
22i
23i
2
2i
3i
23i
2i
x3i
当X2与X3之间的相关系数为零时,离差形式的
x
2i3i
x0
ˆ有2
yxxyx
xxx
i2i
i
22i
23i
2i
22i
ˆ2
ˆ ˆ3同理有:3
ˆ会等于ˆ1或ˆ1的某个线性组合 (2) 1
ˆˆˆ,且ˆ1ˆ22,ˆ1ˆ33 因为 12233ˆ且ˆ,则 ˆ2ˆ3由于23
ˆˆ1ˆ22 22ˆˆ1ˆ33 33
ˆ2ˆ3
ˆ1
2
ˆ1 3
ˆ1ˆ1ˆˆˆˆ1ˆ1 则 3122332
2
3
ˆvarˆvarˆ2且varˆ3。 (3) 存在var23ˆ因为var2
x1r2
2i
223
2
ˆ当r230时,var2
x1rx
2
2i
223
2
2
22i
ˆ2 var
ˆvarˆ3 同理,有var3
4.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么?
练习题4.2参考解答:
根据对多重共线性的理解,逐步向前和逐步向后回归的程序都存在不足。逐步向前法不能反映引进新的解释变量后的变化情况,即一旦引入就保留在方程中;逐步向后法则一旦某个解释变量被剔出就再也没有机会重新进入方程。而解释变量之间及其与被解释变量的相关关系与引入的变量个数及同时引入哪些变量而呈现出不同,所以要寻找到“最优”变量子集则采用逐步回归较好,它吸收了逐步向前和逐步向后的优点。
4.3 下表给出了中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI。
表4.11 中国商品进口额、国内生产总值、居民消费价格指数
资料来源:《中国统计年鉴》,中国统计出版社2000年、
2008年。
请考虑下列模型:lnYt1+2lnGDPt3lnCPItui 1)利用表中数据估计此模型的参数。 2)你认为数据中有多重共线性吗? 3)进行以下回归:
lnYtA1+A2lnGDPtv1ilnYtB1+B2lnCPItv2ilnGDPtC1C2lnCPItv3i
根据这些回归你能对数据中多重共线性的性质说些什么?
ˆ和ˆ在5%水平上个别地显著,并且总的F检验也是显4)假设数据有多重共线性,但23
著的。对这样的情形,我们是否应考虑共线性的问题?
练习题4.3参考解答: (1) 参数估计结果如下
ln(进口)3.0601.657ln(GDP)1.057ln(CPI)
(0.337) (0.092) (0.215)R20.992 20.991 F1275.093
(括号内为标准误)
(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且且CPI与进口之间的简单相关系数呈现正向变动。可能数据中有多重共线性。 计算相关系数:
(3)最大的CI=108.812,表明GDP与CPI之间存在较高的线性相关。
(4)分别拟合的回归模型如下:
lnY4.09071.2186ln(GDP) t= (-10.6458) (34.6222)
R20.9828 20.9820 F
1198.698
lnY5.44242.6637ln(CPI) t= (-4.3412) (11.6809)
R20.8666 20.8603 F136.4437
ln(GDP)1.43802.2460ln(CPI) t=(-1.9582) (16.8140)
R20.9309 20.9276 F282.7107
单方程拟合效果都很好,回归系数显著,可决系数较高,GDP和CPI对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
(5)如果仅仅是作预测,可以不在意这种多重共线性,但如果是进行结构分析,还是应该引起注意。
4.4 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造解释变量数据矩阵X才可能避免多重共线性的出现?
练习题4.4参考解答:
本题很灵活,主要应注意以下问题:
(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
4.5 克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE估计得出了下列回归方程:
ˆ8.1331.059X10.452X20.121X3Y (8.92) (0.17) (0.66) (1.09) R20.95 F107.37
括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析,指出其中存在的
问题。
练习题4.5参考解答:
从模型拟合结果可知,样本观测个数为27,消费模型的判定系数R0.95,F统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F临界值为3.028,计算的F值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。 依据参数估计量及其标准误,可计算出各回归系数估计量的t统计量值:
2
t0
8.133
0.91,8.92
t1
1.059
6.10,0.17
t2
0.452
0.69,0.66
t3
0.121
0.111.09
除t1外,其余的tj值都很小。工资收入X1的系数的t检验值虽然显著,但该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。
4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值 (亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。
表4.12 1985~2007年统计数据
资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。
要求:
1)建立对数多元线性回归模型,分析回归结果。
2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么? 3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。
练习题4.6参考解答:
(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下: 生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7. 作全部变量对数线性多元回归,结果为:
从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。
(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。
解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费 (千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下
:
可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下:
A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如
lny9.9320.421lnx6 (0.116) (0.026)
R20.926 20.922 F261.551
B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作lnY对
lnX1,lnX2,lnX3,lnX4,lnX5,lnX6,lnX7的一元回归,结果如下:
一元回归结果:
其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:
lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数
的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。
如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。作逐步回归:
可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:
0.
可是这里的lnX2和lnX5的参数符号为负,在经济意义上并不合理。说明多重共线性影响仍然很严重。
4.7 在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗?”的例子中,如果所采用的数据如下表所示
(资料来源:《中国统计年鉴2008》,中国统计出版社2008年版)试分析:为什么会出现本章开始时所得到的异常结果?怎样解决所出现的问题?
练习题4.7参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减低共线性。
第五章
5.1 设消费函数为
Yi12X2i3X3iui
式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差项,并且E(ui)0,Var(ui)X2i(其中为常数)。试解答以下问题:
2
2
2
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
练习题5.1参考解答:
2
(1)因为f(Xi)X2i,所以取W2i
1
,用W2i乘给定模型两端,得 X2i
YiXu11233ii
X2iX2iX2i X2i
上述模型的随机误差项的方差为一固定常数,即
Var(
ui1
)2Var(ui)2X2iX2i
(2)根据加权最小二乘法,可得修正异方差后的参数估计式为
ˆ*ˆ*ˆ*12233
ˆ2
W
2i
**2****
yi*x2iW2ix3iW2iyix3iW2ix2ix3i**W2ix2*2iW2ix3*2iW2ix2ix3i
2
ˆ3
其中
W
2i
**2****yi*x3iW2ix2iW2iyix2iW2ix2ix3i**W2ix2*2iW2ix3*2iW2ix2ix3i
2
*2
WX
W
2i2i
2i
,*3
WX
W
2i2i
3i
,*
WY
W
2ii2i
**xX2i2 2i
**
x3Xi3i3
y*Yi*
5.2 下表是消费Y与收入X的数据,试根据所给数据资料完成以下问题: (1)估计回归模型Y12Xu中的未知参数1和2,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性; (3)选用合适的方法修正异方差。
表5.8 某地区消费Y与收入X的数据(单位:亿元)
练习题5.2参考解答:
(1)该模型样本回归估计式的书写形式为
ˆ9.347522+0.637069XYii
t= (2.569104) (32.00881)
R22=0.945500 F=1024.564 DW=1.790431
(2)首先,用Goldfeld-Quandt法进行检验。
将样本X按递增顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即
n1n222。
分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
ee
求F统计量为
2122
603.01482495.840
2221
eF
e
2495.84
4.1390
603.0148
给定0.05,查F分布表,得临界值为F0.05(20,20)2.12。
c.比较临界值与F统计量值,有F=4.1390>F0.05(20,20)2.12,说明该模型的随机误
差项存在异方差。
其次,用White法进行检验。具体结果见下表
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 08/05/05 Time: 12:37 Sample: 1 60
X 0.165977 1.619856 0.102464 Adjusted R-squared 0.152332 S.D. dependent var S.E. of regression 102.3231 Akaike info criterion Sum squared resid 596790.5 Schwarz criterion Log likelihood -361.2856 F-statistic 0.9187 111.1375 12.14285 12.24757 6.301373 给定0.05,在自由度为2下查卡方分布表,得25.9915。比较临界值与卡方统计量值,即nR210.864025.9915,同样说明模型中的随机误差项存在异方差。 (2)用权数W1
Dependent Variable: Y Method: Least Squares
Date: 08/05/05 Time: 13:17 Sample: 1 60
Included observations: 60 Adjusted R-squared 0.197845 S.D. dependent var S.E. of regression 7.778892 Akaike info criterion Sum squared resid 3509.647 Schwarz criterion Log likelihood -207.2041 F-statistic Adjusted R-squared 0.945410 S.D. dependent var S.E. of regression 9.039689 Sum squared resid 1
,作加权最小二乘估计,得如下结果 X
8.685376 6.973470 7.043282 1159.176 38.68984 4739.526
用White法进行检验得如下结果:
White Heteroskedasticity Test: F-statistic 3.138491 Probability 0.050925 给定0.05,在自由度为2下查卡方分布表,得25.9915。比较临界值与卡方统计量值,即nR25.951910
ˆ10.37050.6309XY
t(3.943587) (34.04667)
R22=0.197845 DW=0.958467 F=1159.176
5.3 下表是2007年我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据
表5.9 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元)
(1)试根据上述数据建立2007年我国农村居民家庭人均消费支出对人均纯收入的线性回归模型。
(2)选用适当方法检验模型是否在异方差,并说明存在异方差的理由。 (3)如果存在异方差,用适当方法加以修正。
练习题5.3参考解答:
解: (1)建立样本回归函数。
ˆ179.1916+0.7195X Y
(0.808709)(15.74411) R20.895260, F=247.8769
(2)利用White方法检验异方差,则White检验结果见下表:
Heteroskedasticity Test: White F-statistic
7.194463 Prob. F(2,28)
0.0030 0.0052 0.0000
Obs*R-squared Scaled explained SS
10.52295 Prob. Chi-Square(2) 30.08105 Prob. Chi-Square(2)
由上述结果可知,该模型存在异方差。分析该模型存在异方差的理由是,从数据可以看出,一是截面数据;二是各省市经济发展不平衡,使得一些省市农村居民收入高出其它省市很多,如上海市、北京市、天津市和浙江省等。而有的省就很低,如甘肃省、贵州省、云南省和陕西省等。
(3)用加权最小二乘法修正异方差,
分别选择权数w1过试算,认为用权数w3的效果最好。结果如下:
11,w2w32,经XX
书写结果为
ˆ787.28470.5615XY
(4.5325)(10.0747) R20.9461,F101.4992
5.4 下表是某一地区31年中个人储蓄和个人收入数据资料 表5.10 个人储蓄和个人收入数据(单位:元)
(1)建立一元回归函数,判断有无异方差存在,并说明存在异方差的原因。 (2)用适当方法修正异方差。 练习题5.4参考解答:
(1)建立样本回归函数。
ˆ-648.1236+0.0847X Y
(-5.485018)(17.34164) R0.912050, F=300.7324
从估计的结果看,各项检验指标均显著。但由于收入通常存在不同的差异,因此需要判断模型是否存在异方差。
首先,用图形法。从残差平方对解释变量散点图可以看出(见下图),模型很可能存在异方差。
2
其次,用运用Goldfeld-Quanadt检验异方差。 第一,对变量X取值以升序排序。
第二,构造子样本。由于本例的样本容量为31,删除1/4观测值,约7个,余下部分分得两个样本区间:1—12和20—31,它们的样本个数均是12个。
第三,在样本区为1—12,所计算得到的残茶平方和为20—31,所计算得到的残茶平方和为
e
22i21i
21i
162899.2;在样本区为
e
22i
981744.6。
981744.6
6.0267。
162899.2
e第四,根据Goldfeld-Quanadt检验,F统计量为Fe
第五,判断。在显著性水平为0.05条件下,分子分母的自由度均为10,查F分布表得临界值为F0.05(10,10)2.98,因为F6.0267F0.05(10,10)2.98,所以拒绝原假设,表明模型存在异方差。
最后,用ARCH方法检验异方差,则ARCH检验结果见下表:
Heteroskedasticity Test: ARCH
F-statistic Obs*R-squared
6.172299 Prob. F(1,28) 5.418686 Prob. Chi-Square(1)
0.0192 0.0199
由上述结论可知,拒绝原假设,则模型中随机误差项存在异方差。
(2
)分别用权数w1
11,w2w32,发现用权数w2求加权最小二乘估计XX
效果最好,即
ˆ706.69860.0873XY
(8.0399)(20.1399) R20.8735,F405.6164
5.5 下表的数据是2007年我国建筑业总产值(X)和建筑业企业利润总额(Y)。试根据资料建立回归模型,并对模型判断是否存在异方差,如果有异方差,选用适当方法修正。
表5.11 各地区建筑业总产值(X)和建筑业企业利润总额(Y)(单位:万元)
数据来源:国家统计局网站
练习题5.5参考解答:
(1)求Y对X的回归,得如下估计结果
ˆ28992.820.0323XY
(0.8009)(20.8233) R20.9373,F433.6077
用怀特检验的修正方法,即建立如下回归模型
ˆYˆ2ei212Yi3ivi
通过计算得到如下结果:
注意,表中E2为残差平方et2。 即
ˆ0.0138Yˆ2 ˆi26.34(E09)65144.33Yeii
对该模型系数作判断,运用F或LM检验,可发现存在异方差。
ˆ后,ˆ和具体EViews操作如下:在得到Y的估计Y进一步得到残差平方ei2,然后建立ei2对Yˆ2的线性回归模型。再通过上述回归对Yˆ和Yˆ2前的系数是否为零进行判断,从而检验原模Y
型中是否存在异方差。在上表界面,按路径:VIEW/COEFFIEICENT TESTS/REDUANDANT VARIABLES,得到如下窗口,并输入变量名“YF YF^2”,即
然后“OK”即得到检验结果为
从表中F统计量值和LM统计量值看,拒绝原假设,表明原模型存在异方差。
(2)通过对权数的试算,
最后选择权数w原后的结果)
用加权最小二乘法得到如下估计(还ˆ9038.8750.0311XY
(0.5912)
(17.6011)
R20.9144,F309.7983,DW2.0975
对该模型进行检验,发现已无异方差。
5.6 下表为四川省农村人均纯收入、人均生活费支出、商品零售价格指数1978年至2008年时间序列数据。试根据该资料建立回归模型,并检验是否存在异方差,如果存在异方差,选用适当方法进行修正。
表5.12 1978——2008四川省农村人均纯收入、人均生活费支出、商品零售价格指数
资料来源:中经网统计数据库
练习题5.6参考解答:
(1)设Y表示人均生活费支出,X表示农村人均纯收入,则建立样本回归函数 Y71.61407+0.761445X (3.944029)(69.98227) R0.994113, F=4897.518
从估计结果看,各项检验指标均显著,但从经济意义看,改革开放以来,四川省农村经济发生了巨大变化,农村家庭纯收入的差距也有所拉大,使得农村居民的消费水平的差距也有所加大,在这种情况下,尽管是时间序列数据,也有可能存在异方差问题。而且从残差平方对解释变量的散点图可以看出,模型很可能存在异方差(见下图)。
2^
进一步作利用ARCH方法检验异方差,得ARCH检验结果(见下表)
(2
)运用加权最小二乘法,选权数为w
^
Y35.69419+0.789972X
(3.435081)(59.91014)
R20.991985, F=3589.224
经检验,时模型的异方差问题有了明显的改进。
5.7 在5.6题的数据表里,如果考虑物价因素,则对异方差性的修正应该怎样进行?
练习题5.7参考解答:
剔除物价上涨因素后的回归结果如下
ˆ0.4310010.727487XY11t(6.888037) (55.52690)
R220.990361 F=3083.237
其中,Y1代表实际消费支出,X1代表实际可支配收入。
用ARCH方法来检验模型是否存在异方差:
在显著性水平为0.01的条件下,接收原假设,模型不存在异方差。表明剔除物价上涨因素之后,异方差的问题有所改善。
第六章
6.1 下表给出了美国1960-1995年36年间个人实际可支配收入X和个人实际消费支出Y的数据。
表6.6 美国个人实际可支配收入和个人实际消费支出 (单位:百亿美元)
注:资料来源于Economic Report of the President,数据为1992年价格。
要求:(1)用普通最小二乘法估计收入—消费模型;
练习题6.1参考解答:
(1)收入—消费模型为
Yt12X2ut
(2)检验收入—消费模型的自相关状况(5%显著水平); (3)用适当的方法消除模型中存在的问题。
ˆ9.42870.9359 YXt t
Se = (2.5043) (0.0075) t = (-3.7650) (125.3411)
R2 = 0.9978,F = 15710.39,d f = 34,DW = 0.5234
(2)对样本量为36、一个解释变量的模型、5%显著水平,查DW统计表可知,dL=1.411,
dU= 1.525,模型中DW
(3)采用广义差分法
et= 0.72855 et-1
ˆ*3.78310.9484X* Ytt
Se(1.8710) (0.0189)
t = (-2.0220) (50.1682)
R2 = 0.9871 F = 2516.848 d f = 33 DW = 2.0972
查5%显著水平的DW统计表可知dL = 1.402,dU = 1.519,模型中DW = 2.0972> dU,说明广义差分模型中已无自相关。同时,可决系数R、t、F统计量均达到理想水平。
2
ˆ1
3.7831
13.9366
10.72855
最终的消费模型为 Y t = 13.9366+0.9484 X t
6.2 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型
模型1 Yt01tut 模型2 Yt01t2t2ut
其中,Y为劳动投入,t为时间。据1949-1964年数据,对初级金属工业得到如下结果:
ˆ0.45290.0041模型1 Yt t
t = (-3.9608)
R2 = 0.5284 DW = 0.8252
ˆ0.47860.0127模型2 Yt0.0005t2 t
t = (-3.2724)(2.7777) R2 = 0.6629
DW = 1.82
其中,括号内的数字为t统计量。
问:(1)模型1和模型2中是否有自相关;
(2)如何判定自相关的存在?
(3)怎样区分虚假自相关和真正的自相关。
练习题6.2参考解答:
(1)模型1中有自相关,模型2中无自相关。 (2)通过DW检验进行判断。
模型1:dL=1.077, dU=1.361, DW
dU, 因此无自相关。
(3)如果通过改变模型的设定可以消除自相关现象,则为虚假自相关,否则为真正自相关。
6.3下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据。
要求:(1)建立居民收入—消费函数;
练习题6.3参考解答:
(1)收入—消费模型为
(2)检验模型中存在的问题,并采取适当的补救措施预以处理; (3)对模型结果进行经济解释。
ˆ79.9300.690XYtt
Se(12.399)(0.013)t(6.446)(53.621)
(6.38)
R20.994DW0.575
(2)DW=0.575,取5%,查DW上下界dL1.18,dU1.40,DW1.18,说明误差项存在正自相关。
(3)采用广义差分法
ˆ,得 使用普通最小二乘法估计的估计值
et0.657et1Se(0.178)t(3.701)
ˆ*36.0100.669X*Ytt
Se(8.105)(0.021)t(4.443)(32.416)R20.985DW1.830
DW=1.830,已知dU1.40,dUDW2。因此,在广义差分模型中已无自相关。据
ˆ(1ˆ)36.010,可得: 1
ˆ1
因此,原回归模型应为
36.010
104.985
10.657
Yt104.9850.669Xt
其经济意义为:北京市人均实际收入增加1元时,平均说来人均实际生活消费支出将增加0.669元。
6.4 下表给出了日本工薪家庭实际消费支出与可支配收入数据 表6.8 日本工薪家庭实际消费支出与实际可支配收入
单位:1000日元