关于税收收入增长的影响因素的实证分析
内容摘要:
一国的经济增长是以其财政收入的增长为前提的,而财政收入的增长又离不开税收。本文采用我国自1990年至2009年的税收收入的主要因素的相关统计数据进行的实证分析。选取的自变量有国内生产总值,财政支出、商品零售价格指数和城镇居民家庭人均可支配收入。然后,在收集了相关数据之后,通过建立多元线性回归模型,利用EVIEWS软件对模型进行了参数估计和检验,并加以修正。最后得出结论是财政支出和零售商品物价水平对我国税收收入有很大影响。
关键词: 税收收入 国内生产总值 财政支出 商品零售价格指数 城镇
居民家庭人均可支配收入 参数估计和检验 思考
导论: 税收是我国财政收入的基本因素,也影响着我国经济的发展。经济是
税收的源泉,经济决定税收,而税收又反作用于经济,这是税收与经济的一般原理。这几年来,中国税收收入的快速增长甚至“超速增长”引起了人们的广泛关注。科学地对税收增长进行因素分析和预测分析非常重要,对研究我国税收增长规律,制定经济政策有着重要意义。
影响税收收入的因素有很多,但据分析主要的因素可能有:①从宏观经济看,经济整体增长是税收增长的基本源泉,而国内生产总值是反映经济增长的一个重要指标。②公共财政的需求,税收收入是财政收入的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算支出所表现的公共财政的需求对当年的税收收入可能会有一定影响。③物价水平。我国的税制结构以流转税为主,以现行价格计算的GDP等指标和经营者的收入水平都与物价水平有关。④税收政策因素。我国自1978年以来经历了两次大的税制改革,一次是1984-1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。税制改革对税收增长速度的影响不是非常大。因此,可以从以上几个方面,分析各种因素对中国税收增长的具体影响。
为了全面反映中国税收增长的全貌,我们选用“国家财政收入“中的各项税收”(即税收收入)作为被解释变量,反映税收的增长;选择“国内生产总值”
(即GDP)作为经济整体增长水平的代表;选择“财政支出”作为公共财政需求的代表;选择“商品零售价格指数”作为物价水平的代表;选择城镇居民家庭人均可支配收入作为税收政策因素的代表。另外,由于财税体制的改革难以量化,而且从数据上看,1985年以后财税体制改革对税收增长影响不是很大,在此暂不考虑税制改革对税收增长的影响
模型设定:
为了具体分析各要素对提高我国税收收入的影响大小,选择能反映我们税收变动情况的“各项税收收入”为被解释变量,选择能影响税收收入的“国内生产总值”、“财政支出”、“ 商品零售价格指数”和“城镇居民家庭人均可支配收入”为解释变量。设定了一下经济学模型:
Y01X12X23X34X4 Y=税收收入(亿元)
X1=国内生产总值(亿元) X2财政支出(亿元) X3商品零售价格指数(亿元)
X4 城镇居民家庭人均可支配收入(亿元)
表1是由《中国统计年鉴》得到的1990到2009的相关数据 表1 税收收入时间序列表
资料来源《中国统计年鉴2010》
参数估计
利用Eviews软件,做LnY对、LnX1、LnX2、LnX3、LnX4的回归,回归结果如下(表2)
表 2
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:08 Sample: 1990 2009 Included observations: 20
Variable C LOG(X1) LOG(X2) LOG(X3) LOG(X4)
R-squared
Coefficient
-2.715236 0.931518 0.918078 0.338378 -1.022729
Std. Error
0.719658 0.284597 0.053848 0.146051 0.304190
t-Statistic
-3.772956 3.273111 17.04939 2.316850 -3.362137
Prob.
0.0018 0.0051 0.0000 0.0351 0.0043
9.405915
0.999133 Mean dependent var
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.998902 S.D. dependent var 0.032223 Akaike info criterion 0.015575 Schwarz criterion 43.19966 F-statistic 1.158070 Prob(F-statistic)
0.972567 -3.819966 -3.571033 4323.437 0.000000
根据表中数据,模型回归分析的结果为:
ˆ-2.715236+0.931518LnX+0.918078LnX+0.338378LnX-1.022729LnY123
LnX4
(-3.772956)(3.273111) (17.04939) (2.316850) (-3.362137)
R20.999133 2=0.998902 D.W.= 1.158070 F=4323.437
模型的检验及修正
(一) 经济意义检验:
ˆ=0.931518,ˆ=0.918078,ˆ0.338378,且0从上表可以看出,所作的参数估计123ˆ<1,0<ˆ<1,0<ˆ<1,均符合变量参数的确定范围,而的符号为负,<4123不符合经济意义,但是根据经验,怀疑可能是存在多重共线性,要看多重共线性检验的结果才能确定。
这里与理论分析和经验判断是一致的。 (二)统计意义检验
1、拟合优度检验(R2检验)
可决系数R20.999133,2=0.998902,这说明所建模型整体上对样本数据拟合很好,即解释变量“国内生产总值(X1)”、“财政支出(X2)”和“零售价格指数(X3)”被解释变量“各项税收收入(Y)”的绝大部分差异作了解释。
2、F检验
ˆ=ˆ=ˆ=0,给定显著性水平α=0.05,在F分布表中查出自由度为针对H0:123k-1=3和n-k=16的临界值Fα(3,16)=3.24,由表2中得到F=4323.437>F
α
ˆˆˆˆ,说明回归方程显著,(3,17)=3.24,应拒绝原假设H0:0123
即列入模型的解释变量“国内生产总值(X1)”、“财政支出(X2)”和“ 商品零售价格指数(X3)”联合起来确实对被解释变量“各项税收收入(Y)”有显著影响 3、t检验
分别针对H0:j=0(j=0,1,2,3),给定显著性水平α=0.05,查t分布表的自由度为n-k=16的临界值tnk=2.120。由表2中的数据可得,
2
ˆ、ˆ、ˆ对应的t统计量分别为-1.20114、0.506888、17.63061、ˆ、与12302.721708,其绝对值不全大于tnk=2.120,这说明在显著水平α=0.05下,
2
ˆ、ˆ能拒绝H:=0,也就是说,当在其他解释变量不变的情况下,只有0j23各个解释变量“国内生产总值(X1)”、“财政支出(X2)”和“ 商品零售价格指数(X3)”分别对被解释变量“各项税收收入(Y)”不全都有显著影响,这可能是由于多重共线性或自相关性的影响。 (三)计量经济检验 1、多重共线性检验
①用普通最小二乘法估计模型
ˆ-2.715236+0.931518LnX+0.918078LnX+0.338378LnX-1.022729 LnY123
(-3.772956)(3.273111) (17.04939) (2.316850) (-3.362137)
LnX4
R20.999133 2=0.998902 D.W.= 1.158070 F=4323.437
由于R2较大且接近于1,而且F=4323.437>F0.054,15=3.06,故认为税收收入与上述变量间总体线性关系显著。
②检验简单相关系数, LnX1,LnX2,LnX3,LnX4 的相关系数如下表所示
由表中数据发现LnX1,LnX2,LnX4之间存在高度相关性。
③找出最简单的回归形式 让LnY分别对LnX1、LnX2、LnX3、LnX4做回归如下: 将LnY与LnX1做回归得到结果如表3:
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:09 Sample: 1990 2009 Included observations: 20
Variable C LOG(X1)
R-squared
Coefficient
-3.425298 1.123575
Std. Error
0.499347 0.043610
t-Statistic
-6.859556 25.76417
Prob.
0.0000 0.0000
9.405915 0.972567 -0.703402 -0.603829 663.7924 0.000000
0.973599 Mean dependent var 0.972132 S.D. dependent var 0.162357 Akaike info criterion 0.474475 Schwarz criterion 9.034021 F-statistic 0.204664 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
将LnY与LnX2做回归得到结果如表4:
表 4
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:14 Sample: 1990 2009 Included observations: 20
Variable C LOG(X2)
R-squared
Coefficient
0.088902 0.974373
Std. Error
0.098794 0.010279
t-Statistic
0.899876 94.79376
Prob.
0.3801 0.0000
9.405915 0.972567 -3.284085 -3.184512 8985.857 0.000000
0.998001 Mean dependent var 0.997890 S.D. dependent var 0.044677 Akaike info criterion 0.035928 Schwarz criterion 34.84085 F-statistic 0.835853 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
将LnY与LnX3做回归得到结果如表5:
表 5
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:15 Sample: 1990 2009 Included observations: 20
Variable C LOG(X3)
R-squared
Coefficient
38.45026 -6.261920
Std. Error
16.61492 3.581876
t-Statistic
2.314201 -1.748223
Prob.
0.0327 0.0975
9.405915 0.972567 2.774124 2.873697 3.056284 0.097460
0.145148 Mean dependent var 0.097657 S.D. dependent var 0.923859 Akaike info criterion 15.36327 Schwarz criterion -25.74124 F-statistic 0.126701 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
将LnY与LnX4做回归得到结果如表6:
表 6
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:16 Sample: 1990 2009
Included observations: 20
Variable C LOG(X4)
R-squared
Coefficient
-2.159040 1.334218
Std. Error
0.512374 0.058920
t-Statistic
-4.213802 22.64447
Prob.
0.0005 0.0000
9.405915 0.972567 -0.453009 -0.353436 512.7720 0.000000
0.966087 Mean dependent var 0.964203 S.D. dependent var 0.184010 Akaike info criterion 0.609477 Schwarz criterion 6.530093 F-statistic 0.206327 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
回归结果如下:
ˆ=-3.425298 + 1.123575LnX ⑴ LnY1
(-6.859556)(25.76417)
R2=0.973599 D.W.=0.204664
ˆ=0.088902 + 0.974373LnX ⑵ LnY2
(0.889876)(94.79376)
R2=0.998001 D.W.=0.835853
ˆ=38.45026 - 6.261920LnXLnY3 ⑶
(2.314201)(-1.748223)
R2=0.145148 D.W.=0.126701
ˆ=-2.159040 + 1.334218LnX⑷LnY4 (-4.213802)(22.64447)
R2=0.966087 D.W.=0.206327
可见税收收入受财政支出的影响最大,选择⑵为初始的回归模型。 ④逐步回归
将其他解释变量分别倒入上述初始回归模型,以寻找最佳回归方程(如下表)
讨论:
第一步,在初始模型中分别引入X1,X3,X4,发现引入X1和X4之后,模型拟合优度反而略有下降, 引入X3,模型拟合优度提高,且变量也通过了T检验; 第二步,在引入X3的基础上,引入X1,发现引入X1时模型拟合优度下降,同时X1的参数未能通过T检验;
第三步,去掉X1,引入X4,你拟合优度有所下降,且X4的参数也未能通过T
检验。
第二步与第三步表明,X1与X4是多余的,因此,最终的税收收入函数应以
Y=F(X2,X3)为解释变脸的回归结果
新模型估计结果如下
ˆ=-1.821712 + 0.983727LnX + 0.392643LnX LnY23 (-2.193320)(97.67899) (2.313575)
R2=0.998480 D.W.=0.982623 F=5582.052 e2iRSS=0.027325
2、异方差检验: ①图示法检验:
~与LnX,LnX的散点图如下所模型普通最小二乘法得到的残差平方和e23i
2
示
.008.007.006.005
E^2
.004.003.002.001.000
8.0
8.5
9.0
9.510.010.511.011.5LOG(X2)
②利用G-Q检验法检验模型是否存在异方差性:
将原始数据按X2排成升序,去掉中间的4个数据,得到两个容量为8的子样本,对两个子样本分别做最小二乘回归,具体如下:
将时间定义为1990——1997,然后对LnY,C, LnX2,LnX3用OLS法求得下列结果
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 17:18 Sample: 1 8
Included observations: 8
Variable C LOG(X2) LOG(X3)
R-squared
Coefficient
-0.006791 0.981312 0.010906
Std. Error
0.527731 0.018617 0.113832
t-Statistic
-0.012869 52.71154 0.095810
Prob.
0.9902 0.0000 0.9274
8.438715 0.402034 -4.724968 -4.695178 1438.607 0.000000
0.998265 Mean dependent var 0.997571 S.D. dependent var 0.019813 Akaike info criterion 0.001963 Schwarz criterion 21.89987 F-statistic 2.515405 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
ˆ=-0006791 + 0.981312LnX+0.010906LOG(X3) 子样本1:LnY2 (-0.012869) (52.71154) (0.095810)
R2=0.998262 RSS1=0.001963
将时间定义为2002——2009,然后对LnY,C, LnX2,LnX3用OLS法求得下列结果
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 17:22 Sample: 13 20
Included observations: 8
Variable C LOG(X2) LOG(X3)
R-squared
Coefficient
-8.114573 0.984184 1.755189
Std. Error
2.576841 0.032251 0.579753
t-Statistic
-3.149038 30.51666 3.027478
Prob.
0.0254 0.0000 0.0292
10.39035 0.456537 -3.557531 -3.527741 575.7455 0.000001
0.995677 Mean dependent var 0.993947 S.D. dependent var 0.035518 Akaike info criterion 0.006308 Schwarz criterion 17.23013 F-statistic 1.592419 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
ˆ=-8.114573 + 0.984184LnX+1.755189LnX 子样本2:LnY23 (-3.149038) (30.5166) (3.027478)
R2=0.995677 RSS2=0.006308
计算F统计量:F=RSS2/RSS1=0.006308/0.001963=3.213448803 在5%的显著性水平下,自由度为(6,6)的F分布的临界值为4.28,由
RSS2/RSS1=3.213448803
~2i为对原始模型进行普通最小二乘回归得到的残差③再采用怀特检验。记e
平房项,将其与X1与X2及其平房项作辅助回归,得到
White Heteroskedasticity Test: F-statistic
0.620228 Probability 2.838423 Probability
Std. Error
2.582147 0.010132 0.000526 1.094448 0.116883
t-Statistic
0.572519 -0.643645 0.704190 -0.566302 0.566971
Coefficient
1.478328 -0.006521 0.000371 -0.619788 0.066269
0.655013 0.585219
Prob.
0.5755 0.5295 0.4921 0.5796 0.5791
0.001366 0.001747 -9.566706 -9.317773 0.620228 0.655013
Obs*R-squared
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 12/04/11 Time: 20:56 Sample: 1990 2009 Included observations: 20
Variable C LOG(X2) (LOG(X2))^2 LOG(X3) (LOG(X3))^2 R-squared
0.141921 Mean dependent var -0.086900 S.D. dependent var 0.001821 Akaike info criterion 4.97E-05 Schwarz criterion 100.6671 F-statistic 2.392125 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
ˆ=1.478328 - 0.006521LnX+0.000371LnX2-0.619778LnX LnY232(0.572519)(-0.643645) (0.704190) (-0.566302) +0.066269LnX3
2
(0.566971)
R2=0.141921
显然解释变量及其平方项没有通过T检验,且怀特统计量nR2=20×
0.141921=2.83842,该值小于自由度为4,的2分布的临界值,因此,在5的显著性水平下,接受同方差假设,即圆模型不存在异方差。
3、序列相关性检验: ①图示法检验:
~与时间t以及e~与e~的关系图如下。
从残差项ettt1
从趋势图看,曲线与X轴有六个交点,大部分点位于X轴两侧,模型可能存在序列相关,且为政序列相关;从散点图看,大部分点位于一三象限,结论同上。模型是否确实存在正序列相关,有待进一部检验。
②D-W检验
从模型设定来看,没有违背D-W检验的假设条件,因此可以用D-W检验模型是
否存在自相关。作如下回归结果
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 16:06 Sample: 1990 2009 Included observations: 20
Variable C LOG(X2) LOG(X3)
R-squared
Coefficient
-1.821712 0.983727 0.392643
Std. Error
0.830573 0.010071 0.169713
t-Statistic
-2.193320 97.67899 2.313575
Prob.
0.0425 0.0000 0.0335
9.405915 0.972567 -3.457816 -3.308456 5582.052 0.000000
0.998480 Mean dependent var 0.998301 S.D. dependent var 0.040092 Akaike info criterion 0.027325 Schwarz criterion 37.57816 F-statistic 0.982623 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
根据表中估计的结果,有D.W.=0.982623,给定的显著性水平α=0.05,查 Durbin-Watson表,n=20,k=3,得dl=1.10,du=1.54
因为D.W.统计量为0
由于时间序列容易出现伪回归现象,再此,Y,X1与X2都是时间序列,而且他们确实表现出共同的变动趋势,因此有理由怀疑是较高的R2部分是由这一共同的变化趋势带来的。为了排除时间序列模型中这种随时间变动而具有的的共同变化趋势的影响,解决方案是在模型中引入时间趋势项,在将这种影响分离出来。在此,我引入的时间变量为T(T=1,2,„„20)以平方的形式出现,回归结果变化为
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 21:31
Sample: 1990 2009 Included observations: 20
Variable C LOG(X2) LOG(X3) LOG(T^2)
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error
-2.161038 0.828135 1.017938 0.024149 0.415639 0.163843 -0.022312 0.014428
t-Statistic
-2.609523 42.15254 2.536813 -1.546418
Prob.
0.0190 0.0000 0.0220 0.1416
9.405915 0.972567 -3.497111 -3.297964 4026.750 0.000000
0.998677 Mean dependent var 0.998429 S.D. dependent var 0.038545 Akaike info criterion 0.023772 Schwarz criterion 38.97111 F-statistic 1.118837 Prob(F-statistic)
会回函数变化为:
ˆ=-2.161038 + 1.017938LnX+0.415639LnX -0.22312LnT2 LnY23 (-2.609523) (42.15254) (2.536813) (1.546418)
R2=0.998677 20.998429 F=4026.750 D.W.=1.118837
这里D.W.值较高,且dl
下面对上式进行序列相关性的拉格朗日乘数检验。含一阶滞后残差项的辅助回归为
~ ~0.180530 - 0.011199LnX- 0.020667LnX +0.004944LnT2+0.473889ee2t1t3
(0.229269) ( -0.473366) (-0.133503) (0.355850) (1.735491)
R2=0.167219 2-0.054857 F=0.752982 D.W.=1.422791
于是,LM=19×0.167219=3.177161,该值小于显著性水平为5%,自由度为1的2分布的临界值为0.05
2
1=3.84,因此判断元模型不存在一阶序列相关性。
确定模型
ˆ=-2.161038 + 1.017938LnX+0.415639LnX -0.22312LnT2 LnY23
由于模型的回归结果,t统计量以及F统计量均显著,且不存在计量经济学问题,因此最后定型为此。
模型的应用分析
这些数据表明,财政支出,以及商品零售价格指数确实影响着我国的税收收入。财政对税收的影响是显著正相关的,这很容易理解,因为经济是收入的来源,只有提高产出,才有可能提高。这也说明国家财政支出增加,税收也会增加。而且其系数为0.984,远远高于商品零售价格的影响力。究其原因应该是:国家为了拉动经济增长,常常实施扩张性的财产政策,从而使经济的到发展,各项税收也就自然而然的有所增加,进而提高了税收总收入。零售商品物价指数对税收收入是正相关的。这很明显,物价指数升高,意味着物价上涨,物价上涨各个销售商的收入总额也就会变大,这样需要缴纳的各项税赋也就变大,从而,国家的税收收入就会明显地提高。
政策建议
税收作为社会生产力发展到一定阶段的产物,必然随着社会的发展而扩大。税收是国家参与一部分社会产品或国民收入分配与再分配所进行的经济活动,因此税收从一定程度上决定了国家的健康稳定发展,我国目前正处于经济体制转型期,市场机制还不完善,宏观方面,需要政府进行积极的宏观调控,实现产业结构调整,以及财政支出政策的改进。另外,我国应实行结构性减税,结合推进税制改革,用减税、退税或抵免的方式减轻税收负担,促进企业投资和居民消费,实行积极财政政策,促进国民经济稳健发展,从而对税收形成良性的影响。
但是,鉴于水平有限,文中难免出现一些错误。另外还存在一些我们难以解决的问题,请老师多多包涵!
关于税收收入增长的影响因素的实证分析
内容摘要:
一国的经济增长是以其财政收入的增长为前提的,而财政收入的增长又离不开税收。本文采用我国自1990年至2009年的税收收入的主要因素的相关统计数据进行的实证分析。选取的自变量有国内生产总值,财政支出、商品零售价格指数和城镇居民家庭人均可支配收入。然后,在收集了相关数据之后,通过建立多元线性回归模型,利用EVIEWS软件对模型进行了参数估计和检验,并加以修正。最后得出结论是财政支出和零售商品物价水平对我国税收收入有很大影响。
关键词: 税收收入 国内生产总值 财政支出 商品零售价格指数 城镇
居民家庭人均可支配收入 参数估计和检验 思考
导论: 税收是我国财政收入的基本因素,也影响着我国经济的发展。经济是
税收的源泉,经济决定税收,而税收又反作用于经济,这是税收与经济的一般原理。这几年来,中国税收收入的快速增长甚至“超速增长”引起了人们的广泛关注。科学地对税收增长进行因素分析和预测分析非常重要,对研究我国税收增长规律,制定经济政策有着重要意义。
影响税收收入的因素有很多,但据分析主要的因素可能有:①从宏观经济看,经济整体增长是税收增长的基本源泉,而国内生产总值是反映经济增长的一个重要指标。②公共财政的需求,税收收入是财政收入的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算支出所表现的公共财政的需求对当年的税收收入可能会有一定影响。③物价水平。我国的税制结构以流转税为主,以现行价格计算的GDP等指标和经营者的收入水平都与物价水平有关。④税收政策因素。我国自1978年以来经历了两次大的税制改革,一次是1984-1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。税制改革对税收增长速度的影响不是非常大。因此,可以从以上几个方面,分析各种因素对中国税收增长的具体影响。
为了全面反映中国税收增长的全貌,我们选用“国家财政收入“中的各项税收”(即税收收入)作为被解释变量,反映税收的增长;选择“国内生产总值”
(即GDP)作为经济整体增长水平的代表;选择“财政支出”作为公共财政需求的代表;选择“商品零售价格指数”作为物价水平的代表;选择城镇居民家庭人均可支配收入作为税收政策因素的代表。另外,由于财税体制的改革难以量化,而且从数据上看,1985年以后财税体制改革对税收增长影响不是很大,在此暂不考虑税制改革对税收增长的影响
模型设定:
为了具体分析各要素对提高我国税收收入的影响大小,选择能反映我们税收变动情况的“各项税收收入”为被解释变量,选择能影响税收收入的“国内生产总值”、“财政支出”、“ 商品零售价格指数”和“城镇居民家庭人均可支配收入”为解释变量。设定了一下经济学模型:
Y01X12X23X34X4 Y=税收收入(亿元)
X1=国内生产总值(亿元) X2财政支出(亿元) X3商品零售价格指数(亿元)
X4 城镇居民家庭人均可支配收入(亿元)
表1是由《中国统计年鉴》得到的1990到2009的相关数据 表1 税收收入时间序列表
资料来源《中国统计年鉴2010》
参数估计
利用Eviews软件,做LnY对、LnX1、LnX2、LnX3、LnX4的回归,回归结果如下(表2)
表 2
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:08 Sample: 1990 2009 Included observations: 20
Variable C LOG(X1) LOG(X2) LOG(X3) LOG(X4)
R-squared
Coefficient
-2.715236 0.931518 0.918078 0.338378 -1.022729
Std. Error
0.719658 0.284597 0.053848 0.146051 0.304190
t-Statistic
-3.772956 3.273111 17.04939 2.316850 -3.362137
Prob.
0.0018 0.0051 0.0000 0.0351 0.0043
9.405915
0.999133 Mean dependent var
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.998902 S.D. dependent var 0.032223 Akaike info criterion 0.015575 Schwarz criterion 43.19966 F-statistic 1.158070 Prob(F-statistic)
0.972567 -3.819966 -3.571033 4323.437 0.000000
根据表中数据,模型回归分析的结果为:
ˆ-2.715236+0.931518LnX+0.918078LnX+0.338378LnX-1.022729LnY123
LnX4
(-3.772956)(3.273111) (17.04939) (2.316850) (-3.362137)
R20.999133 2=0.998902 D.W.= 1.158070 F=4323.437
模型的检验及修正
(一) 经济意义检验:
ˆ=0.931518,ˆ=0.918078,ˆ0.338378,且0从上表可以看出,所作的参数估计123ˆ<1,0<ˆ<1,0<ˆ<1,均符合变量参数的确定范围,而的符号为负,<4123不符合经济意义,但是根据经验,怀疑可能是存在多重共线性,要看多重共线性检验的结果才能确定。
这里与理论分析和经验判断是一致的。 (二)统计意义检验
1、拟合优度检验(R2检验)
可决系数R20.999133,2=0.998902,这说明所建模型整体上对样本数据拟合很好,即解释变量“国内生产总值(X1)”、“财政支出(X2)”和“零售价格指数(X3)”被解释变量“各项税收收入(Y)”的绝大部分差异作了解释。
2、F检验
ˆ=ˆ=ˆ=0,给定显著性水平α=0.05,在F分布表中查出自由度为针对H0:123k-1=3和n-k=16的临界值Fα(3,16)=3.24,由表2中得到F=4323.437>F
α
ˆˆˆˆ,说明回归方程显著,(3,17)=3.24,应拒绝原假设H0:0123
即列入模型的解释变量“国内生产总值(X1)”、“财政支出(X2)”和“ 商品零售价格指数(X3)”联合起来确实对被解释变量“各项税收收入(Y)”有显著影响 3、t检验
分别针对H0:j=0(j=0,1,2,3),给定显著性水平α=0.05,查t分布表的自由度为n-k=16的临界值tnk=2.120。由表2中的数据可得,
2
ˆ、ˆ、ˆ对应的t统计量分别为-1.20114、0.506888、17.63061、ˆ、与12302.721708,其绝对值不全大于tnk=2.120,这说明在显著水平α=0.05下,
2
ˆ、ˆ能拒绝H:=0,也就是说,当在其他解释变量不变的情况下,只有0j23各个解释变量“国内生产总值(X1)”、“财政支出(X2)”和“ 商品零售价格指数(X3)”分别对被解释变量“各项税收收入(Y)”不全都有显著影响,这可能是由于多重共线性或自相关性的影响。 (三)计量经济检验 1、多重共线性检验
①用普通最小二乘法估计模型
ˆ-2.715236+0.931518LnX+0.918078LnX+0.338378LnX-1.022729 LnY123
(-3.772956)(3.273111) (17.04939) (2.316850) (-3.362137)
LnX4
R20.999133 2=0.998902 D.W.= 1.158070 F=4323.437
由于R2较大且接近于1,而且F=4323.437>F0.054,15=3.06,故认为税收收入与上述变量间总体线性关系显著。
②检验简单相关系数, LnX1,LnX2,LnX3,LnX4 的相关系数如下表所示
由表中数据发现LnX1,LnX2,LnX4之间存在高度相关性。
③找出最简单的回归形式 让LnY分别对LnX1、LnX2、LnX3、LnX4做回归如下: 将LnY与LnX1做回归得到结果如表3:
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:09 Sample: 1990 2009 Included observations: 20
Variable C LOG(X1)
R-squared
Coefficient
-3.425298 1.123575
Std. Error
0.499347 0.043610
t-Statistic
-6.859556 25.76417
Prob.
0.0000 0.0000
9.405915 0.972567 -0.703402 -0.603829 663.7924 0.000000
0.973599 Mean dependent var 0.972132 S.D. dependent var 0.162357 Akaike info criterion 0.474475 Schwarz criterion 9.034021 F-statistic 0.204664 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
将LnY与LnX2做回归得到结果如表4:
表 4
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:14 Sample: 1990 2009 Included observations: 20
Variable C LOG(X2)
R-squared
Coefficient
0.088902 0.974373
Std. Error
0.098794 0.010279
t-Statistic
0.899876 94.79376
Prob.
0.3801 0.0000
9.405915 0.972567 -3.284085 -3.184512 8985.857 0.000000
0.998001 Mean dependent var 0.997890 S.D. dependent var 0.044677 Akaike info criterion 0.035928 Schwarz criterion 34.84085 F-statistic 0.835853 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
将LnY与LnX3做回归得到结果如表5:
表 5
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:15 Sample: 1990 2009 Included observations: 20
Variable C LOG(X3)
R-squared
Coefficient
38.45026 -6.261920
Std. Error
16.61492 3.581876
t-Statistic
2.314201 -1.748223
Prob.
0.0327 0.0975
9.405915 0.972567 2.774124 2.873697 3.056284 0.097460
0.145148 Mean dependent var 0.097657 S.D. dependent var 0.923859 Akaike info criterion 15.36327 Schwarz criterion -25.74124 F-statistic 0.126701 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
将LnY与LnX4做回归得到结果如表6:
表 6
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/03/11 Time: 09:16 Sample: 1990 2009
Included observations: 20
Variable C LOG(X4)
R-squared
Coefficient
-2.159040 1.334218
Std. Error
0.512374 0.058920
t-Statistic
-4.213802 22.64447
Prob.
0.0005 0.0000
9.405915 0.972567 -0.453009 -0.353436 512.7720 0.000000
0.966087 Mean dependent var 0.964203 S.D. dependent var 0.184010 Akaike info criterion 0.609477 Schwarz criterion 6.530093 F-statistic 0.206327 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
回归结果如下:
ˆ=-3.425298 + 1.123575LnX ⑴ LnY1
(-6.859556)(25.76417)
R2=0.973599 D.W.=0.204664
ˆ=0.088902 + 0.974373LnX ⑵ LnY2
(0.889876)(94.79376)
R2=0.998001 D.W.=0.835853
ˆ=38.45026 - 6.261920LnXLnY3 ⑶
(2.314201)(-1.748223)
R2=0.145148 D.W.=0.126701
ˆ=-2.159040 + 1.334218LnX⑷LnY4 (-4.213802)(22.64447)
R2=0.966087 D.W.=0.206327
可见税收收入受财政支出的影响最大,选择⑵为初始的回归模型。 ④逐步回归
将其他解释变量分别倒入上述初始回归模型,以寻找最佳回归方程(如下表)
讨论:
第一步,在初始模型中分别引入X1,X3,X4,发现引入X1和X4之后,模型拟合优度反而略有下降, 引入X3,模型拟合优度提高,且变量也通过了T检验; 第二步,在引入X3的基础上,引入X1,发现引入X1时模型拟合优度下降,同时X1的参数未能通过T检验;
第三步,去掉X1,引入X4,你拟合优度有所下降,且X4的参数也未能通过T
检验。
第二步与第三步表明,X1与X4是多余的,因此,最终的税收收入函数应以
Y=F(X2,X3)为解释变脸的回归结果
新模型估计结果如下
ˆ=-1.821712 + 0.983727LnX + 0.392643LnX LnY23 (-2.193320)(97.67899) (2.313575)
R2=0.998480 D.W.=0.982623 F=5582.052 e2iRSS=0.027325
2、异方差检验: ①图示法检验:
~与LnX,LnX的散点图如下所模型普通最小二乘法得到的残差平方和e23i
2
示
.008.007.006.005
E^2
.004.003.002.001.000
8.0
8.5
9.0
9.510.010.511.011.5LOG(X2)
②利用G-Q检验法检验模型是否存在异方差性:
将原始数据按X2排成升序,去掉中间的4个数据,得到两个容量为8的子样本,对两个子样本分别做最小二乘回归,具体如下:
将时间定义为1990——1997,然后对LnY,C, LnX2,LnX3用OLS法求得下列结果
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 17:18 Sample: 1 8
Included observations: 8
Variable C LOG(X2) LOG(X3)
R-squared
Coefficient
-0.006791 0.981312 0.010906
Std. Error
0.527731 0.018617 0.113832
t-Statistic
-0.012869 52.71154 0.095810
Prob.
0.9902 0.0000 0.9274
8.438715 0.402034 -4.724968 -4.695178 1438.607 0.000000
0.998265 Mean dependent var 0.997571 S.D. dependent var 0.019813 Akaike info criterion 0.001963 Schwarz criterion 21.89987 F-statistic 2.515405 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
ˆ=-0006791 + 0.981312LnX+0.010906LOG(X3) 子样本1:LnY2 (-0.012869) (52.71154) (0.095810)
R2=0.998262 RSS1=0.001963
将时间定义为2002——2009,然后对LnY,C, LnX2,LnX3用OLS法求得下列结果
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 17:22 Sample: 13 20
Included observations: 8
Variable C LOG(X2) LOG(X3)
R-squared
Coefficient
-8.114573 0.984184 1.755189
Std. Error
2.576841 0.032251 0.579753
t-Statistic
-3.149038 30.51666 3.027478
Prob.
0.0254 0.0000 0.0292
10.39035 0.456537 -3.557531 -3.527741 575.7455 0.000001
0.995677 Mean dependent var 0.993947 S.D. dependent var 0.035518 Akaike info criterion 0.006308 Schwarz criterion 17.23013 F-statistic 1.592419 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
ˆ=-8.114573 + 0.984184LnX+1.755189LnX 子样本2:LnY23 (-3.149038) (30.5166) (3.027478)
R2=0.995677 RSS2=0.006308
计算F统计量:F=RSS2/RSS1=0.006308/0.001963=3.213448803 在5%的显著性水平下,自由度为(6,6)的F分布的临界值为4.28,由
RSS2/RSS1=3.213448803
~2i为对原始模型进行普通最小二乘回归得到的残差③再采用怀特检验。记e
平房项,将其与X1与X2及其平房项作辅助回归,得到
White Heteroskedasticity Test: F-statistic
0.620228 Probability 2.838423 Probability
Std. Error
2.582147 0.010132 0.000526 1.094448 0.116883
t-Statistic
0.572519 -0.643645 0.704190 -0.566302 0.566971
Coefficient
1.478328 -0.006521 0.000371 -0.619788 0.066269
0.655013 0.585219
Prob.
0.5755 0.5295 0.4921 0.5796 0.5791
0.001366 0.001747 -9.566706 -9.317773 0.620228 0.655013
Obs*R-squared
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 12/04/11 Time: 20:56 Sample: 1990 2009 Included observations: 20
Variable C LOG(X2) (LOG(X2))^2 LOG(X3) (LOG(X3))^2 R-squared
0.141921 Mean dependent var -0.086900 S.D. dependent var 0.001821 Akaike info criterion 4.97E-05 Schwarz criterion 100.6671 F-statistic 2.392125 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
ˆ=1.478328 - 0.006521LnX+0.000371LnX2-0.619778LnX LnY232(0.572519)(-0.643645) (0.704190) (-0.566302) +0.066269LnX3
2
(0.566971)
R2=0.141921
显然解释变量及其平方项没有通过T检验,且怀特统计量nR2=20×
0.141921=2.83842,该值小于自由度为4,的2分布的临界值,因此,在5的显著性水平下,接受同方差假设,即圆模型不存在异方差。
3、序列相关性检验: ①图示法检验:
~与时间t以及e~与e~的关系图如下。
从残差项ettt1
从趋势图看,曲线与X轴有六个交点,大部分点位于X轴两侧,模型可能存在序列相关,且为政序列相关;从散点图看,大部分点位于一三象限,结论同上。模型是否确实存在正序列相关,有待进一部检验。
②D-W检验
从模型设定来看,没有违背D-W检验的假设条件,因此可以用D-W检验模型是
否存在自相关。作如下回归结果
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 16:06 Sample: 1990 2009 Included observations: 20
Variable C LOG(X2) LOG(X3)
R-squared
Coefficient
-1.821712 0.983727 0.392643
Std. Error
0.830573 0.010071 0.169713
t-Statistic
-2.193320 97.67899 2.313575
Prob.
0.0425 0.0000 0.0335
9.405915 0.972567 -3.457816 -3.308456 5582.052 0.000000
0.998480 Mean dependent var 0.998301 S.D. dependent var 0.040092 Akaike info criterion 0.027325 Schwarz criterion 37.57816 F-statistic 0.982623 Prob(F-statistic)
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
根据表中估计的结果,有D.W.=0.982623,给定的显著性水平α=0.05,查 Durbin-Watson表,n=20,k=3,得dl=1.10,du=1.54
因为D.W.统计量为0
由于时间序列容易出现伪回归现象,再此,Y,X1与X2都是时间序列,而且他们确实表现出共同的变动趋势,因此有理由怀疑是较高的R2部分是由这一共同的变化趋势带来的。为了排除时间序列模型中这种随时间变动而具有的的共同变化趋势的影响,解决方案是在模型中引入时间趋势项,在将这种影响分离出来。在此,我引入的时间变量为T(T=1,2,„„20)以平方的形式出现,回归结果变化为
Dependent Variable: LOG(Y) Method: Least Squares Date: 12/07/11 Time: 21:31
Sample: 1990 2009 Included observations: 20
Variable C LOG(X2) LOG(X3) LOG(T^2)
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient Std. Error
-2.161038 0.828135 1.017938 0.024149 0.415639 0.163843 -0.022312 0.014428
t-Statistic
-2.609523 42.15254 2.536813 -1.546418
Prob.
0.0190 0.0000 0.0220 0.1416
9.405915 0.972567 -3.497111 -3.297964 4026.750 0.000000
0.998677 Mean dependent var 0.998429 S.D. dependent var 0.038545 Akaike info criterion 0.023772 Schwarz criterion 38.97111 F-statistic 1.118837 Prob(F-statistic)
会回函数变化为:
ˆ=-2.161038 + 1.017938LnX+0.415639LnX -0.22312LnT2 LnY23 (-2.609523) (42.15254) (2.536813) (1.546418)
R2=0.998677 20.998429 F=4026.750 D.W.=1.118837
这里D.W.值较高,且dl
下面对上式进行序列相关性的拉格朗日乘数检验。含一阶滞后残差项的辅助回归为
~ ~0.180530 - 0.011199LnX- 0.020667LnX +0.004944LnT2+0.473889ee2t1t3
(0.229269) ( -0.473366) (-0.133503) (0.355850) (1.735491)
R2=0.167219 2-0.054857 F=0.752982 D.W.=1.422791
于是,LM=19×0.167219=3.177161,该值小于显著性水平为5%,自由度为1的2分布的临界值为0.05
2
1=3.84,因此判断元模型不存在一阶序列相关性。
确定模型
ˆ=-2.161038 + 1.017938LnX+0.415639LnX -0.22312LnT2 LnY23
由于模型的回归结果,t统计量以及F统计量均显著,且不存在计量经济学问题,因此最后定型为此。
模型的应用分析
这些数据表明,财政支出,以及商品零售价格指数确实影响着我国的税收收入。财政对税收的影响是显著正相关的,这很容易理解,因为经济是收入的来源,只有提高产出,才有可能提高。这也说明国家财政支出增加,税收也会增加。而且其系数为0.984,远远高于商品零售价格的影响力。究其原因应该是:国家为了拉动经济增长,常常实施扩张性的财产政策,从而使经济的到发展,各项税收也就自然而然的有所增加,进而提高了税收总收入。零售商品物价指数对税收收入是正相关的。这很明显,物价指数升高,意味着物价上涨,物价上涨各个销售商的收入总额也就会变大,这样需要缴纳的各项税赋也就变大,从而,国家的税收收入就会明显地提高。
政策建议
税收作为社会生产力发展到一定阶段的产物,必然随着社会的发展而扩大。税收是国家参与一部分社会产品或国民收入分配与再分配所进行的经济活动,因此税收从一定程度上决定了国家的健康稳定发展,我国目前正处于经济体制转型期,市场机制还不完善,宏观方面,需要政府进行积极的宏观调控,实现产业结构调整,以及财政支出政策的改进。另外,我国应实行结构性减税,结合推进税制改革,用减税、退税或抵免的方式减轻税收负担,促进企业投资和居民消费,实行积极财政政策,促进国民经济稳健发展,从而对税收形成良性的影响。
但是,鉴于水平有限,文中难免出现一些错误。另外还存在一些我们难以解决的问题,请老师多多包涵!