Fcnki_空间计量模型选择及其模拟分析_陶长琪

第31卷第8期2014年8月统计研究

StatisticalＲesearchVol．31，No.8Aug．2014

空间计量模型选择及其模拟分析

陶长琪

杨海文

也是空间计量模型实证分析的关键步内容提要：空间计量模型的选择是空间计量建模的一个重要组成部分，

LM检验、骤。本文对空间计量模型选择中的Moran指数检验、似然函数、三大信息准则、贝叶斯后验概率、马尔可夫链蒙特卡罗方法做了详细的理论分析。在此基础上，通过Matlab编程进行模拟分析。结果表明：在扩充的空间计量模型族中进行模型选择时，基于OLS残差的Moran指数与LM检验均存在较大的局限性，对数似然值最大原则LM检验只针对SEM和SAＲ模型的区分有效，缺少区分度，信息准则对大多数模型有效，但是也会出现误选。而当H算法时，给出恰当的M-充分利用了似然函数和先验信息的MCMC方法，具有更高的检验效度，特别是在较大的样本条件下得到了完全准确的判断，且对不同阶空间邻接矩阵的空间计量模型的选择也非常有效。

H抽样关键词：空间计量模型；模型选择；MCMC；M-中图分类号：O212

文献标识码：A

文章编号：1002－4565（2014）08－0088－09

SpatialEconometricModelSelectionanditsSimulationAnalysis

TaoChangqi＆YangHaiwen

Abstract：Spatialeconometricmodelselectionisanimportantpartofthespatialeconometricmodeling，isalsoakeystepinspatialeconometricmodelempiricalanalysis．WehavemadeadetailedtheoreticalanalysisonMoranindextest，LMtest，likelihoodfunction，threeinformationcriteria，Bayesianposteriorprobability，MarkovchainMonteCarlomethodofspatialeconometricmodelselectionanalysis．Onthisbasis，wemakesimulationanalysisbyusingMatlabprogramming．Theresultsshowthat，inthemodelclustersofextendedspatialeconometrics，MoranindexandLMtestbasedonOLSresidualsaresomelimitations，theprincipleofmaximumloglikelihoodvaluesislackofdifferentiation，LMtestiseffectivetoonlydistinguishbetweenSEMandSAＲmodel．Theinformationcriterioniseffectiveonmostmodels，butalsoappearwrongchoice．WhenM-Halgorithmgivenappropriate，MCMCmethodhashighertestvaliditybecauseofmakingfulluseofboththelikelihoodfunctionandthepriorinformation，andhascompletelyaccuratejudgmentinlargersamples．Moreover，MCMCmethodisalsoveryeffectivefordifferentorderspatialadjacencymatrixofthespatialeconometricmodelselection．

Keywords：SpatialEconometricModel；ModelSelection；MCMC；M-HSampling

一、引言

观测值存在独立和非独立两种可能，传现实中，

统的统计理论建立在独立观测值假定基础之上。而地理区域空间之间及其经济现象之间，空间依赖性的存在打破了经典计量经济学模型关于样本相互独立的基本假设，这时要准确地获取数据的空间关系，则恰当地描述和运用空间特性对空间交互作用进行研究是很重要的。空间单元上的某种经济现象或某一属性总是与相邻空间单元上的现象或属性相关，我们需要通过空间计量模型来体现这些关系。

空间计量实证研究过程中，在获得数据之后，通

常希望能够得到一个能够较好地描述数据的空间特

征和经济现象的模型，并把后续的分析工作建立在假定这个模型的数据生成过程与真实模型相符的基础上。这一过程的前提和基础就是研究者选择了恰当的空间计量模型，并进行了正确的估计。因此模型选择是数据分析的重要组成部分，是模型建立的基础，也是实证研究的一个关键环节，在计量模型的实证研究中具有非常重要的意义。但是专门研究计量模型选择的文献并不多，而对空间计量模型的研

*本文获国家自然基金项目（编号：71073073，71273122）的资助。

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·89·

空间计量模型究更少。随着空间计量模型的扩展，

的选择问题变成了空间建模必须要解决的一个重要

问题。一些学者分别从频率学派和贝叶斯学派的角度提出了一些模型选择的方法与技巧，如Burridge（1980）提出了用于检验非空间模型还是SEM模型

［1］

Anselin（1988）提出了使用LM统计的LM检验，

［2］

量对非空间模型还是SAＲ模型的选择问题。

SAＲMA：y=ρW1y+Xβ+μ，μ=ε+λW2ε，ε

～N（0，σεIn）

（7）（8）

SAC：y=ρW1y+Xβ+μ，μ=λW2μ+ε，ε

2～N（0，σεIn）

2SDM：y=ρWy+Xβ+WXθ+ε，ε～N（0，σεIn）（9）

SDEM：y=Xβ+WXθ+μ，μ=λWμ+ε，ε

～N（0，（10）σεIn）

Anselin等（1996）提出了空间误差模型和空间自回

［3］

归模型的判别准则。Hepple（1995）和Lesage（1997）又将贝叶斯方法应用到空间计量，进一步促

［4］［5］

。Jeffreys进了空间计量的贝叶斯理论发展

（1961）最早将贝叶斯理论应用到普通计量模型的

我们把模型（1）至（10）统称为空间模型族中的模型，其中模型（1）至（3）仅在误差项中存在空间相关性，模型（4）仅在解释变量中存在空间相关性，模型（5）至（6）仅在被解释变量中存在空间相关性，模型（7）至（10）存在混合的空间相关性。模型（1）、（6）、（9）是三种最常见的空间计量模型，分别称为空间误差模型（SEM）、空间自回归模型（SAＲ）、空间杜宾模型（SDM）。SAC模型为既包括了空间滞后，又包括了空间误差项的一般空间模型。一阶空间自回归模型（FAＲ）、空间误差分量模型（SEC）和FAＲ类似于空间杜宾误差模型（SDEM）并不常见，时间序列分析中的一阶自回归模型，主要用于研究相邻地区的被解释变量的变动如何影响被研究地区的被解释变量。SEC由Kelejian和Ｒobinson分别在1993、1995年提出，SMA的最大不同是误差与SEM、项中不含有空间相关性系数，且误差项由两个独立误差分量构成。SDEM是LeSage和Pace提出的空

［8］

间杜宾误差模型，只是对SEM模型中增加了解释变量的空间滞后项。

（二）基于统计检验的空间计量模型选择方法

1.Moran指数检验。

1948年Moran提出了全局Moran指数（Moran’sI）：I=

e'We/S

e'e/N

选择之中

［6］

，而Hepple（2004）最早将贝叶斯理论应

［7］

用到空间计量模型的选择之中。据我们对国内

外相关文献的持续跟踪，并未发现有使用MCMC算

法对空间计量模型的选择进行深入分析，并通过模拟对相关选择方法进行有效性评判的文献。于是，我们对空间计量模型选择相关的Moran指数检验、LM检验、似然函数、三大信息准则、贝叶斯后验概率方法进行了理论分析。并在此基础上给出了合理的MCMC算法，通过对各种选择方法在扩充的空间计量模型族中进行对比模拟分析，发现传统的模型选择方法都有一定的局限性，有的甚至会出现误选，而MCMC方法很好地解决了这一问题。

二、空间计量模型选择方法分析

当前空间计量模型的实证研究中，很多国内的文献均是基于LM检验在空间自相关和空间误差模型中进行选择和分析，而LM检验确实存在局限性。同时，空间计量模型已极为丰富，我们有必要根据实际的研究问题在更广泛的空间计量模型中做出合理的选择。

（一）空间计量模型族

现有的空间计量模型可以列为以下10种①

SEM：y=Xβ+μ，μ=λWμ+ε，ε～N（0，σIn）（1）

2SMA：y=Xβ+μ，μ=ε+λWε，ε～N（0，σIn）

e表示使用OLS估计模型得到的估计残其中，

S表示空间加权矩阵的全部元素之和。当W为差，

S=N，行标准化的矩阵时，从而上式可简化为：

e'WeI=

e'e方差为且Moran指数近似服从期望为E（I），

V（I）的正态分布：

基本文只针对横截面的空间计量模型进行了分析。另外，

于表格大小，文章篇幅及工作量的考虑，本文模拟分析部分并未对

①

10种模型全部进行模拟，而是对不同的模型选择方法进行了有针对性的模拟分析。

（2）（3）（4）（5）（6）

SEC：y=XX+μ，μ=Wη+ε，η～N（0，σηIn），2

ε～N（0，σεIn）

2SLX：y=Xβ1+WXXβ2+ε，ε～N（0，σεIn）2FAＲ：y=ρWy+ε，ε～N（0，σεIn）

SAＲ：y=ρWy+Xβ+ε，ε～N（0，σI）

εn

·90·

I－E（I）

～N（0，1）

其中M=1－X（X'X）－K），V（I）

－1

统计研究2014年8月

H0：Y=Xβ+ε，ε～N（0，σI）；H1：ε=λWε+μ或ε=λwμ+μ

，E（I）=tr（MW）/（N

tr（（MW）2）

｛tr（MWMW'）｝

（2）LM-Lag统计量—不存在空间残差相关时

空间自回归效应的LM检验。检验的原假设和备择假设分别为：

H0：Y=Xβ+ε，H1：Y=ρWY+Xβ+ε，ε

～N［0，σI］

+［tr（MW）］｝/（（N－k）（N－k+2））－E（I）2，

Moran指数也相当于使用OLS估计We=eγ+μ得到参数γ的估计值。

Moran指数反映的是空间邻接或邻近的区域单元属性值的相似程度，通过Moran指数可以检验模型是否存在空间相关性。该检验的原假设是模型不I］=E［存在空间相关性，当原假设成立时，γ］=E［0；当拒绝原假设时，并不能够确定存在空间相关性的具体模型形式，从而无法利用Moran指数检验确

定空间效应是空间自回归还是空间残差相关。即Moran指数只能检验空间相关性是否存在，对空间模型的选择起不到作用。

2.基于LM检验的空间计量模型选择方法。Bera和Burridge（1980）提出LM-Error检验［1］，

Yoon（1992）对LM-Error检验进行改进，提出稳健LM-error检验（ＲobustLM-Error）［9］。Anselin（1988）Bera和Yoon（1992）进一步lag检验［2］，提出了LM-lag检验，lag（ＲobustLM-改进LM-提出了稳健LM-LAG）检验［9］。这4个LM检验的统计量分别为：

2LM－Error=

（3）ＲobustLM-Error统计量—存在空间自回归

时空间残差相关的LM检验。原假设仍然是模型残差不存在空间相关。备择假设情况同上：

H0：Y=ρWY+Xβ+ε，0，；H1：εε～N［σI］=λWε+μ或ε=λWμ+μ（4）ＲobustLM-Lag统计量—存在空间残差相关性时空间自回归效应的LM检验。检验的原假设和备择假设分别是：

H0：Y=Xβ+λWε+μ，0，；H1：Yμ～N［σI］=ρWY+Xβ+λWε+μ

根据LM的4个统计量构建判别过程及准则为：先进行OLS回归，得到回归模型的残差，再基于Error和LM-残差进行LM诊断。计算标准的LM-Lag统计量（即非稳健的统计量形式），如果这两者都不显著，保持OLS的结果，这种情况下Moran指数与LM检验统计量发生了矛盾，一般是由于异方差性和非正态分布导致Moran指数计算失真；如果Error显著，其中之一显著，如LM-则选择空间误差

Error显著，模型；LM-则选择空间滞后模型。如果是

两者都显著，则进行稳健的LM诊断，这时需要计算ＲobustLM-Error和ＲobustLM-Lag统计量。如果ＲobustLM-Error显著，则选择空间误差模型；如果是ＲobustLM-Lag显著，则选择空间滞后模型。显然LM主要给出了空间误差模型与空间自回

归模型的选择方法，而对于其他空间计量模型的选择并不能有效解决。所以必须进一步寻找其他的空间计量模型选择方法。而在非空间模型中我们常见LogL），到使用对数似然函数值（Loglikelihood，似然

LＲ）、比率（LikelihoodＲatio，赤池信息准则（Akaikeinformationcriterion，AIC），施瓦茨准则（Schwartz

criterion，SC）等进行模型选择，在空间计量中检验原理相同，但在计算上更加复杂。

（三）基于空间计量模型极大似然值的选择方法

1.空间计量模型极大似然值的计算。极大似然估计是模型选择方法的一个重要理论

～χ2（1）

［e'Wy/（e'e/N）］

～χ2（1）LM－LAG=

Ｒ

ＲobustLM－Error=（e'Wy/s2－TＲ－1e'We/s2）2/（T－TＲ）～χ（1）

ＲobustLM－LAG=（e'Wy/s2－e'We/s2）2/（Ｒ－T）～χ（1）

其中，s=e'e/N，T=tr（W+W'W），Ｒ^^^

=（WXβ）'M（WXβ）（e'e/N）+tr（W2+W'W），β为原假设中模型参数的OLS估计。以上4个检验统计量都渐进服从自由度为1的卡方分布。这4个检验统计量分别对应着空间计量经济学模型LM检验的四种情况：

（1）LM-Error统计量—不存在空间自回归时空间残差相关的LM检验。原假设是模型残差不存在空间相关。备择假设表示残差存在空间效应，残差的空间效应又包括空间残差自相关和空间残差移动平均两种情况：

－1

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·91·

基础，多元线性回归模型与空间计量模型的对数似然函数值的计算方法具有类比性，只是推导的过程中要特别注意雅可比行列式的作用。限于篇幅，未给出推导过程，有兴趣的读者可向作者索取。当得到极大似然值之后，通常认为似然值较大的模型较优，但是在实际使用中发现很多时候模型的似然值并没有显著差异，因而失去可比性，于是在似然值的基础上增加惩罚机制，便产生了模型选择的信息准则方法。在空间计量模型中的信息准则计算公式和一般模型相同，只是对数似然值按空间计量模型对数似然值计算方法得到。

2.基于极大似然值构建信息准则①。1973年日本著名统计学教授赤池弘次（H．Akaike）在研究信息论中时间序列定阶问题时，提出了综合权衡模型适用性和复杂性的AIC定阶准则。对于所建模型，赤池信息准则（Akaikeinformationcriterion，AIC）为：

AIC=－2ln（L）+2k

k代表模型其中Ln（L）表示极大似然函数值，

AIC信息准则优先考虑AIC值最小中的参数个数，

的那一个模型。第一项表示所建模型与真实分布的

偏差，通常模型越复杂，估计偏差越小，但待估参数增多，从而第二项增大；反之，模型越简单，待估参数少，第二项就小，但所建模型与真实分布偏差增大，。AIC是寻找可以最所以第二项是一个“惩罚项”

好地解释数据但包含最少待估参数的模型，权衡了模型的适用性与复杂性，突破了之前单单从模型拟合度思考的倾向。

尽管AIC在实际应用中相对似然函数值来说取得了更好效果，但也有不足之处：在样本数据具有较高偏度或峰度时，惩罚项是无法弥补极大似然估计在估计参数时的损失。同时，备选模型具有相同AIC准则也会无能为力。关键是在结构和参数时，AIC准则中，模型参数个数的惩罚因子权重始终为常数2，即它与样本容量n无关。随着样本容量的增大，模型的拟合误差随之放大，导致样本容量趋于AIC准则选择的拟合模型不收敛于真实无穷大时，模型，它通常比真实模型所含的未知参数个数要多。于是，很多学者尝试对惩罚项进行修改，来平衡模型过度拟合和拟合不足问题。

Akaike于1976年提为了对AIC准则进行改进，

出贝叶斯信息准则（Bayesianinformationcriterion，

BIC），也称施瓦兹准则（Schwarzcriterion，SC），BIC的值为－2ln（L）+kln（n）。同时Schwartz在1978年基于无先验信息的贝叶斯理论的最大后验密度，

［10］

也得出同样的判别准则。BIC将未知参数个数的惩罚权重由常数2变成了样本容量的对数，当样

BIC惩罚项的值大于AIC惩本容量大于等于8时，

罚项的值，即通常情况下BIC要求更精简的模型。BIC信息准则之外，另外，除了以上AIC、还有汉Quinncriterion，HQ），HQ的南—奎因准则（Hannan-值为－2ln（L）+ln（ln（n））k。

nMk）=－2ln这些准则也可以概括为Crit（L，

（L）+Pen（n，k），k即都是－2ln（L）加上一个与n、相关的惩罚项。这些信息准则均“鼓励”数据拟合的优良性，但是尽量避免出现过度拟合的情况。增加待估参数（与解释变量的个数对应）的数目提高。当样本了拟合的优良性，但也增加了“惩罚力度”

数和待估参数个数相同的条件下（即去除了惩罚项BIC、HQ最小就极大似然值最大和AIC、的影响），

完全一致了。BIC和HQ倾向于选择比AIC更精简AIC显得过于保守②。的模型，

另外，Burnham和Anderson（2002）还分别给出了数据存在过度离散和小样本两种情况下的信息准［11］

则。数据过度离散情况下的信息准则QAIC（Quasi-AIC）定义为：

QAIC=2k－ln（L）

VIF

其中VIF为方差膨胀因子。在小样本情况下的信息准则QAIC表示为：

QAK'=QAIC+

2k（k+1）n－k－1

即QAIC可以调整过度离散或缺乏拟合的情况。

如它信息准则在模型选择时具有很好的优势，

对嵌套模型和非嵌套模型均有效，且可以比较具有不同误差分布的模型，但是在空间计量模型的模拟分析过程中发现它们检验的效度并不高。需要进一

在常见软件中，进行空间计量模型的估计时，都没有输出

信息准则值，可以根据给出的对数似然函数值利用下面介绍的公式

①

进行计算，本文模拟部分的信息准则值是使用matlab计算得到的。

②要注意的是Eviews软件中给出的信息准则值是样本平均意义上的信息准则值，详见EViews8UsersGuideI，Quantile

（11．89），441页。本文模拟分析部分的信息Ｒegression，Chapter32，

准则值是根据似然函数值通过matlab2013a手动计算得到的。

·92·

步使用更为复杂的方法—贝叶斯模型选择方法。

（四）基于模型后验概率的贝叶斯选择方法

统计研究2014年8月

然函数中的积分相对容易，可以通过解析和数值积分实现。对于相对复杂的情况需要将似然函数在极大值点处使用泰勒展开式做近似估计。对于特别复杂的情况，可以利用马尔可夫链蒙特卡罗（MarkovchainMonteCarlo，MCMC）方法。

2.后验机会比与后验概率的计算。

利用边际似然值，可以进一步计算后验机会比。利用后验机会比和Jeffreys判断标准，可以对空间计量模型进行选择。

2，…，n），设存在n个候选模型Mi（i=1，对应

2，…，n），的参数向量为θi（i=1，则Mi为所选模型的后验概率为：

p（Mi|y）=

p（y|Mi）p（Mi）

p（y|Mi）p（Mi）+p（y|M2）p（M2）+…+p（y|Mn）p（Mn）p（Mi）是模型Mip（y|Mi）是边际似然值，其中，

显然有∑p（Mi|y）=1，的先验概率，数据信息支持

i=1n

要得到后验概率和后验机会比（OddsＲatio）进

行模型选择，必须首先计算出边际似然函数值。

1.空间计量模型中边际似然函数值的计算。

以空间误差自回归（SEM）模型y=Xβ+μ，μ=λWμ+ε，ε～N（0，σ）为例，设W的最大特征值

Kmin（如果W为行标准化和最小特征值分别为Kmax、

空间加权矩阵，则Kmax=1），记D=1/Kmax－1/Kmin，P=I－λW，V－1=P'P，根据似然函数的估计方法

可得SEM模型的似然函数为：L=（2π）

|P|1－1

exp－n2（y－Xβ）'V（y－Xβ）2σσ11p（θ）=，令p（β，σ）∝，可得后验分布：

Dσ

11|P|11

p（β，θ，σ|y）=

p（y）Dσ（2πσ1）n/2

－n/2

()

1－1

exp－2（y－Xβ）'V（y－Xβ）2σ

σ积分后，得到关于θ的边际上式关于β、

似然：

p（θ|

y）

1p（y）

11n－k

ΓD2（2π）n－k/2

()

各个模型的程度，可用如下后验机会比表示：

p（y|Mi）p（M）p（Mi|y）=POij=

p（Mi|y）p（y|Mi）p（Mj）

p（y|Mi）p（Mi）

=BEij×PＲij

p（y|Mj）p（Mj）

()

|P|1**1/2n－k/2|X'X|S

y*=Py=y－θWy，S其中X=PX=X－θWX，

=s2是y*关于X*回归得到的残差平方和。再由贝

BEij称为贝叶斯因子，PＲij称为先验机会其中，

比，上式变形可得BEij=POij/PＲij，即贝叶斯因子也等于后验机会比除以先验机会比。如果先验信息对模型没有偏好（先验机会比PＲij=1），则模型的贝叶斯因子完全由后验机会比决定。多个模型进行比较时，也可以通过后验机会比来计算后验概率，只需要将上式右端取倒数展开后再取倒数便得：

p（Mi|y）=

PO1i+PO2i+…+POmi

从以上推理可以看出，使用贝叶斯方法选择模型的关键就是计算各个模型的边际似然值。得到边际似然值结合先验概率便可计算出后验概率、贝叶斯因子和后验机会比。

由于上边介绍的边际似然函数的计算在空间计量模型中存在较大困难，通常需要采用MCMC方法进行计算。

（五）基于MCMC的空间计量模型选择方法贝叶斯分析中，应用最为广泛的MCMC方法主

Hastings（M-H）抽样。要有Gibbs抽样和Metropolis-Gibbs抽样是由StuartGeman和DonaldGeman

将上式乘p叶斯公式p（θ|y）p（y）=p（y|θ）p（θ），

（y）后关于θ积分便得边际似然函数：

p（y）=1S（n－k）/2

dθ

11n－k

（n－k）/2ΓD（2π）2

()∫

|P|

|X*'X*|1/2

可记为由于上式是关于模型SEM推导得到的，

p（y|MSEM），类推可以得到其他空间模型的边际似然函数。

Carlin和Louis给出了几种利用传统基于MC的边际似然函数P（y|M）的估计方法，但这些方法

［12］

对较高维的模型却难以实现。Gelfand和Hastings分别给出了基于Gibbs抽样和M-H抽样的］［13］［14

。边际计算方法，有效地解决了高维的情况似然函数值的计算有三种情况：①分析法；②数值近

似计算；③模拟计算。分析法计算主要针对边际似

·92·

步使用更为复杂的方法—贝叶斯模型选择方法。

（四）基于模型后验概率的贝叶斯选择方法

统计研究2014年8月

2.后验机会比与后验概率的计算。

利用边际似然值，可以进一步计算后验机会比。利用后验机会比和Jeffreys判断标准，可以对空间计量模型进行选择。

2，…，n），设存在n个候选模型Mi（i=1，对应

2，…，n），的参数向量为θi（i=1，则Mi为所选模型的后验概率为：

p（Mi|y）=

p（y|Mi）p（Mi）

p（y|Mi）p（Mi）+p（y|M2）p（M2）+…+p（y|Mn）p（Mn）p（Mi）是模型Mip（y|Mi）是边际似然值，其中，

显然有∑p（Mi|y）=1，的先验概率，数据信息支持

i=1n

要得到后验概率和后验机会比（OddsＲatio）进

行模型选择，必须首先计算出边际似然函数值。

1.空间计量模型中边际似然函数值的计算。

以空间误差自回归（SEM）模型y=Xβ+μ，μ=λWμ+ε，ε～N（0，σ）为例，设W的最大特征值

Kmin（如果W为行标准化和最小特征值分别为Kmax、

空间加权矩阵，则Kmax=1），记D=1/Kmax－1/Kmin，P=I－λW，V－1=P'P，根据似然函数的估计方法

可得SEM模型的似然函数为：L=（2π）

|P|1－1

exp－n2（y－Xβ）'V（y－Xβ）2σσ11p（θ）=，令p（β，σ）∝，可得后验分布：

Dσ

11|P|11

p（β，θ，σ|y）=

p（y）Dσ（2πσ1）n/2

－n/2

()

1－1

exp－2（y－Xβ）'V（y－Xβ）2σ

σ积分后，得到关于θ的边际上式关于β、

似然：

p（θ|

y）

1p（y）

11n－k

ΓD2（2π）n－k/2

()

各个模型的程度，可用如下后验机会比表示：

p（y|Mi）p（M）p（Mi|y）=POij=

p（Mi|y）p（y|Mi）p（Mj）

p（y|Mi）p（Mi）

=BEij×PＲij

p（y|Mj）p（Mj）

()

|P|1**1/2n－k/2|X'X|S

y*=Py=y－θWy，S其中X=PX=X－θWX，

=s2是y*关于X*回归得到的残差平方和。再由贝

BEij称为贝叶斯因子，PＲij称为先验机会其中，

p（Mi|y）=

PO1i+PO2i+…+POmi

由于上边介绍的边际似然函数的计算在空间计量模型中存在较大困难，通常需要采用MCMC方法进行计算。

（五）基于MCMC的空间计量模型选择方法贝叶斯分析中，应用最为广泛的MCMC方法主

Hastings（M-H）抽样。要有Gibbs抽样和Metropolis-Gibbs抽样是由StuartGeman和DonaldGeman

将上式乘p叶斯公式p（θ|y）p（y）=p（y|θ）p（θ），

（y）后关于θ积分便得边际似然函数：

p（y）=1S（n－k）/2

dθ

11n－k

（n－k）/2ΓD（2π）2

()∫

|P|

|X*'X*|1/2

可记为由于上式是关于模型SEM推导得到的，

p（y|MSEM），类推可以得到其他空间模型的边际似然函数。

Carlin和Louis给出了几种利用传统基于MC的边际似然函数P（y|M）的估计方法，但这些方法

［12］

对较高维的模型却难以实现。Gelfand和Hastings分别给出了基于Gibbs抽样和M-H抽样的］［13］［14

。边际计算方法，有效地解决了高维的情况似然函数值的计算有三种情况：①分析法；②数值近

似计算；③模拟计算。分析法计算主要针对边际似

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·93·

（1984）在图像分析马尔科夫随机场（MarkovＲandomField，MＲF）方法的研究中提出的。Gibbs抽样的成功在于它利用满条件分布将多个相关参数的复杂问题转换为每次只需处理一个参数的简单问题。但是实际问题中，某些参数的分量的满条件分布会较难

H抽抽样，这时可以使用比Gibbs抽样更一般的M-H算法）。M-H抽样是一类最为常用的样（也称M-MCMC方法，1970它由Metropolis等在1953年提出，年Hastings对此进行了推广。MCMC方法的核心就

是要获得合适的Markov链，使其平稳分布就是待抽样的目标分布（在贝叶斯分析中目标分布一般为后

H抽样就是用于产生所要验分布π（θ|x）），而M-Markov链的一种算法。

M-H算法的Markov链产生过程如下：

①选择合适的建议分布（Proposaldistribution）

（t）

q（·θ）（与目标分布接近且易于抽样）；

（0）

②从某个分布中产生θ（通常直接给定）；

r/vi～IDχ2（r）/rr～Γ（m，k）

［15］

和先验分布设定方法参照了Geweke（1993）

Lesage（1997）［16］的方法。y是n×1的被解释变x由n×k的被解释变量矩阵构成，k为解释变量量，

e为n×1的非常数方差的正态分布随机变的个数，

量。ρ的先验分布设为贝塔分布，β的先验分布设为r、d0=0时，正态分布，σ设为伽玛分布，当v0=0、σv2，…，相对方差项（v1，的先验变为扩散先验分布，

vn）是需要估计的固定的未知参数。显然用普通的方法，需要用n个观测值估计n+k+2个参数，会出

现自由度不足的问题，但是贝叶斯方法不会受到自由度的约束，因为本文为vi设定了有信息的先验分vi为服从独立的χ2（r）/r分布（此分布只有一个布，

即本文考虑了vi先验的均值均相等，先验参数r），

vv接近于1，当r越来越大时，的方差为2/r，导致VMarkov的同方差正态分布；=In，ε变成满足Gauss-当V≠In时又能充分利用了异常值降低此类观测值使模型得到更好的估计结果。且r越大异的影响，

常值和非常数方差的影响越小。本文通过添加了一个单参数r的先验分布既考虑了异方差的影响又克服了自由度的局限，达到估计n个vv的目的，这也体现了用贝叶斯方法解决复杂问题的优势所在。

H抽样法时，使用MCMC的M-需给出恰当的M-H算法。以SAＲ为例，主要算法过程①如下：

①首先分别给定参数向量β（0）、σ（0）、ρ（0）的初

p使用正态分布N（c，始值，σ（0）T）抽取样本β（1），**

c*=（X'X+T－1）（β|σ2ρ0）～N（c，σ（0）T），（0），

－1

直到Markov链达到平稳③重复下面过程，

状态：

·从qθ中产生一个新状态θ，计算接受概率（t）*（t）*（t）*

α（θ，其中γ（θ，θ）=min｛γ（θ，θ）｝，θ）

*（t）*

π（θ|x）q（θ|θ）

0，1］上的=；随机产生一个［（t）*（t）

π（θ|x）q（θ|θ）

（t）*

0，1］，θ），均匀分布随机数u～U［如果u≤α（θ，Markov链的状态变为θ*，则接受建议状态，否则拒（t）

绝建议状态，Markov链的状态仍然停留在θ；增加t，返回这一步的开始部分。

（t）

在接受概率的计算中只需知道目标分布π（θ|x）的核即可，正则化常数可以未知。从理论上讲，建议分布的选取是任意的，但在实际计算中，建议分

H算法的关布的选取对于计算效率影响很大。M-（t）（t）*

键是两个函数：q（·θ）决定怎样基于θ得到θ；

（t）**

θ）决定得到的θ是否保留。本文的α（θ，

MCMC方法也是基于M-H算法。

（X'（In－ρ（0）W）y+T－1c），T*=（X'X+T－1）参数向量β（1）代替β0；

－1

，用

b*）抽取样本σ2②使用逆伽玛分布IG（a，（1），**

p（σ2|β（1），b*），b*ρ0）～IG（a，其中a=a+n/2，

在空间计量的贝叶斯分析方法中，给出参数的

恰当先验分布是重要的一环。以SAＲ为例，考虑带有异方差的空间回归模型：

y=ρWy+Xβ+ε

V=diag（v1，v2，…，vn）ε～N（0，σV），d0）σ～Γ（v0，b）ρ～B（a，T）β～N（c，

=b+（Ay－Xβ（1））'（Ay－Xβ（1））/2，A=In－ρ（0）W；

H算法从p（ρ|β（1），③使用M-σ（1））抽取ρ（1），

其中p（ρ|β，σ）∝

p（ρ，β，α|D）

∝|In－ρW|exp

ρ，β，σ|D）

(

－

（Ay－Xβ）'（Ay－Xβ），D表示样本数据，接2σ2

①

)

本算法的全部过程由存在异方差与同方差两个迭代分支，

为避免叙述重复冗长，仅给出了后者。

·94·

统计研究2014年8月

p（*|，）*

，1，ρ=ρ+c受概率α（ρ，ρ）=min

p（ρ|β，σ）

{}

表2

TestLM-ErrorLM-LAGＲobust

LM-ErrorＲobustLM-LAG

基于LM的空间计量模型检验的模拟结果

Value统计量P值统计量P值统计量P值统计量P值

SAＲ24.1210.00035.5980.0000.0000.99813.3790.000

SEM8.6520.0039.2370.0029.7510.0020.0500.824

SAＲMA1.7820.1829.0960.0032.1750.14016.5600.000

SDM19.4900.00046.9530.0003.9060.04831.5430.000

SAC5.2940.02122.9820.0004.5390.03321.2420.000

～N（0，1），c为调整参数。使用ρ（1）更新ρ（0）返回到①。r=在本文中初始值的设置为ρ=0.5，σ=1.0，4，a=1，b=1，v0=0，d0=0，c=（0，0，…，0）'k，T=Ik*le

+12

，M-H抽样的初始调整参数都设为c=0.2，

总抽样1200次，丢弃前200次进行分析。

三、空间计量模型选择的模拟分析

本文生成相对的小样本和大样本数据的空间加

Lesage、Hepple等经常分别来源于Anselin、权矩阵，

使用49阶和3107阶矩阵①。模拟数据的生成中放

入了非显著变量做干扰，自回归项系数ρ=0.8，误差自相关或误差移动平均的系数λ=0.5，解释变量和杜宾项系数都是全为1的向量。本文首先使用相LM检验和信息准则分对的小样本进行Moran指数、

析，然后再分别使用相对的小样本和大样本进行MCMC方法的对比模拟分析。

（一）Moran指数检验的模拟分析

对由49阶邻接矩阵生成的5个空间模型SAＲ、SEM、SAＲMA、SDM、SAC分别进行Moran指数检验，得到表1所示的结果。

表1

ValueMoran指数I标准化后的IP值期望标准差

注：

注：在1%的显著性水平下，χ（1）临界值为6.635，χ（2）临界值为9.210。

LAG统计量非常显著，著，而ＲobustLM-可推断真实

的模型为SAＲ模型，这与事实非常吻合。同理，根据文中所述的判别准则，当真实的生成数据过程为SEM模型时，LM检验推断得到的模型也为SEM模型，这也与事实完全吻合。但是，当真实的数据生成过程为其他三个模型时，这4个统计量都无法给出正确的选择，如SDM和SAC模型的4个统计量都显著，从而LM检验根本无法做出判断。这也说明了LM检验只是针对SAＲ和SEM模型区分有效，所以LM检验具有很大的局限性。当LM检验无法给出判别时，部分学者通过比较哪类统计量更显著来

LM的检验结果也进一步说明数选择模型。此时，

据的真实生成过程可能为SAＲ与SEM之外的其他

模型。

（三）基于信息准则的模型选择模拟分析SEM、SDM、SAC的模拟数据，对空间模型SAＲ、

计算对数似然值和三个信息准则值得到的结果见

表3。

从表3的前4行可以看出，当真实的模型为SAＲ时，却选择SDM模型进行估计得到的对数似然SDM和SAC同时采用SAＲ、值最大（－40.2931），

模型进行估计的对数似然值都只有微小的差异，即对数似然值最大原则在此由于缺少区分度，失去了

SEM、SAC模型选择的能力。当真实模型是SAＲ、SEM、SAC模型进行分析时，时，正确选择SAＲ、模型

BIC和HQ均为最小，的AIC、即信息准则取得了较好的效果。但遗憾的是，当真实模型是SDM时，错

误地选择SAC模型时，三个信息准则值均最小。所

分别为美国俄亥俄州的犯罪数据和1980年总统选举数据中的空间加权矩阵，详见Anselin的SpatialEconometrics：Methodsand

①

Models和Pace和Barry的Quickcomputationofspatialautoregressiveestimators，GeographicalAnalysis。

空间计量模型的Moran指数检验

SAＲ0.4665.9450.000－0.0230.082

＊＊＊

SEM0.2082.80940.005－0.0230.082

＊＊

SAＲMA－0.0000.2800.780

SDM0.4565.819

＊＊＊

SAC0.1702.352

＊

0.019＊－0.023

0.000

－0.023－0.0230.082

0.082

＊＊＊＊

5%和1%水平上显著。、和＊分别表示在10%、

从表1的Moran指数检验的P值可以看出，在

5%的显著性水平下，SAＲ、SEM、SDM、SAC生成数据模型均存在显著的空间相关性，但对于SAＲMA生成数据模型并没有给出正确的检验结果。同时moran指数检验并不能区分存在空间相关的模型差异。

（二）基于LM检验的模型选择模拟分析SEM、SAＲMA、SDM、SAC对五个空间模型SAＲ、

的模拟数据进行LM检验可以得到表2的结果。从表2可以看出，当真实的生成数据过程为SAＲ模型时，LM-Error统计量和LM-LAG统计量都Error检验和Ｒobust显著，进一步进行ＲobustLM-LM-LAG检验时，Error统计量不显发现ＲobustLM-

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·95·

表3

MODELSAＲ

空间计量模型的信息准则值模拟结果

ICAICBICHQLn（L）

SAＲ87.328893.004385.4055－40.664480.508786.184178.5853－37.254398.8296104.505196.9063－46.414877.373483.048875.45－35.6867

SEM99.9272105.602798.0038－46.963674.337280.012672.4138－34.1686124.0054129.6809122.082－59.002792.392298.067790.4689－43.1961

SDM88.586196.153486.0216－40.293176.132583.699873.568－34.066396.4888104.05693.9243－44.244478.91486.481376.3495－35.457

SAC89.85197.418387.2865－40.925581.560889.128178.9963－36.780482.433290.000479.8687－37.216671.453679.020868.8891

不同的空间加权矩阵的选择也是空间计量模型选择的一个重要方面。以1～7阶最近邻加权矩阵为例，各个模型的真实数据都由4阶最近邻空间加权矩阵生成。当各模型分别选择1～7来估计时，计算所选择的模型的后验概率如表5所示。

表5

基于不同邻接矩阵的49个样本和3107个样本数据的MCMC方法的模拟结果

MODELW1W2W3W4W5W6

FAＲ

SAＲ

SEM

SDM

SEMAICBICHQLn（L）

SDMAICBICHQLn（L）

0.0000.0000.0000.0000.0010.0000.0000.0000.0010.0000.0010.0000.0110.0000.0000.0000.0010.0000.2010.0000.1100.0000.0000.0000.5981.0000.6051.0000.4221.0000.9991.0000.1140.0000.1490.0000.3550.0000.0000.0000.1950.0000.0330.0000.0640.0000.0000.000

SACAICBICHQLn（L）

但是以信息准则值在此模型的选择上给出了误判，

相对前面的模型选择方法来说，依然表现不错。

（四）基于MCMC的空间计量模型选择模拟分析

SAＲ、SEM和SDM时，真实模型是FAＲ、使用和以上分析完全相同的生成数据，分别在49个样本和3107个样本的情况下，计算各种选择模型的后验概率，可以得到如表4所示的结果。

表4

49个样本和3107个样本下利用MCMC方法计算的各种选择模型的后验概率

MODELFAＲSAＲSEM

FAＲ

SAＲ

SEM

SDM

－31.7268

注：模拟值左侧对应的模型表示真实数据生成过程的模型，上方对应的模型表示实际所选择的模型，故对角线上的数据恰好为真实的数据生成过程和实际选择的模型相同时得到的结果。

W70.0920.0000.0110.0000.0380.0000.0000.000

第二列注：表5中每栏的第一列均对应49个样本的计算结果，

对于3107个样本的计算结果。

SAＲ、从表5可以看出，在49个样本条件下，

SEM、SDM、SAC模型选择4阶最近邻空间加权矩阵时得到的模型后验概率最大。但是当阶数与4接近SAＲ、SEM、SAC三个模型得到的模型后验概率时，

也比较大。但是总体上，选择真实模型的后验概率均是最大的，这完全符合实际。特别是在大样本的情况下，使用MCMC方法估计真实数据生成的模型的后验概率均接近于1，其他情况均接近于0。从而可以看出，在较大的样本情况下MCMC方法在选择基于不同阶空间邻接矩阵的空间计量模型选择上也具有较高效度。

从以上全部模拟结果来看，基于OLS残差与似然函数值的模型选择方法，均存在一定的局限性。在非MCMC的方法中，信息准则总的来说基本有

H算法的条件下具效，而MCMC方法在给定恰当M-有更高效度，特别是对于大样本的情况具有绝对的

优势。

0.7010.7170.0000.0000.0000.0000.0000.0000.0100.0040.9460.9820.0080.0000.0000.0000.2650.2650.0000.0000.7750.8850.0000.000

SDM0.0250.0150.0540.0180.2170.1161.0001.000注：表4中行表示实际所选择的模型，列表示真实数据生成过程对应的模型。表中每栏的第一列均对应49个样本的计算结果，第二列对应3107个样本的计算结果。

在49个样本情况下当真实模从表4可以看出，

SAＲ、SEM和SDM时，型是FAＲ、正确选择它们的模型后验概率均比错误选择时的概率值大。而这4种

情况在3107个样本条件下正确选择真实模型的后验概率有进一步的提高。显然MCMC算法在两种情况下均未出现误判。且在3107个样本情况下，能够根据后验概率做出准确的模型选择，效果很突出。

（五）基于MCMC的不同权重矩阵的模型选择模拟分析

当选择了确定类型的空间计量模型之后，对于

四、结论与展望

空间计量模型越来越丰富，基于实际问题，利用

获得的数据选择恰当的模型也变得越来越重要。空间计量模型的选择方法虽然有很多，但是传统方法都有针对性和局限性。当扩充选择模型的范围时，基于OLS估计残差的Moran指数检验也并不能给出全部空间计量模型的空间相关性的判断，基于OLS估计残差的LM检验主要针对SAＲ和SEM模型的选择有效，特别需要注意的是当LM检验的判

·96·

统计研究

［6］Jeffreys，H．

Press，1961.

TheoryofProbability［M］．

2014年8月OxfordUniversity

应该进一步判断真实的数别准则无法给出结论时，

据生成过程为其他模型的可能。基于似然函数值的三大信息准则，对于空间计量模型的选择来说，也存在不能准确判断的情况。而近几十年研究的MCMC方法，在空间计量模型选择上却体现出了优势。也即仅利用OLS估计的残差或似然函数，对于相对复杂的空间计量模型，在扩展的模型族中存在着利用信息上的不足，而既利用了似然函数又利用了参数先验信息的MCMC方法能够解决这一问题。本文对如何在空间计量模型中进行恰当的模型选择做了较为全面的探讨，获得了具有重要参考价值的结论。限于篇幅，本文并没有探讨所有的空间计量模型的选择方法和模拟分析。实际上要实现本文中介绍的10大空间计量模型的MCMC选择方

H算法，仍然存在一定的困难，如SAＲMA模型的M-法由于存在两个空间相关系数而变得复杂，依然不

能得到恰当的算法设定。另外，模型的元选择（modelmeta-selection）问题、模型平均（modelaveraging）问题，以及空间面板模型的选择问题，并未在本文中进行探讨，这有待于后续的进一步研究。

参考文献

［1］Burridge，P．OntheCliff-Ordtestforspatialautocorrelation［J］．

JournaloftheＲoyalStatisticalSocietyB，1980，（42）：107－108.［2］Anselin，L．

Lagrangemultipliertestdiagnosticsforspatial

［7］Hepple，L．W．Bayesianmodelchoiceinspatialeconometrics，in

AdvancesinEconometrics：Vol18：SpatialandSpatiotemporalEconometrics［M］．Oxford：ElsevierLtd，2004.

［8］LeSage，J．P．andPaceＲ．K．Introductiontospatialeconometrics

［M］．BocaＲaton，US：CＲCPressTaylor＆FrancisGroup，2009.［9］BeraA，YoonM．Simplediagnostictestsforspatialdependence

［Ｒ］．Workingpaper，Champaign，1992.

［10］Schwarz，GideonE．Estimatingthedimensionofamodel［J］．

AnnalsofStatistics，1978，6（2）：461－464.

［11］Burnham，K．P．andAnderson，D．Ｒ．ModelSelectionand

MultimodelInference：APractical-TheoreticApproach［M］．Springer-Verlag，2002.

［12］CarlinBP，LouisTA．BayesandempiricalBayesmethodsfordata

analysis［J］．StatisticsandComputing，19977（2）：153－154.［13］Gelfand，A．E．，Smith，A．F．M．Sampling-basedapproachesto

calculatingmarginalDensities［J］．JournaloftheAmericanStatisticalAssociation，1990（85）：398－409.

［14］Hastings，W．K．MonteCarlosamplingmethodsusingMarkovchains

andTheirapplications［J］．Biometrika，1970（57）：97－109.［15］Geweke，John．BayesianTreatmentoftheIndependentStudentt

LinearModel［J］．JournalofAppliedEconometrics，1993（8）：19－40.

［16］LeSage，J．P．Bayesianestimationofspatialautoregressivemodels

［J］．InternationalＲegionalScienceＲeview，1997（20）：113－129.

作者简介

1967年生，2004年毕业于江西陶长琪，男，江西临川人，财经大学产业经济研究院，获经济学博士学位，现为江西财经大学信息管理学院教授，博士生导师，中国数量经济学常务理事。研究方向为数量经济理论与应用。

1976年生，杨海文，男，陕西南郑人，井冈山大学数理学院讲师，现为江西财经大学信息管理学院数量经济学在读博士研究生。研究方向为空间计量经济学。

dependenceandspatialheterogeneity［J］．GeographicalAnalysis，1988（20）：1－17.

［3］Anselin，Luc，etal．Simplediagnostictestsforspatialdependence

［J］．

ＲegionalScienceandUrbanEconomics，1996（1）：

Bayesiantechniquesinspatialandnetwork

77－104.［4］Hepple，L．W．

econometrics：ModelComparisonandposteriorodds［J］．EnvironmentandPlanningA27，1995，447－469.

［5］LeSage，J．P．Bayesianestimationofspatialautoregressivemodels

［J］．InternationalＲegionalScienceＲeview，1997（20）：113－29.

(责任编辑:方原)

第31卷第8期2014年8月统计研究

StatisticalＲesearchVol．31，No.8Aug．2014

空间计量模型选择及其模拟分析

陶长琪

杨海文

也是空间计量模型实证分析的关键步内容提要：空间计量模型的选择是空间计量建模的一个重要组成部分，

H抽样关键词：空间计量模型；模型选择；MCMC；M-中图分类号：O212

文献标识码：A

文章编号：1002－4565（2014）08－0088－09

SpatialEconometricModelSelectionanditsSimulationAnalysis

TaoChangqi＆YangHaiwen

Keywords：SpatialEconometricModel；ModelSelection；MCMC；M-HSampling

一、引言

观测值存在独立和非独立两种可能，传现实中，

空间计量实证研究过程中，在获得数据之后，通

常希望能够得到一个能够较好地描述数据的空间特

*本文获国家自然基金项目（编号：71073073，71273122）的资助。

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·89·

空间计量模型究更少。随着空间计量模型的扩展，

的选择问题变成了空间建模必须要解决的一个重要

问题。一些学者分别从频率学派和贝叶斯学派的角度提出了一些模型选择的方法与技巧，如Burridge（1980）提出了用于检验非空间模型还是SEM模型

［1］

Anselin（1988）提出了使用LM统计的LM检验，

［2］

量对非空间模型还是SAＲ模型的选择问题。

SAＲMA：y=ρW1y+Xβ+μ，μ=ε+λW2ε，ε

～N（0，σεIn）

（7）（8）

SAC：y=ρW1y+Xβ+μ，μ=λW2μ+ε，ε

2～N（0，σεIn）

2SDM：y=ρWy+Xβ+WXθ+ε，ε～N（0，σεIn）（9）

SDEM：y=Xβ+WXθ+μ，μ=λWμ+ε，ε

～N（0，（10）σεIn）

Anselin等（1996）提出了空间误差模型和空间自回

［3］

归模型的判别准则。Hepple（1995）和Lesage（1997）又将贝叶斯方法应用到空间计量，进一步促

［4］［5］

。Jeffreys进了空间计量的贝叶斯理论发展

（1961）最早将贝叶斯理论应用到普通计量模型的

［8］

间杜宾误差模型，只是对SEM模型中增加了解释变量的空间滞后项。

（二）基于统计检验的空间计量模型选择方法

1.Moran指数检验。

1948年Moran提出了全局Moran指数（Moran’sI）：I=

e'We/S

e'e/N

选择之中

［6］

，而Hepple（2004）最早将贝叶斯理论应

［7］

用到空间计量模型的选择之中。据我们对国内

外相关文献的持续跟踪，并未发现有使用MCMC算

二、空间计量模型选择方法分析

（一）空间计量模型族

现有的空间计量模型可以列为以下10种①

SEM：y=Xβ+μ，μ=λWμ+ε，ε～N（0，σIn）（1）

2SMA：y=Xβ+μ，μ=ε+λWε，ε～N（0，σIn）

e表示使用OLS估计模型得到的估计残其中，

S表示空间加权矩阵的全部元素之和。当W为差，

S=N，行标准化的矩阵时，从而上式可简化为：

e'WeI=

e'e方差为且Moran指数近似服从期望为E（I），

V（I）的正态分布：

基本文只针对横截面的空间计量模型进行了分析。另外，

于表格大小，文章篇幅及工作量的考虑，本文模拟分析部分并未对

①

10种模型全部进行模拟，而是对不同的模型选择方法进行了有针对性的模拟分析。

（2）（3）（4）（5）（6）

SEC：y=XX+μ，μ=Wη+ε，η～N（0，σηIn），2

ε～N（0，σεIn）

2SLX：y=Xβ1+WXXβ2+ε，ε～N（0，σεIn）2FAＲ：y=ρWy+ε，ε～N（0，σεIn）

SAＲ：y=ρWy+Xβ+ε，ε～N（0，σI）

εn

·90·

I－E（I）

～N（0，1）

其中M=1－X（X'X）－K），V（I）

－1

统计研究2014年8月

H0：Y=Xβ+ε，ε～N（0，σI）；H1：ε=λWε+μ或ε=λwμ+μ

，E（I）=tr（MW）/（N

tr（（MW）2）

｛tr（MWMW'）｝

（2）LM-Lag统计量—不存在空间残差相关时

空间自回归效应的LM检验。检验的原假设和备择假设分别为：

H0：Y=Xβ+ε，H1：Y=ρWY+Xβ+ε，ε

～N［0，σI］

+［tr（MW）］｝/（（N－k）（N－k+2））－E（I）2，

Moran指数也相当于使用OLS估计We=eγ+μ得到参数γ的估计值。

定空间效应是空间自回归还是空间残差相关。即Moran指数只能检验空间相关性是否存在，对空间模型的选择起不到作用。

2.基于LM检验的空间计量模型选择方法。Bera和Burridge（1980）提出LM-Error检验［1］，

2LM－Error=

（3）ＲobustLM-Error统计量—存在空间自回归

时空间残差相关的LM检验。原假设仍然是模型残差不存在空间相关。备择假设情况同上：

H0：Y=Xβ+λWε+μ，0，；H1：Yμ～N［σI］=ρWY+Xβ+λWε+μ

Error显著，模型；LM-则选择空间滞后模型。如果是

LＲ）、比率（LikelihoodＲatio，赤池信息准则（Akaikeinformationcriterion，AIC），施瓦茨准则（Schwartz

criterion，SC）等进行模型选择，在空间计量中检验原理相同，但在计算上更加复杂。

（三）基于空间计量模型极大似然值的选择方法

1.空间计量模型极大似然值的计算。极大似然估计是模型选择方法的一个重要理论

～χ2（1）

［e'Wy/（e'e/N）］

～χ2（1）LM－LAG=

Ｒ

ＲobustLM－Error=（e'Wy/s2－TＲ－1e'We/s2）2/（T－TＲ）～χ（1）

ＲobustLM－LAG=（e'Wy/s2－e'We/s2）2/（Ｒ－T）～χ（1）

其中，s=e'e/N，T=tr（W+W'W），Ｒ^^^

－1

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·91·

AIC=－2ln（L）+2k

k代表模型其中Ln（L）表示极大似然函数值，

AIC信息准则优先考虑AIC值最小中的参数个数，

的那一个模型。第一项表示所建模型与真实分布的

好地解释数据但包含最少待估参数的模型，权衡了模型的适用性与复杂性，突破了之前单单从模型拟合度思考的倾向。

Akaike于1976年提为了对AIC准则进行改进，

出贝叶斯信息准则（Bayesianinformationcriterion，

BIC），也称施瓦兹准则（Schwarzcriterion，SC），BIC的值为－2ln（L）+kln（n）。同时Schwartz在1978年基于无先验信息的贝叶斯理论的最大后验密度，

［10］

也得出同样的判别准则。BIC将未知参数个数的惩罚权重由常数2变成了样本容量的对数，当样

BIC惩罚项的值大于AIC惩本容量大于等于8时，

nMk）=－2ln这些准则也可以概括为Crit（L，

数和待估参数个数相同的条件下（即去除了惩罚项BIC、HQ最小就极大似然值最大和AIC、的影响），

完全一致了。BIC和HQ倾向于选择比AIC更精简AIC显得过于保守②。的模型，

另外，Burnham和Anderson（2002）还分别给出了数据存在过度离散和小样本两种情况下的信息准［11］

则。数据过度离散情况下的信息准则QAIC（Quasi-AIC）定义为：

QAIC=2k－ln（L）

VIF

其中VIF为方差膨胀因子。在小样本情况下的信息准则QAIC表示为：

QAK'=QAIC+

2k（k+1）n－k－1

即QAIC可以调整过度离散或缺乏拟合的情况。

如它信息准则在模型选择时具有很好的优势，

对嵌套模型和非嵌套模型均有效，且可以比较具有不同误差分布的模型，但是在空间计量模型的模拟分析过程中发现它们检验的效度并不高。需要进一

在常见软件中，进行空间计量模型的估计时，都没有输出

信息准则值，可以根据给出的对数似然函数值利用下面介绍的公式

①

进行计算，本文模拟部分的信息准则值是使用matlab计算得到的。

②要注意的是Eviews软件中给出的信息准则值是样本平均意义上的信息准则值，详见EViews8UsersGuideI，Quantile

（11．89），441页。本文模拟分析部分的信息Ｒegression，Chapter32，

准则值是根据似然函数值通过matlab2013a手动计算得到的。

·92·

步使用更为复杂的方法—贝叶斯模型选择方法。

（四）基于模型后验概率的贝叶斯选择方法

统计研究2014年8月

2.后验机会比与后验概率的计算。

利用边际似然值，可以进一步计算后验机会比。利用后验机会比和Jeffreys判断标准，可以对空间计量模型进行选择。

2，…，n），设存在n个候选模型Mi（i=1，对应

2，…，n），的参数向量为θi（i=1，则Mi为所选模型的后验概率为：

p（Mi|y）=

p（y|Mi）p（Mi）

p（y|Mi）p（Mi）+p（y|M2）p（M2）+…+p（y|Mn）p（Mn）p（Mi）是模型Mip（y|Mi）是边际似然值，其中，

显然有∑p（Mi|y）=1，的先验概率，数据信息支持

i=1n

要得到后验概率和后验机会比（OddsＲatio）进

行模型选择，必须首先计算出边际似然函数值。

1.空间计量模型中边际似然函数值的计算。

以空间误差自回归（SEM）模型y=Xβ+μ，μ=λWμ+ε，ε～N（0，σ）为例，设W的最大特征值

Kmin（如果W为行标准化和最小特征值分别为Kmax、

空间加权矩阵，则Kmax=1），记D=1/Kmax－1/Kmin，P=I－λW，V－1=P'P，根据似然函数的估计方法

可得SEM模型的似然函数为：L=（2π）

|P|1－1

exp－n2（y－Xβ）'V（y－Xβ）2σσ11p（θ）=，令p（β，σ）∝，可得后验分布：

Dσ

11|P|11

p（β，θ，σ|y）=

p（y）Dσ（2πσ1）n/2

－n/2

()

1－1

exp－2（y－Xβ）'V（y－Xβ）2σ

σ积分后，得到关于θ的边际上式关于β、

似然：

p（θ|

y）

1p（y）

11n－k

ΓD2（2π）n－k/2

()

各个模型的程度，可用如下后验机会比表示：

p（y|Mi）p（M）p（Mi|y）=POij=

p（Mi|y）p（y|Mi）p（Mj）

p（y|Mi）p（Mi）

=BEij×PＲij

p（y|Mj）p（Mj）

()

|P|1**1/2n－k/2|X'X|S

y*=Py=y－θWy，S其中X=PX=X－θWX，

=s2是y*关于X*回归得到的残差平方和。再由贝

BEij称为贝叶斯因子，PＲij称为先验机会其中，

p（Mi|y）=

PO1i+PO2i+…+POmi

由于上边介绍的边际似然函数的计算在空间计量模型中存在较大困难，通常需要采用MCMC方法进行计算。

（五）基于MCMC的空间计量模型选择方法贝叶斯分析中，应用最为广泛的MCMC方法主

Hastings（M-H）抽样。要有Gibbs抽样和Metropolis-Gibbs抽样是由StuartGeman和DonaldGeman

将上式乘p叶斯公式p（θ|y）p（y）=p（y|θ）p（θ），

（y）后关于θ积分便得边际似然函数：

p（y）=1S（n－k）/2

dθ

11n－k

（n－k）/2ΓD（2π）2

()∫

|P|

|X*'X*|1/2

可记为由于上式是关于模型SEM推导得到的，

p（y|MSEM），类推可以得到其他空间模型的边际似然函数。

Carlin和Louis给出了几种利用传统基于MC的边际似然函数P（y|M）的估计方法，但这些方法

［12］

对较高维的模型却难以实现。Gelfand和Hastings分别给出了基于Gibbs抽样和M-H抽样的］［13］［14

。边际计算方法，有效地解决了高维的情况似然函数值的计算有三种情况：①分析法；②数值近

似计算；③模拟计算。分析法计算主要针对边际似

·92·

步使用更为复杂的方法—贝叶斯模型选择方法。

（四）基于模型后验概率的贝叶斯选择方法

统计研究2014年8月

2.后验机会比与后验概率的计算。

利用边际似然值，可以进一步计算后验机会比。利用后验机会比和Jeffreys判断标准，可以对空间计量模型进行选择。

2，…，n），设存在n个候选模型Mi（i=1，对应

2，…，n），的参数向量为θi（i=1，则Mi为所选模型的后验概率为：

p（Mi|y）=

p（y|Mi）p（Mi）

p（y|Mi）p（Mi）+p（y|M2）p（M2）+…+p（y|Mn）p（Mn）p（Mi）是模型Mip（y|Mi）是边际似然值，其中，

显然有∑p（Mi|y）=1，的先验概率，数据信息支持

i=1n

要得到后验概率和后验机会比（OddsＲatio）进

行模型选择，必须首先计算出边际似然函数值。

1.空间计量模型中边际似然函数值的计算。

以空间误差自回归（SEM）模型y=Xβ+μ，μ=λWμ+ε，ε～N（0，σ）为例，设W的最大特征值

Kmin（如果W为行标准化和最小特征值分别为Kmax、

空间加权矩阵，则Kmax=1），记D=1/Kmax－1/Kmin，P=I－λW，V－1=P'P，根据似然函数的估计方法

可得SEM模型的似然函数为：L=（2π）

|P|1－1

exp－n2（y－Xβ）'V（y－Xβ）2σσ11p（θ）=，令p（β，σ）∝，可得后验分布：

Dσ

11|P|11

p（β，θ，σ|y）=

p（y）Dσ（2πσ1）n/2

－n/2

()

1－1

exp－2（y－Xβ）'V（y－Xβ）2σ

σ积分后，得到关于θ的边际上式关于β、

似然：

p（θ|

y）

1p（y）

11n－k

ΓD2（2π）n－k/2

()

各个模型的程度，可用如下后验机会比表示：

p（y|Mi）p（M）p（Mi|y）=POij=

p（Mi|y）p（y|Mi）p（Mj）

p（y|Mi）p（Mi）

=BEij×PＲij

p（y|Mj）p（Mj）

()

|P|1**1/2n－k/2|X'X|S

y*=Py=y－θWy，S其中X=PX=X－θWX，

=s2是y*关于X*回归得到的残差平方和。再由贝

BEij称为贝叶斯因子，PＲij称为先验机会其中，

p（Mi|y）=

PO1i+PO2i+…+POmi

由于上边介绍的边际似然函数的计算在空间计量模型中存在较大困难，通常需要采用MCMC方法进行计算。

（五）基于MCMC的空间计量模型选择方法贝叶斯分析中，应用最为广泛的MCMC方法主

Hastings（M-H）抽样。要有Gibbs抽样和Metropolis-Gibbs抽样是由StuartGeman和DonaldGeman

将上式乘p叶斯公式p（θ|y）p（y）=p（y|θ）p（θ），

（y）后关于θ积分便得边际似然函数：

p（y）=1S（n－k）/2

dθ

11n－k

（n－k）/2ΓD（2π）2

()∫

|P|

|X*'X*|1/2

可记为由于上式是关于模型SEM推导得到的，

p（y|MSEM），类推可以得到其他空间模型的边际似然函数。

Carlin和Louis给出了几种利用传统基于MC的边际似然函数P（y|M）的估计方法，但这些方法

［12］

对较高维的模型却难以实现。Gelfand和Hastings分别给出了基于Gibbs抽样和M-H抽样的］［13］［14

。边际计算方法，有效地解决了高维的情况似然函数值的计算有三种情况：①分析法；②数值近

似计算；③模拟计算。分析法计算主要针对边际似

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·93·

是要获得合适的Markov链，使其平稳分布就是待抽样的目标分布（在贝叶斯分析中目标分布一般为后

H抽样就是用于产生所要验分布π（θ|x）），而M-Markov链的一种算法。

M-H算法的Markov链产生过程如下：

①选择合适的建议分布（Proposaldistribution）

（t）

q（·θ）（与目标分布接近且易于抽样）；

（0）

②从某个分布中产生θ（通常直接给定）；

r/vi～IDχ2（r）/rr～Γ（m，k）

［15］

和先验分布设定方法参照了Geweke（1993）

Lesage（1997）［16］的方法。y是n×1的被解释变x由n×k的被解释变量矩阵构成，k为解释变量量，

e为n×1的非常数方差的正态分布随机变的个数，

vn）是需要估计的固定的未知参数。显然用普通的方法，需要用n个观测值估计n+k+2个参数，会出

现自由度不足的问题，但是贝叶斯方法不会受到自由度的约束，因为本文为vi设定了有信息的先验分vi为服从独立的χ2（r）/r分布（此分布只有一个布，

即本文考虑了vi先验的均值均相等，先验参数r），

H抽样法时，使用MCMC的M-需给出恰当的M-H算法。以SAＲ为例，主要算法过程①如下：

①首先分别给定参数向量β（0）、σ（0）、ρ（0）的初

p使用正态分布N（c，始值，σ（0）T）抽取样本β（1），**

c*=（X'X+T－1）（β|σ2ρ0）～N（c，σ（0）T），（0），

－1

直到Markov链达到平稳③重复下面过程，

状态：

·从qθ中产生一个新状态θ，计算接受概率（t）*（t）*（t）*

α（θ，其中γ（θ，θ）=min｛γ（θ，θ）｝，θ）

*（t）*

π（θ|x）q（θ|θ）

0，1］上的=；随机产生一个［（t）*（t）

π（θ|x）q（θ|θ）

（t）*

0，1］，θ），均匀分布随机数u～U［如果u≤α（θ，Markov链的状态变为θ*，则接受建议状态，否则拒（t）

绝建议状态，Markov链的状态仍然停留在θ；增加t，返回这一步的开始部分。

（t）

在接受概率的计算中只需知道目标分布π（θ|x）的核即可，正则化常数可以未知。从理论上讲，建议分布的选取是任意的，但在实际计算中，建议分

H算法的关布的选取对于计算效率影响很大。M-（t）（t）*

键是两个函数：q（·θ）决定怎样基于θ得到θ；

（t）**

θ）决定得到的θ是否保留。本文的α（θ，

MCMC方法也是基于M-H算法。

（X'（In－ρ（0）W）y+T－1c），T*=（X'X+T－1）参数向量β（1）代替β0；

－1

，用

b*）抽取样本σ2②使用逆伽玛分布IG（a，（1），**

p（σ2|β（1），b*），b*ρ0）～IG（a，其中a=a+n/2，

在空间计量的贝叶斯分析方法中，给出参数的

恰当先验分布是重要的一环。以SAＲ为例，考虑带有异方差的空间回归模型：

y=ρWy+Xβ+ε

V=diag（v1，v2，…，vn）ε～N（0，σV），d0）σ～Γ（v0，b）ρ～B（a，T）β～N（c，

=b+（Ay－Xβ（1））'（Ay－Xβ（1））/2，A=In－ρ（0）W；

H算法从p（ρ|β（1），③使用M-σ（1））抽取ρ（1），

其中p（ρ|β，σ）∝

p（ρ，β，α|D）

∝|In－ρW|exp

ρ，β，σ|D）

(

－

（Ay－Xβ）'（Ay－Xβ），D表示样本数据，接2σ2

①

)

本算法的全部过程由存在异方差与同方差两个迭代分支，

为避免叙述重复冗长，仅给出了后者。

·94·

统计研究2014年8月

p（*|，）*

，1，ρ=ρ+c受概率α（ρ，ρ）=min

p（ρ|β，σ）

{}

表2

TestLM-ErrorLM-LAGＲobust

LM-ErrorＲobustLM-LAG

基于LM的空间计量模型检验的模拟结果

Value统计量P值统计量P值统计量P值统计量P值

SAＲ24.1210.00035.5980.0000.0000.99813.3790.000

SEM8.6520.0039.2370.0029.7510.0020.0500.824

SAＲMA1.7820.1829.0960.0032.1750.14016.5600.000

SDM19.4900.00046.9530.0003.9060.04831.5430.000

SAC5.2940.02122.9820.0004.5390.03321.2420.000

～N（0，1），c为调整参数。使用ρ（1）更新ρ（0）返回到①。r=在本文中初始值的设置为ρ=0.5，σ=1.0，4，a=1，b=1，v0=0，d0=0，c=（0，0，…，0）'k，T=Ik*le

+12

，M-H抽样的初始调整参数都设为c=0.2，

总抽样1200次，丢弃前200次进行分析。

三、空间计量模型选择的模拟分析

本文生成相对的小样本和大样本数据的空间加

Lesage、Hepple等经常分别来源于Anselin、权矩阵，

使用49阶和3107阶矩阵①。模拟数据的生成中放

析，然后再分别使用相对的小样本和大样本进行MCMC方法的对比模拟分析。

（一）Moran指数检验的模拟分析

对由49阶邻接矩阵生成的5个空间模型SAＲ、SEM、SAＲMA、SDM、SAC分别进行Moran指数检验，得到表1所示的结果。

表1

ValueMoran指数I标准化后的IP值期望标准差

注：

注：在1%的显著性水平下，χ（1）临界值为6.635，χ（2）临界值为9.210。

LAG统计量非常显著，著，而ＲobustLM-可推断真实

LM的检验结果也进一步说明数选择模型。此时，

据的真实生成过程可能为SAＲ与SEM之外的其他

模型。

（三）基于信息准则的模型选择模拟分析SEM、SDM、SAC的模拟数据，对空间模型SAＲ、

计算对数似然值和三个信息准则值得到的结果见

表3。

从表3的前4行可以看出，当真实的模型为SAＲ时，却选择SDM模型进行估计得到的对数似然SDM和SAC同时采用SAＲ、值最大（－40.2931），

模型进行估计的对数似然值都只有微小的差异，即对数似然值最大原则在此由于缺少区分度，失去了

SEM、SAC模型选择的能力。当真实模型是SAＲ、SEM、SAC模型进行分析时，时，正确选择SAＲ、模型

BIC和HQ均为最小，的AIC、即信息准则取得了较好的效果。但遗憾的是，当真实模型是SDM时，错

误地选择SAC模型时，三个信息准则值均最小。所

分别为美国俄亥俄州的犯罪数据和1980年总统选举数据中的空间加权矩阵，详见Anselin的SpatialEconometrics：Methodsand

①

Models和Pace和Barry的Quickcomputationofspatialautoregressiveestimators，GeographicalAnalysis。

空间计量模型的Moran指数检验

SAＲ0.4665.9450.000－0.0230.082

＊＊＊

SEM0.2082.80940.005－0.0230.082

＊＊

SAＲMA－0.0000.2800.780

SDM0.4565.819

＊＊＊

SAC0.1702.352

＊

0.019＊－0.023

0.000

－0.023－0.0230.082

0.082

＊＊＊＊

5%和1%水平上显著。、和＊分别表示在10%、

从表1的Moran指数检验的P值可以看出，在

（二）基于LM检验的模型选择模拟分析SEM、SAＲMA、SDM、SAC对五个空间模型SAＲ、

第31卷第8期陶长琪杨海文：空间计量模型选择及其模拟分析

·95·

表3

MODELSAＲ

空间计量模型的信息准则值模拟结果

ICAICBICHQLn（L）

SAＲ87.328893.004385.4055－40.664480.508786.184178.5853－37.254398.8296104.505196.9063－46.414877.373483.048875.45－35.6867

SEM99.9272105.602798.0038－46.963674.337280.012672.4138－34.1686124.0054129.6809122.082－59.002792.392298.067790.4689－43.1961

SDM88.586196.153486.0216－40.293176.132583.699873.568－34.066396.4888104.05693.9243－44.244478.91486.481376.3495－35.457

SAC89.85197.418387.2865－40.925581.560889.128178.9963－36.780482.433290.000479.8687－37.216671.453679.020868.8891

表5

基于不同邻接矩阵的49个样本和3107个样本数据的MCMC方法的模拟结果

MODELW1W2W3W4W5W6

FAＲ

SAＲ

SEM

SDM

SEMAICBICHQLn（L）

SDMAICBICHQLn（L）

SACAICBICHQLn（L）

但是以信息准则值在此模型的选择上给出了误判，

相对前面的模型选择方法来说，依然表现不错。

（四）基于MCMC的空间计量模型选择模拟分析

表4

49个样本和3107个样本下利用MCMC方法计算的各种选择模型的后验概率

MODELFAＲSAＲSEM

FAＲ

SAＲ

SEM

SDM

－31.7268

W70.0920.0000.0110.0000.0380.0000.0000.000

第二列注：表5中每栏的第一列均对应49个样本的计算结果，

对于3107个样本的计算结果。

SAＲ、从表5可以看出，在49个样本条件下，

SEM、SDM、SAC模型选择4阶最近邻空间加权矩阵时得到的模型后验概率最大。但是当阶数与4接近SAＲ、SEM、SAC三个模型得到的模型后验概率时，

从以上全部模拟结果来看，基于OLS残差与似然函数值的模型选择方法，均存在一定的局限性。在非MCMC的方法中，信息准则总的来说基本有

H算法的条件下具效，而MCMC方法在给定恰当M-有更高效度，特别是对于大样本的情况具有绝对的

优势。

0.7010.7170.0000.0000.0000.0000.0000.0000.0100.0040.9460.9820.0080.0000.0000.0000.2650.2650.0000.0000.7750.8850.0000.000

在49个样本情况下当真实模从表4可以看出，

SAＲ、SEM和SDM时，型是FAＲ、正确选择它们的模型后验概率均比错误选择时的概率值大。而这4种

（五）基于MCMC的不同权重矩阵的模型选择模拟分析

当选择了确定类型的空间计量模型之后，对于

四、结论与展望

空间计量模型越来越丰富，基于实际问题，利用

·96·

统计研究

［6］Jeffreys，H．

Press，1961.

TheoryofProbability［M］．

2014年8月OxfordUniversity

应该进一步判断真实的数别准则无法给出结论时，

H算法，仍然存在一定的困难，如SAＲMA模型的M-法由于存在两个空间相关系数而变得复杂，依然不

参考文献

［1］Burridge，P．OntheCliff-Ordtestforspatialautocorrelation［J］．

JournaloftheＲoyalStatisticalSocietyB，1980，（42）：107－108.［2］Anselin，L．

Lagrangemultipliertestdiagnosticsforspatial

［7］Hepple，L．W．Bayesianmodelchoiceinspatialeconometrics，in

AdvancesinEconometrics：Vol18：SpatialandSpatiotemporalEconometrics［M］．Oxford：ElsevierLtd，2004.

［8］LeSage，J．P．andPaceＲ．K．Introductiontospatialeconometrics

［M］．BocaＲaton，US：CＲCPressTaylor＆FrancisGroup，2009.［9］BeraA，YoonM．Simplediagnostictestsforspatialdependence

［Ｒ］．Workingpaper，Champaign，1992.

［10］Schwarz，GideonE．Estimatingthedimensionofamodel［J］．

AnnalsofStatistics，1978，6（2）：461－464.

［11］Burnham，K．P．andAnderson，D．Ｒ．ModelSelectionand

MultimodelInference：APractical-TheoreticApproach［M］．Springer-Verlag，2002.

［12］CarlinBP，LouisTA．BayesandempiricalBayesmethodsfordata

analysis［J］．StatisticsandComputing，19977（2）：153－154.［13］Gelfand，A．E．，Smith，A．F．M．Sampling-basedapproachesto

calculatingmarginalDensities［J］．JournaloftheAmericanStatisticalAssociation，1990（85）：398－409.

［14］Hastings，W．K．MonteCarlosamplingmethodsusingMarkovchains

andTheirapplications［J］．Biometrika，1970（57）：97－109.［15］Geweke，John．BayesianTreatmentoftheIndependentStudentt

LinearModel［J］．JournalofAppliedEconometrics，1993（8）：19－40.

［16］LeSage，J．P．Bayesianestimationofspatialautoregressivemodels

［J］．InternationalＲegionalScienceＲeview，1997（20）：113－129.

作者简介

dependenceandspatialheterogeneity［J］．GeographicalAnalysis，1988（20）：1－17.

［3］Anselin，Luc，etal．Simplediagnostictestsforspatialdependence

［J］．

ＲegionalScienceandUrbanEconomics，1996（1）：

Bayesiantechniquesinspatialandnetwork

77－104.［4］Hepple，L．W．

econometrics：ModelComparisonandposteriorodds［J］．EnvironmentandPlanningA27，1995，447－469.

［5］LeSage，J．P．Bayesianestimationofspatialautoregressivemodels

［J］．InternationalＲegionalScienceＲeview，1997（20）：113－29.

(责任编辑:方原)

Fcnki_空间计量模型选择及其模拟分析_陶长琪

相关内容

热门内容

标签