资讯详情

面板数据分析及stata应用笔记

动态面板数据模型及估计方法

假说里面没有明显的外表

文章目录

  • (1)面板数据基础知识
      • **一、定义面板数据**
      • **二、面板数据分类**
      • **三、面板数据的优缺点**
      • **四、面板数据模型**
      • **五、面板数据模型的估计**
  • (二)**短面板数据分析的基本程序**
    • **检查三大问题**
  • (三)**长面板数据分析**
  • (四)**机制识别方法**
  • (五)顺序
  • (6)内生性和工具变量法
      • **内生问题及解决方法**
      • 两阶段最小二乘法
  • (7)动态面板数据模型及估计方法
      • 差分GMM和系统GMM
  • (八)面板门限模型
      • 一、门限回归
      • 二、面板数据门限回归
      • 三、面板单门限模型两大检验
      • 双门限板模型
      • 四、面板门限模操作xthreg命令介绍
      • 实现和检查面板单门限模型
      • 六、实现和检查面板多门限模型
    • 实例分析中的代码
  • (九)双差模型
      • 一、介绍双差模型
    • 二、做DID几个问题需要注意
    • 三、双差模型Stata操作
  • (十)合成控制法
      • 一、合成控制法的基本思想
      • 合成控制法的具体方法
      • 合成控制法synth命令
      • 合成控制法Stata操作
      • 合成控制法的稳定性检验
      • 使用合成控制法的注意事项
  • (十一)断点回归
      • 断点回归设计理论
      • 断点回归设计Stata命令
      • 断点返回设计案例操作

(1)面板数据基础知识

面板数据(panel data或long itudinaldata),指在一段时间内跟踪同一组个体(individual)的数据。它有横截面的维度(n个人),有时间维度(T个时期)。它是同时在时间和截面上获得的二维数据,也称为时间序列和截面的混合数据(polled timeseries and cross section data)。

一个T=面板数据结构如下所示

img

面板数据的类型通常分为三类:

a.短板数据和长板数据

b.动态面板数据和静态面板数据

c.平衡面板和不平衡面板

当截面N大于T时,是短面板数据;

当截面数n小于T时,是长面板数据.

如果解释变量包含不解释变量的滞后值,则为动态面板数据,否则为静态面板.

每个人在同一时间内都有观察值记录,即平衡面板,反之亦然。

1.面板数据的优点

(1)可以处理不可观察的个体异质性引起的内生问题。

(2)提供更多个人动态行为信息。

(3)样本量大,可提高估计精度。

2.面板数据的不足

(1)大多数面板数据分析技术都针对的是短面板。

(2)不容易找到面板数据结构工具的变量。

面板数据模型分为非观测效应模型和混合回归模型。不可观测的个体效应模型是非观测效应模型,反之亦然。

a.固定效应模型

b.随机效应模型 Y i t = β x i t α i ε i t i = 1 , ? ? , n ; t = 1 , ? ? , T \begin{aligned} &Y_{i t}=\beta x_{i t} \alpha_{i} \varepsilon_{i t} \\ &i=1, \cdots, n ; t=1, \cdots, T \end{aligned} Yit​=βxit​+αi​+εit​i=1,⋯,n;t=1,⋯,T​ 其中, [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Wvrd4mDI-1640317583087)(https://www.zhihu.com/equation?tex={\alpha+_i})] 是不可观测的个体效应。

如果 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KqgWnioB-1640317583088)(https://www.zhihu.com/equation?tex={\alpha+_i})] 与某个解释变量相关,就是固定效应模型

如果 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tQ358z2f-1640317583088)(https://www.zhihu.com/equation?tex={\alpha+_i})] 与所有解释变量不相关,则为随机效应模型

**固定效应模型又分为:**单向固定效应模型与双向固定效应模型

**单向固定效应模型:**只考虑个体效应不考虑时间效应;

**双向固定效应模型:**同时考虑个体效应和时间效应,即

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fTr3IBgu-1640317583089)(https://www.zhihu.com/equation?tex={y_{it}}+%3D+\beta+{x_{it}}+%2B+{\lambda+_t}+%2B+{\alpha+i}+%2B+{\varepsilon+{it}})]

如果 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UZNe60iD-1640317583090)(https://www.zhihu.com/equation?tex={\alpha+_i}%3D0)] ,即不存在个体效应,则为混合回归模型,即

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7RZ6ZKmC-1640317583091)(https://www.zhihu.com/equation?tex=\begin{array}{l}+{Y_{it}}+%3D+\beta+{x_{it}}+%2B+{\varepsilon+_{it}}\+i+%3D+1%2C+\cdots+%2Cn%3Bt+%3D+1%2C+\cdots+%2CT+\end{array})]

对固定效应模型的估计有两种方法:

**优点:**即使个体效应与解释变量相关也可以得到一致估计;

**缺点:**无法估计不随时间而变的变量的影响。

#对固定效应变换无法估计不随时间而变的变量的影响的解决

固定效应模型的Stata的实现命令为:

引入时间效应的双向固定效应的Stata的实现命令为:

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(xtreg y x, fe)

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(xi: xtreg y x i.year, fe)

不存在时间效应:

存在时间效应:

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(reg y x i.code)

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(xi: reg y x i.code i.year)

对随机效应模型的估计方法是

不存在时间效应:

存在时间效应:

即,误差项的异方差、误差项的自相关、截面相关问题

  • 通过在命令中加入选项“robust”可以获得White稳健标准误,可以解决异方差的问题。

  • 在命令中加入选项“cluster”可以获得Rogers标准误或聚类稳健的标准误,可以同时解决异方差和自相关两大问题。

  • 使用命令xtscc可以同时解决三大问题,提供Driscoll-Kraay标准误。

(二)

1、模型设定与数据

2、描述性统计与作图

3、模型选择

4、报告计量结果

#以啤酒税将降低交通死亡率的假说为例,数据来自陈强教授的《高级计量经济学及Stata应用(第二版)》中的“traffic.dta”数据集。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e448qs0w-1640317583112)(https://www.zhihu.com/equation?tex=\begin{gathered}+++fata{l_{it}}+%3D+{\beta+_0}+%2B+{\beta+1}beerta{x{it}}+%2B+{\beta+2}spircon{s{it}}+%2B+{\beta+3}unrat{e{it}}+%2B+{\beta+4}perinc{k{it}}+\hfill%2B{\mu+_i}+%2B+{\gamma+t}+%2B+{\varepsilon+{it}}+\hfill\end{gathered})]

其中,被解释变量 f a t a l f a t a l fatal 为交通死亡率,核心解释变量 beertax 为啤酒税; 另外三个可观测 的控制变量: spircons、unrate、perinck 分别为酒精的消费量、税率和人均个人收入; μ i \mu_{i} μi​ 为不可观测的个体效应, γ t \gamma_{t} γt​ 为时间效应。

在Stata的“命令窗口”中输入

命令【use"数据集路径\traffic.dta"】将“traffic.dta”数据集导入到Stata中,

例如【use"C:\Users\traffic.dta"】。

将数据导入Stata后,即可在Stata的“变量窗口”中看到“traffic”数据集中的各个变量的名称及其标签

以啤酒税将降低交通死亡率的假说为例,数据来自陈强教授的《高级计量经济学及Stata应用(第二版)》中的“traffic.dta”数据集。

在Stata的“命令窗口”输入命令【des】查看“traffic”数据集。

从输出结果我们可以看到:“traffic”数据集包含336个观测值,54个变量。此外,我们还可以看到数据集中的变量名称、数据类型以及相关的说明。 通过命令【xtdes】我们可以查看面板数据的特征。

由结果可知:面板数据的截面数 ,时间数 , ,说明这是一个短面板数据集。

在使用面板数据分析前,我们需要输入命令【xtset state year】,来告诉Stata软件,这是一个以截面变量state为州,时间变量为year的面板数据。

观察输出结果,由labelly balance可知,这是一个平衡面板数据。

至此,我们可以知道,“traffic”数据集是一个48个州,1982-1988年的平衡面板数据集。

在Stata中输入命令【sum fatal beertax spircons unrate perinck】,我们可以得到解释变量与被解释变量的观测值、均值、标准差、最小值和最大值。

使用命令【twoway(scatter fatal beertac)(lfit fatal beertax)】即可画出核心变量“fatal”与被解释变量“beertax”的散点图及回归直线。

需要注意的是,严格意义上说,这样做并不是正确的,因为并没有控制核心变量之外的其他影响因素。

应该是,在控制其他变量的基础上,展示核心变量与被解释变量的偏相关图。

首先,我们需要使用【reg】命令做出回归结果;

然后,使用命令【avplot 核心变量】即可得到核心变量与被解释变量的偏相关图。

#首次使用avplot的同学,要记得通过命令【search avplot】先安装avplot。

如果直接使用命令【avplots】则会得到所有的变量与被解释变量的偏相关图。

在Stata的“命令窗口”中先输入命令【reg fatal beertax spircons unrate perinck i.year i.state】进行LSDV估计。

然后,输入命令【avplot beertax】

输入命令【avplots】得到所有的变量与被解释变量的偏相关图。

在Stata“命令窗口”中输入命令【xtline fatal】即可得到核心变量交通死亡率“fatal”在各个州的时间序列图。

对于固定效应模型、随机效应模型和混合回归模型这三个模型,在实际应用中我们应该选择哪一个模型呢? 一般来说,在学术研究中我们选择双向固定效应模型就可以了。

但是,为了严谨,我们还是应该对三个模型进行比较选择,以判断哪一个模型是匹配数据集的最合适的模型。

首先,我们使用命令【tab year,gen(year)】生成年份虚拟变量;

然后,通过命令【xtreg fatal beertax spircons unrate perinck year2-year7 ,fe】估计双向固定效应模型。

使用命令“xtreg,fe”,在输出结果中我们会得到一个F检验的结果,其原假设为 H 0 : a l l   μ i = 0 H_0:all~ \mu_i = 0 H0​:all μi​=0这意味着,如果接受原假设,就选择混合回归模型;如果拒绝原假设,则选择固定效应模型。

由输出结果可知,F检验对应的P值远小于0.01,那么,这是否就意味着我们可以拒绝原假设,选择固定效应模型呢?

答案是否定的,原因是误差项可能存在自相关、异方差和截面相关这三大问题,如果不对这三大问题进行处理,那么F检验的结果可能就不可靠。

我们可以使用命令【xtcsd】来检验截面相关问题。

#首次使用xtcsdt的同学,需要通过命令【ssc install xtcsd】来安装xtcsd。

“xtcsd”有三个选项,分别为:pes、fri、fre,每个选项都有其使用的前提

【xtcsd,pes】可以用于平衡面板、非平衡面板以及动态面板;

【xtcsd,fri】只可用于平衡面板;

【xtcsd,fre】可以用于平衡面板,但fre同时考虑了时间效应。

结合案例,我们使用的数据是平衡面板数据,而使用的模型控制了时间效应,所以我们选择命令【xtcsd,fre】

由检验结果可知,因为1.068大于百分之10所对应的临界值0.3583,所以拒绝不存在截面相关的原假设,即认为模型存在截面相关问题。

所以,我们使用之前之前介绍的“xtscc”命令来处理截面相关问题,然后再进行个体效应是否存在的检验。

#首次使用xtscc的同学,需要通过命令【ssc install xtscc】来安装xtscc。

在Stata中输入命令【xi:xtscc fatal beertax spircons unrate perinck year2-year7 i.state】

然后,使用命令【testparm _Istate*】对州虚拟变量做F检验

检验结果显示,P值远小于0.1,可以拒绝原假设,认为存在个体效应,所以选择固定效应模型。

如果不存在截面相关问题,假定存在异方差和自相关,则使用命令【xi:reg fatal beertax spircons unrate perinck year2-year7 i.state,cluster(state)】

这个命令使用聚类到州获得标准误来处理自相关和异方差问题。

然后,再使用命令【testparm _Istate*】对州虚拟变量进行F检验

Breusch 和Pagan在1980年提出了一个检验个体效应的LM检验。

其原假设为 H 0 : σ μ 2 = 0 H_{0}: \sigma_{\mu}^{2}=0 H0​:σμ2​=0 ,备择假设为 H 1 : σ μ 2 ≠ 0 H_{1}: \sigma_{\mu}^{2} \neq 0 H1​:σμ2​​=0 。

如果拒绝原假设,就选择随机效应模型;如果接受原假设,则选择混合回归模型。

Stata的检验命令为【xttest0】或者【xttest1】

#首次使用xttest0/xttest1的同学,需要通过命令【findit xttest0/findit xttest1】来安装命令。

首先,使用随机效应模型进行估计。在Stata“命令窗口”中输入命令

【xtreg fatal beertax spircons unrate perinck year2-year7,re】

然后,输入命令【xtteat0】

从检验结果,我们可以看到,P值为0,小于显著性水平0.01,所以在0.01的显著性水平下拒绝原假设,选择随机效应模型。

由输出结果可知:Random Effects给出了随机效应自相关的检验结果,由结果可知,随机效应存在一阶自相关问题;Serial Effects给出了误差项的自相关检验结果,检验结果的P值为0,小于0.01,所以在0.01的显著性水平下拒绝原假设,即误差项存在一阶自相关问题;LM检验结果显示应拒绝原假设,即选择随机效应模型。

通常使用Hausman检验进行比较。

如果 Cov ⁡ ( α i , X i t ) = 0 \operatorname{Cov}\left(\alpha_{i}, X_{i t}\right)=0 Cov(αi​,Xit​)=0 ,那么固定效应模型和随机效应模型的估计都是一致的,但是随机效 应模型更加有效; 如果 Cov ⁡ ( α i , X i t ) ≠ 0 \operatorname{Cov}\left(\alpha_{i}, X_{i t}\right) \neq 0 Cov(αi​,Xit​)​=0 ,固定效应模型仍然一致,但随机效应模型是有偏的。

所以,如果原假设成立,则固定效应模型与随机效应模型将共同收敛于真实的参数值;反之,两者的差距过大,则倾向于拒绝原假设,选择固定效应模型。

#以“traffic”数据集为例

【xtreg fatal beertax spircons unrate perinck year2-year7,fe】#做固定效应估计

【est store FE】#存储固定效应估计的结果

【xtreg fatal beertax spircons unrate perinck year2-year7,re】#做随机效应估计

【hausman FE, constant sigmamore】/【hausman FE, constant sigmaless】#将两个估计结果进行比较;constant代表masi距离中常数项的估计量;sigmamore利用有效估计量方差,即re;sigmaless利用一致估计量方差,即fe。

由结果可知,检验结果的P值为0,小于0.01,所以在0.01的显著性水平下拒绝原假设,选择固定效应模型。 需要注意的是:Hausman test1并不适合于异方差问题。

解决办法是:构造一个辅助回归。 y i t − θ ^ ⋅ y ˉ i = ( x i t − θ ^ ⋅ x ˉ i ) ′ β + ( 1 − θ ^ ) z ′ i δ + ( x i t − x ˉ i ) ′ γ + [ ( 1 − θ ^ ) μ i + ( ε i t − θ ^ ε ˉ i ) ] y_{i t}-\hat{\theta} \cdot \bar{y}_{i}=\left(x_{i t}-\hat{\theta} \cdot \bar{x}_{i}\right)^{\prime} \beta+(1-\hat{\theta}) z^{\prime}{ }_{i} \delta+\left(x_{i t}-\bar{x}_{i}\right)^{\prime} \gamma+\left[(1-\hat{\theta}) \mu_{i}+\left(\varepsilon_{i t}-\hat{\theta} \bar{\varepsilon}_{i}\right)\right] yit​−θ^⋅yˉ​i​=(xit​−θ^⋅xˉi​)′β+(1−θ^)z′i​δ+(xit​−xˉi​)′γ+[(1−θ^)μi​+(εit​−θ^εˉi​)] 这个辅助回归是在随机效应模型广义离差变换的基础上,加入一个解释变量的组内离差 ( x i t − x ˉ i ) \left(x_{i t}-\bar{x}_{i}\right) (xit​−xˉi​) 。

这个辅助回归的基本思想是:

(1) 如果 γ = 0 \gamma=0 γ=0 , 这和辅助回归方程就等价于随机效应的广义离差变换模型。如果随机效应模 型成立,则ols估计是一致的,所以 p lim ⁡ n → ∞ γ ^ = γ = 0 p \lim _{n \rightarrow \infty} \hat{\gamma}=\gamma=0 plimn→∞​γ^​=γ=0 。

(2)

标签: 二极管jeu05dp二极管jeu05df

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台