星期二, 七月 19, 2011

在R语言中实现google-motion-charts

本例希望比较20国集团过去若干年的发展轨迹,用谷歌提供的动态视图API在R中进行绘图。我们从世界银行数据库中选取三个变量,分别反映GDP,CO2排放和期望寿命在2001到2007年之间变化。

首先安装必要的程序包,然后用WDI命令从世界银行数据库中加载数据。
install.packages("googleVis")
library(googleVis)
library(WDI)
DF <- WDI(country=c("CN","RU","BR","ZA","IN",'DE','AU','CA','FR','IT','JP','MX','GB','US','ID','AR','KR','SA','TR'), indicator=c("NY.GDP.MKTP.CD", 'SP.DYN.LE00.IN', 'EN.ATM.CO2E.KT'), start=2000, end=2010
M <- gvisMotionChart(DF, idvar="country", timevar="year")

星期一, 七月 18, 2011

R语言中进行分位数回归

分位数回归(Quantile Regression)是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。与传统的OLS只得到均值方程相比,它可以更详细地描述变量的统计分布。

但是在实际的经济生活中,传统的线性回归模型的假设常常不被满足,例如数据出现尖峰或厚尾的分布、存在显著的异方差等情况,这时的最小二乘法估计将不再具有上述优良性且稳健性非常差。最小二乘回归假定自变量X只能影响因变量的条件分布的位置,但不能影响其分布的刻度或形状的任何其他方面。

为了弥补普通最小二乘法在回归分析中的缺陷,Koenker和Bassett于1978年提出了分位数回归(Quantile Regression)的思想。它依据因变量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通最小二乘回归只能描述自变量X对于因变量y局部变化的影响而言,更能精确地描述自变量X对于因变量y的变化范围以及条件分布形状的影响。分位数回归能够捕捉分布的尾部特征,当自变量对不同部分的因变量的分布产生不同的影响时.例如出现左偏或右偏的情况时。它能更加全面的刻画分布的特征,从而得到全面的分析,而且其分位数回归系数估计比OLS回归系数估计更稳健。

星期三, 七月 13, 2011

在R语言中进行面板数据分析

面板数据(Panel Data)是截面数据与时间序列数据综合起来的一种数据类型。它有时间序列和截面两个维度,当这类数据按两个维度排列时,是排在一个平面上,与只有一个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把panel data译作“面板数据”。

面板数据模型的选择通常有三种形式:

第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。

R语言中实现可行广义最小二乘(FGLS)回归

线性回归中经常会遇到异方差的问题。如果干扰项的方差与自变量之间存在某种关系,那么在这种前提下,一种补救方法就是利用加权最小二乘(WLS)。

首先利用OSL对模型进行回归,得到模型残差,以残差的平方来代替干扰项的方差。
然后,将残差的平方的对数做因变量,将自变量的对数做自变量,进行第二次回归,得到的系数即为自变量的幂h。最后,构造权重(1/x^(h/2)),手动操作时,需要在原模型两边分别除以权重,构造新的方程进行回归。但在R语言中进行回归时,可以直接利用weight参数,将weight=1/x^h 即可。

星期四, 七月 07, 2011

使用R语言处理结构方程模型

在回归问题中,我们有时候需要同时估计多个相互依赖的方程,这种就称为联立方程组。联立方程组在减化为一个方程后称为约简型方程。在这种情况下不能使用普通最小二乘来估计方程系数,因为有的自变量与干扰项存在相关,由此会造成估计量的有偏和不一致。这种自变量称为问题变量。

解决这个问题的方法是采用工具变量方法,即找到一个变量,其特征是它与问题变量相关,而与干扰项无关。用工具变量法得到的自变量系数是一致的。与工具变量法等价的是两阶段最小二乘法,首先用最小二乘从模型的约简型方程中构造出所有问题变量的拟合值,之后,用上一步得出的拟合值来代替问题变量,再用最小二乘对结构方程直接进行回归,就可得到一致估计量。在R语言中为联立方程建模的工具包是systemfit。

下面的算例来自Michael P.Murry的现代计量经济学一书下册。研究人员想对鳕鱼市场的供给与需求建立联立方程模型。供给方程形式为: