星期六, 八月 27, 2011

R语言中如何读取公开数据库

世界上有很多公开数据库(open data)以供研究者使用。在R语言中也有不少程序包可以直接从这些数据源中读取数据。在之前的博文里,已经介绍quantmod和WDI。前者可以从雅虎和美联储读取数据,后者可以从世界银行读取数据。今天再介绍一个拥有数万个数据的网站,就是http://datamarket.com。这里可以看到网站介绍

首先我们在网站上注册一个免费帐号,然后在R中安装如下的package
install.packages("rdatamarket")
library(rdatamarket)

在网站上找到一个你感觉有趣的时序数据,例如这里的是美国失业数据,将其IP地址存入变量

ip <- 'http://datamarket.com/data/set/1ki8/persons-unemployed-15-weeks-or-longer-as-a-percent-of-the-civilian-labor-force#ds=1ki8'

dminfo命令可以了解此数据的元数据,然后用dmseries可以直接读取数据,然后利用绘图命令得到结果,很简单吧

unemp <- dmseries(ip)
plot(unemp)

没有评论:

发表评论