星期五, 八月 02, 2013

生存分析函数小结

生存分析(survival analysis)适合于处理时间-事件数据。例如中风病人从首次发病到两次复发,其中就涉及到时间和事件。此例中时间就是复发的时间间隔,事件就是是否复发。如果用普通的线性回归对复发时间进行分析,就需要去除那些没有复发的病人样本。如果用Logistic回归对是否复发进行分析,就没有用到时间这个因素。而生存分析同时考虑时间和事情这两个因素,效果会更好些。

在R语言中我们可以使用survival包进行生存分析,其中主要的函数功能罗列如下:

Surv:用于创建生存数据对象
survfit:创建KM生存曲线或是Cox调整生存曲线
survdiff:用于不同组的统计检验
coxph:构建COX回归模型
cox.zph:检验PH假设是否成立
survreg:构建参数模型



下面是使用一个实例来使用R中的生存分析函数,其中用到的数据集可以在这里下载

8 条评论:

  1. stepAIC(mod2)
    错误: 没有"stepAIC"这个函数

    回复删除
    回复
    1. 哦,需要事先加载包 library(MASS)

      删除
  2. 怎么可以把你的网站打包下载下来,?公司可以爬墙看, 回家就不能爬墙了。

    回复删除
    回复
    1. r-blogger中文上有同步的,也可以上http://xccds.github.io

      删除
  3. 你好,想咨询一下,如果在coxph函数中,例如mod1 <- coxph(y ~ prison + dose + clinic,data=addicts),prison + dose + clinic的项数非常多的话,应该怎么处理呀!!

    回复删除
    回复
    1. 你的意思是项数太多不好输入是吧,你可以用字符串粘合后转为公式。

      删除
  4. 请问老师,既然“不平行,不符合PH假设”,为什么还要进行cox regression的检验?

    回复删除