批量计算生存分析工具使用例子

以下我们使用GEO的一套数据来演示以下该工具使用 首先我们选择下载GSE25065数据集,下载之后使用GEO芯片数据转换器将数据提取出来,最终我们得到了这两个文件 打开SampleInfo.xls文件找到随访...

工具下载链接:http://gap.shengxin.ren/tool/7/

以下我们使用GEO的一套数据来演示以下该工具使用

首先我们选择下载GSE25065数据集,下载之后使用GEO芯片数据转换器将数据提取出来,最终我们得到了这两个文件

attachments-2017-08-ofCr35ct5993f3386800打开SampleInfo.xls文件找到随访信息列:

attachments-2017-08-aWqM52Rb5993f3c36c45

去除其中的分号,保存

然后启动本工具,导入样本信息和表达谱数据,如图:

attachments-2017-08-Y13RWy0S5993f487b5f6最终得到结果:

attachments-2017-08-ynwWfXXl5993f4df6bb2然后导出就OK了,结果中包括95%的置信区间,以及风险比,还有p值,使用方法是CoxRegression

我们导出结果:

attachments-2017-08-CYV9yWMy5993f5759224结果包含两个文件,第一个是每个基因的Cox结果,第二个是样本的表达谱和对应的临床随访信息整合的表格,可以自己导入到R里面去分析

进一步的如果想观察每个基因的K-M曲线,该工具提供了K-M绘制曲线的功能,可以直观的看出分类效果,并提供导出pdf功能

attachments-2017-08-5ee8fkoK5993f62b54b9

与R语言相比如下:

library(survival)
setwd("D:/Work/code/Test/GSE25065_family.xml")
data=read.csv('CoxResult.txt.matrix',sep = '\t',row.names = 1)
head(data)
time=data[,1]
status=data[,2]
cox1=coxph(Surv(time, status) ~ ACADSB,data)
cox2=coxph(Surv(time, status) ~ GATA3,data)
cox3=coxph(Surv(time, status) ~ CHMP6,data)
cox4=coxph(Surv(time, status) ~ ADCY9,data)
attachments-2017-08-OULwwLhn5993f9985897


attachments-2017-08-46erfnBP5993f9224b74


  • 发表于 2017-08-16 15:39
  • 阅读 ( 4437 )
  • 分类:软件工具

50 条评论

请先 登录 后评论
不写代码的码农
祝让飞

生物信息工程师

60 篇文章

作家榜 »

  1. 刘永鑫 64 文章
  2. 祝让飞 60 文章
  3. SXR 44 文章
  4. 张海伦 31 文章
  5. 爽儿 25 文章
  6. 生信菜鸟团 13 文章
  7. deepxin 12 文章
  8. 百迈客 12 文章