批量生存分析工具咨询

使用批量生存分析工具计算时遇到两个问题:

1 软件Cox回归返回的基因数目少于原始数据的基因数目,但被过滤的这部分基因在R或SPSS中均可以实现COX回归。请问软件对基因的过滤标准是什么?

2 软件COX回归返回的基因表达值与原始的基因表达值略有不同,见下图attachments-2017-10-Fiw4s8xo59e2c1a4c0e98.PNG

因为软件返回和原始数据略有差异,自己在R中用“cox=coxph(Surv(time, status) ~ CD68,data)”分别对原始数据和软件返回的CD68做Cox回归分析,二者的coef和p值存在差异(对多个基因进行对比后发现:少数基因的coef用原始数据计算则为正值(负值),而用生存分析软件返回值进行计算则为负值(正值)。

3 考虑到被软件过滤掉部分基因,自己对被过滤的基因单独行Cox回归。用R进行编程,可实现对单个基因的Cox回归,多次尝试在R中实现批量Cox回归均失败,故特请教在R中如何实现批量Cox回归。

万分感谢!!!


请先 登录 后评论

1 个回答

祝让飞 - 生物信息工程师

问题1:过滤规则为匹配上的样本中都有表达水平,如果存在数据缺失则会自动过滤掉

问题2:由于不同的计算机语言的数据精度处理方式不同存在你说的那个现象,这个并对数据结果影响极小,应该是数据处理方式的问题,软件中的结果可以使用软件输出的数据使用R进行复现

问题3:同一,实现批量可以使用for循环,我猜测你的数据中存在一些非数字




请先 登录 后评论