3 下载TCGA counts数据后用EdgeR做差异分析,后续如果计算lncRNA与mRNA表达的相关系数,是用哪种数据呢?

1、可以用EdgeR包里面的calcNormFactors,estimateCommonDisp,estimateTagwiseDisp标准化出来的结果直接计算Pearson相关系数吗?FPKM可以吗?

2、EdgeR标准化出来的数据,有一些值为0的数据,计算相关系数的时候需要处理吗?

3、计算相关系数,需要log2变换吗?

4、lncRNA的丰度相对较低,和mRNA算出来的相关系数会不会偏大?

问题比较多,希望有一起学习的通道加qq522314536一起讨论一下~~

请先 登录 后评论

2 个回答

祝让飞 - 生物信息工程师

1、可以

2、正常可以忽略,如果很多0的话需要去掉

3、变不变换结果差不多

3、lncRNA丰度低,太多0的去掉,其他的正常计算木有太大关系

请先 登录 后评论
qfqyy

也解答了我的疑惑。

请先 登录 后评论