5 新版TCGA中表达数据下载后有6万多个ENSG号,其中包含了lncRNA,如何提取lncRNA的表达数据

如题

请先 登录 后评论

4 个回答

Fei - 生物信息

首先,获取表达谱数据,可以通过简易TCGA下载工具下载胶质瘤数据。

其次,获取lncRNA的列表,可以运用https://www.shengxin.ren/question/23里的代码运行得到lncRNA信息

根据第一步和第二步得到的文件运行一下代码就可以得到lncRNA的表达谱啦

def getlncRNA():

    _file='H:/lncRNA_ID.txt'

    f=open(_file,'r')

    lines=f.readlines()

    _lncRNA=[]

    for line in lines:

        line=line.rstrip().strip()

        lnc=line.split('\t')[0]

        if lnc not in _lncRNA:

            _lncRNA.append(lnc)

    return _lncRNA

    

def getlncRNAExpre():

    _lncRNA=getlncRNA()

    _file='H:/Merge_matrix.txt'

    f=open(_file,'r')

    lines=f.readlines()

    f.close()

    fw=open('H:/lncRNAExpre.txt','w')

    for line in lines:

        line=line.rstrip().strip()

        _list=line.split('\t',1)

        if(_list[0] in _lncRNA):

            fw.write(line+"\n")

    fw.close()

        

if __name__ == '__main__':

    getlncRNAExpre() 

        

请先 登录 后评论
TwoBeNO.1 - 生物信息分析人员

https://omictools.com/sequencing-category 试试这里边的工具

请先 登录 后评论
GOCE - 学生

请问这是什么代码?R语言吗?


请先 登录 后评论
ancor

大神有没有R语言代码分享个?

请先 登录 后评论