如何解决生信新手分析时常常遇到的数据问题

参考文献 Wagner, G.P., Kin, K. & Lynch, V.J. Measurement of mRNA abundance using RNA-seq data: RPKM measure is inconsistent among samples. Theory Biosci. 131, 281–285 (2012).

  • 3
  • 0
  • 柚子
  • 发布于 2020-06-15 15:03
  • 阅读 ( 4025 )

快速上手的中文版GSEA工具!

为了解决四个难题我们设计开发了“GSEA简易分析工具”和” GSEA结果可视化工具”

  • 0
  • 0
  • 柚子
  • 发布于 2020-06-15 14:53
  • 阅读 ( 4839 )

必看!绘制高颜值图的秘诀!

“在生信分析之前对数据进行清洗,其过程对后续的分析起的重要的作用,有时直接影响结果的好坏”

  • 0
  • 0
  • 柚子
  • 发布于 2020-06-15 14:46
  • 阅读 ( 1554 )

多种生信套路组合——发4分的文章

这篇文章今年1月份发表在J Cell Mol Med上;文章只有两套数据,一套训练集和一套验证集;作者构建的模型AUC也不是很高,但是文章的分数发了4.6分。 主要原因是作者能够将很多常规分析串起来,这些分析大家在泛癌课程和之前分享的文章、小工具推文中大家都接触过。 所以小编提议大家多看文章,英文看不懂,没有关系,可以先看小编的解读,再看看原文,锻炼自己的思维。

  • 1
  • 0
  • 欢乐豆
  • 发布于 2020-06-10 23:20
  • 阅读 ( 5729 )

爱学习:手把手教你复现一篇Nature子刊的基于WGCNA的生信分析+实验验证的文章

“Identifcation of the key genes and pathways involved in the tumorigenesis and prognosis of kidney renal clear cell carcinoma” 肾脏肾透明细胞癌的发生,发展及预后的关键基因和途径的鉴定 发表于: 2020年3月6日, Scientific Reports 杂志上,还是热乎的。

  • 1
  • 0
  • 欢乐豆
  • 发布于 2020-05-29 18:50
  • 阅读 ( 6844 )

快速差异分析工具——limma包

limma包是2015年发表在Nucleic Acids Resarch一个做差异分析的工具,目前引用次数高达七千多次。Limma包是基于voom的算法,它既可以对芯片数据进行差异分析,也可以对转录组高通量测序数据进行差异分析。

  • 1
  • 1
  • 欢乐豆
  • 发布于 2020-05-26 19:47
  • 阅读 ( 20380 )

limma快速差异分析工具!

limma包是2015年发表在Nucleic Acids Resarch一个做差异分析的工具,目前引用次数高达七千多次。Limma包是基于voom的算法,它既可以对芯片数据进行差异分析,也可以对转录组高通量测序数据进行差异分析。

  • 1
  • 0
  • 柚子
  • 发布于 2020-05-26 11:53
  • 阅读 ( 4756 )

更新了!多数据集合并及去除批次效应工具使用详解!

批次效应表示样品在不同批次中处理和测量产生的试验期间记录与任何生物变异无关的技术差异。

  • 0
  • 1
  • 柚子
  • 发布于 2020-05-26 11:36
  • 阅读 ( 9027 )

limma的两个弟弟:edgeR和DESeq2

01 — 研究背景 上一篇公众号我们为大家详细的介绍了R软件包limma筛选差异基因,limma包做差异分析要求数据满足正态分布或近似正态分布,如基因芯片、TPM格式的高通量测序数据。随着高...

  • 2
  • 1
  • 柚子
  • 发布于 2020-05-26 11:09
  • 阅读 ( 5184 )

火山图快速绘制工具

前两期公众号给小伙伴们推荐了两个做基因差异分析网页交互式小工具,很多小伙伴私信小编说,用网页小工具做差异分析,结果文件中的火山图默认只展示差异倍数(即logFC)最大的前十个基因。

  • 1
  • 0
  • 柚子
  • 发布于 2020-05-26 11:02
  • 阅读 ( 2880 )

富集分析结果展示(一)——气泡图

记得在两年前刚学生信时,和很多小伙伴一样,在做完差异基因分析或者进行基因特异性筛选时,发现结果有几百个甚至上千个基因。心里想,这么多基因,如果每一个基因去NCBI、Gene Card等公共数据库上去注释基因功能,等注释完了,黄花菜都凉了。

  • 1
  • 1
  • 柚子
  • 发布于 2020-05-26 10:57
  • 阅读 ( 16033 )

一文解决各种ID转化成Gene Symbol

为了解决生信小白的困难,我们公司研发的一个网页板的小工具,里面内置了包括Ensembl、GPL570等常用的注释平台文件,你只需要上传自己的表达谱矩阵,点击鼠标即可完成各种ID之间的转换,非常方便。这么好的平台,亲们准备好了吗,和我一起去体验吧。

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 10:48
  • 阅读 ( 11631 )

数据不够——缺失值“来凑”

“ 根据将缺失值和缺失值周围距离最近的k个值,其中距离方式可以选择欧式距离和马氏距离,用这k个值的中值或均值代表这个缺失值”

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 10:32
  • 阅读 ( 2078 )

单因素生存分析工具在线版等你来用!R语言都不用安装?

“做cox比例分析和KM曲线结合分析,阈值该怎么选取,数据是否需要标准化等等问题的解决方法”

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 10:25
  • 阅读 ( 2762 )

简易批量生存分析工具!省时又省力!

省时又省力,几百个基因做生存分析,挑选对样本的生存状态有显著影响的基因,然后用这些基因进行进一步的做生存分析,绘制ROC曲线。

  • 2
  • 0
  • 柚子
  • 发布于 2020-05-26 10:13
  • 阅读 ( 2451 )

富集分析结果展示(二)——富集分析圈图

“做cox比例分析和KM曲线结合分析,阈值该怎么选取,数据是否需要标准化等等问题的解决方法”

  • 1
  • 0
  • 柚子
  • 发布于 2020-05-26 10:06
  • 阅读 ( 3442 )

绘制热图与预后评分关系的简易工具

“绘制高颜值的基因表达高低与患者生存状态的关系图”

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 09:54
  • 阅读 ( 2582 )

快速绘制分组小提琴图工具

“小提琴图 (Violin Plot) 用于显示数据分布及其概率密度”

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 09:49
  • 阅读 ( 2982 )

快速小提琴绘制工具

如果是以文件的格式将数据导入到云平台,平台默认无法读取Excel中的数据,必须将Excel文件转为以制表位符分割的文本文件,否则小工具将无法运行。

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 09:44
  • 阅读 ( 1489 )

箱线图快速绘制工具

“原来需要大半天才能做出一个图,现在的小工具几分钟就可以搞定,关键还是高颜值,棒棒的!”

  • 0
  • 0
  • 柚子
  • 发布于 2020-05-26 09:30
  • 阅读 ( 4237 )