rna-seq数据质控linux分析

DESeq2提供了两种数据标准化方法:VST(方差稳定变换)和rlog(正则化对数) 。FPKM(fragmentsperklobasemilon)和TPM(TranscriptsPerMillion)用作标准化值 。
1、单细胞RNA系列专题之一:单细胞RNA测序中 质控之重要细节(上篇单细胞RNA测序是目前的热门话题 。单细胞RNA测序可以给我们带来原始大RNA测序无法获得的信息,对于发育生物学、肿瘤生物学和免疫学的研究具有重要价值 。单细胞测序的核心是Tsne降维和聚类 。那么质控之前做这些工作会影响整个分析的成败 。在这篇文章中,我将告诉你一些关于单细胞质控的事情 。
什么是部落爆发?如下图:众所周知,基因的转录和表达是有周期的 。当基因的转录被激活时,mRNA的水平会突然升高,然后慢慢降低 , 蛋白质水平的相应变化也会延迟 。这个时期的频率,以及每次波动的大小 , 都会影响RNA 分析中最终的表达水平(可以是FPKM值,也可以是RPKM值) 。这种周期性转录现象与转录启动有关 。
2、RNA-Seq 分析|RPKM,FPKM,TPM,傻傻分不清楚? In 分析很容易理解,一个基因越长,测序就越深入,它内部的阅读计数就越多 。我们在进行分析的基因差异表达时,经常会比较多个样本中不同基因的表达水平 。如果数据不规范,比较结果就没有意义 。
FPKM(fragmentsperklobasemilon)和TPM(TranscriptsPerMillion)用作标准化值 。那么,三者的计算原理是什么,又有什么区别呢?为了更清晰地展示计算过程 , 我们以三个样本的四个基因的readcounts矩阵为例(来自YouTube) 。
3、转录组学基础——什么是RNA- seq处理转录组学数据分析时,会发现两种数据 。一种被称为微阵列数据 , 另一种是通过下一代测序技术(NGS)获得的数据(例如,第二代测序 , 第三代测序) 。目录1 。微阵列:芯片数据2 。ngs(下一代测序)3 。rnaseq的应用原理:基于分子杂交技术,主要通过打印有荧光标记探针的基因芯片来实现 。
【rna-seq数据质控linux分析】cDNA的直接测序 。NextGenerationSequencing (NGS),也称为HighThroughputSequencing,是相对于传统的Sanger排序而言的 。RNASeq是对转录组和分析进行测序 。一般来说,在所里会委托公司对数据进行测序 , 进行后续的信息生成分析( 质控,作图,差异基因表达分析,SNV 分析,等等).

    推荐阅读