RNA-seq学习记录
RNA-seq的基本原理
一、概念
RNA-seq 是利用高通量测序技术对细胞或组织中 转录组(全部 RNA 分子集合) 进行测定的方法。它能揭示基因表达水平、转录本结构、可变剪接情况、新转录本等信息。相比于传统的 微阵列(microarray),RNA-seq 不依赖预先设计的探针,分辨率更高、动态范围更宽。
二、基本流程与原理
- RNA 提取
- 从细胞或组织样本中提取总 RNA。
- 常常会去除 rRNA(占比高达 80-90%),保留 mRNA 或其他关注的 RNA 类型(如 miRNA、lncRNA)。
- RNA → cDNA
- 由于测序平台主要针对 DNA,需要先把 RNA 逆转录为 cDNA。
- 通过 逆转录酶 合成一链或双链 cDNA。
- 文库构建
- 将 cDNA 打断成合适长度的片段(通常 200–500 bp)。
- 在片段两端连接 接头序列(adaptor),用于后续扩增和测序。
- 高通量测序
- 常见平台:Illumina(短读长,覆盖率高)、PacBio、Nanopore(长读长,适合全长转录本)。
- 测序得到大量的 reads(序列读段)。
- 数据分析
- 基因表达分析 (1)基因表达定量(Count 值和 FPKM 值) (2)样本间皮尔逊相关性分析 (3)主成分分析(PCA) (4)基因表达分布(箱型图)
- 差异基因分析 (1)Deseq2 差异基因分析、统计、筛选 (2)差异基因火山图 (3)差异基因聚类热图
- 富集分析(包含模式物种和非模式物种) (1)GO 富集分析 (2)KEGG 富集分析
- PPI 蛋白互作网络分析
- GSEA 分析
数据分析
基因表达定量分析
Count值
—-编写中—
1
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.
Comments