RNA-seq的基本原理

一、概念

RNA-seq 是利用高通量测序技术对细胞或组织中 转录组(全部 RNA 分子集合) 进行测定的方法。它能揭示基因表达水平、转录本结构、可变剪接情况、新转录本等信息。相比于传统的 微阵列(microarray),RNA-seq 不依赖预先设计的探针,分辨率更高、动态范围更宽。


二、基本流程与原理

  1. RNA 提取
    • 从细胞或组织样本中提取总 RNA。
    • 常常会去除 rRNA(占比高达 80-90%),保留 mRNA 或其他关注的 RNA 类型(如 miRNA、lncRNA)。
  2. RNA → cDNA
    • 由于测序平台主要针对 DNA,需要先把 RNA 逆转录为 cDNA。
    • 通过 逆转录酶 合成一链或双链 cDNA。
  3. 文库构建
    • 将 cDNA 打断成合适长度的片段(通常 200–500 bp)。
    • 在片段两端连接 接头序列(adaptor),用于后续扩增和测序。
  4. 高通量测序
    • 常见平台:Illumina(短读长,覆盖率高)、PacBio、Nanopore(长读长,适合全长转录本)。
    • 测序得到大量的 reads(序列读段)。
  5. 数据分析
    • 基因表达分析 (1)基因表达定量(Count 值和 FPKM 值) (2)样本间皮尔逊相关性分析 (3)主成分分析(PCA) (4)基因表达分布(箱型图)
    • 差异基因分析 (1)Deseq2 差异基因分析、统计、筛选 (2)差异基因火山图 (3)差异基因聚类热图
    • 富集分析(包含模式物种和非模式物种) (1)GO 富集分析 (2)KEGG 富集分析
    • PPI 蛋白互作网络分析
    • GSEA 分析

数据分析

基因表达定量分析

Count值

—-编写中—

1