生物信息学

3.3 多组学分析概览




桂松涛
songtaogui@163.com


多组学技术

  • 测序技术原理和应用

  • 多组学技术介绍:

    • 转录组

      • lncRNA

      • miRNA

    • 甲基化

    • 染色质开放

    • 染色质交互

    • 组蛋白修饰

    • 蛋白组

    • 代谢组

    • 表型组


测序技术发展简史



测序技术原理: 第一代测序技术



Sanger测序法

  • 1977年, 英国的 Frederick Sanger发明;

  • 双脱氧链终止;

  • 电泳分离;

  • 放射自显影;

  • 荧光素标记;

  • 毛细管电泳;




测序技术原理: 第一代测序技术


测序技术原理: 第一代测序技术



测序技术原理: 第一代测序技术


  • 为什么头尾信号乱? 测序反应1000 bp左右, 有效碱基750bp左右
  • 测单端? 测双端? 测通?


  • 测序技术原理: 第一代测序技术


    序列峰图杂乱无章,测序干扰较大,没有明显主峰:
    测序模板与引物无法配对,或者配对能力较差


    测序技术原理: 第一代测序技术


    序列峰图出现重叠峰:
    上机的模板不止一个,扩增产生了不止一条序列


    测序技术原理: 第一代测序技术


    优点

    • 读长长: ~1000bp;

    • 准确性高: 99.999%;



    缺点

    • 成本高: 15元/反应

    • 通量低

    • 应用受限: 序列扩增


    测序技术原理: 第二代测序技术


    • 序列打断;

    • 末端修复、片段分选;

    • 连接接头;

    • PCR扩增;

    • 信号检测;


    测序技术原理: 第二代测序技术



    测序技术原理: 第二代测序技术


    MGI-DNB测序

    • Complete Genomics研发;

    • 2013年华大(BGI)收购;

    • DNA纳米球测序(DNB-Seq);

      • DNB制备;

      • 规则阵列芯片;

      • DNB加载;

      • 联合探针聚合测序;

      • 二链测序;

      • 碱基识别;

    • DNBSEQ-T7: 24h产生7Tb的PE-150读段(目前测序通量最大的平台之一)


    测序技术原理: 第二代测序技术

    第二代测序技术的应用

    • 基因组测序

      • 全基因组De novo测序

      • 全基因组重测序

      • 简化基因组测序

      • 宏基因组测序

    • 转录组测序

      • 常规bulk RNA-Seq

      • small RNA-seq

      • lncRNA-seq

      • Total RNA-seq

    • 表观遗传测序

      • DNA甲基化测序

      • 染色质开放ATAC-Seq

      • 染色质交互HiC

      • 组蛋白修饰CHIP-Seq

    • 单细胞测序

      • 单细胞转录组

      • 空间转录组

      • 单细胞多组学

    • 扩增子/靶向测序

      • 16s/18s宏基因组分类测序

      • 外显子测序

      • 靶向捕获测序

      • 自定义文库


    测序技术原理: 第二代测序技术

    第二代测序技术的应用: 基因组、外显子、靶向

    测序技术原理: 第二代测序技术

    第二代测序技术的应用: 简化基因组测序

    测序技术原理: 第三代测序技术-SMRT



    测序技术原理: 第三代测序技术


    PacBio SMRT: 单分子实时测序


    测序技术原理: 第三代测序技术-ONT



    测序技术原理: 第三代测序技术


    Oxford Nanopore: 纳米孔测序


    测序技术原理: 一二三代测序的优缺点



    • 一代:

      • 反应体系小, 适合小样本测序, 准确度最高, 测序读长长;

      • 通量低, 价格贵, 应用范围窄

    • 二代:

      • 通量高, 准确度较高, 应用范围广, 衍生了多种组学技术, 便宜;

      • 读长短, 测序错误有偏好性

    • 三代:

      • 读长超长, 单分子实时测序, 测序错误随机

      • 错误率高(以前), 通量低(以前), 贵








    测序技术的多组学应用



    测序技术的多组学应用简介


    测序技术的多组学应用简介

    基因转录的表观调控: 组蛋白修饰, 染色质交互, 染色质可及性(开放染色质), DNA甲基化

    组蛋白修饰

    甲基化, 乙酰化, 磷酸化 ...
    • H3K4-Meth => activate

    • H3K9-Meth => suppress

    • H3/H4-Ace => activate



    组蛋白修饰检测: CHIP-Seq



    CHIP-Seq: histone modification and more


    染色质开放: ATAC-Seq



    染色质交互: HiC



    DNA甲基化



    • 胞嘧啶C在DNA甲基转移酶催化下获得甲基基团;

    • DNA甲基化引起DNA构象、稳定性以及与蛋白互作的方式, 进而控制基因表达;

    • 甲基化位点不符合孟德尔定律, 但可以遗传 => 表观遗传;


    DNA甲基化: 测序原理



    二代测序: 重亚硫酸盐处理 C => U => T


    DNA甲基化: 测序原理

    三代测序: 直接检测

    三代测序技术的甲基化检测原理 PacBio:

    • 甲基化和非甲基化位点信噪比不同

    • 甲基化位点后出现长脉冲间歇

    • 对5-mC和5-hmC检测灵敏度不高

    ONT:

    • 甲基化与否的序列电流波动不同

    • 不能鉴定未知的甲基化类型