生物信息学

关于本课程的一些说明




桂松涛 Blog
songtaogui@163.com


2023年10月

WHY? 事要知其所以然

生物信息工具的使用也需要理解背后的原理

PCR:

  • 引物设计

  • 扩增片段大小

  • 反应循环次数

  • RT-PCR; Q-PCR ...



BLAST:

  • e-value阈值

  • 罚分矩阵

  • gap open/extension

  • 预设参数: megablast, blastx-fast ...


生信专业从业者的技能树

Bioinformatics ≈ Biology + Programming + Mathematics

新手村技能加点

  1. 基本的生物学和组学知识: 测序(二代/三代), RNA-Seq, 甲基化, ChIP-seq, ATAC-seq, 单细胞 ...

  2. 了解常用的生物数据库资源: NCBI, Ensemble, UCSC, Uniprot, CoGe, Panther ...

  3. Linux系统相关: Shell(Bash)编程, 作业调度, 超算使用 ...

  4. 掌握至少一门通用编程语言: python, perl, R, julia, rust, java, C++ ...

  5. 基本的数据分析技巧: 表格操作, 数据可视化 ...

  6. 基本的统计分析知识: 数据分布、假设检验、线性回归、聚类 ....

  7. 常见的生物信息学算法: 动态规划, 遗传算法, BWT转换, 序列比对 ...








生信工具使用者的加点建议


我以湿实验为主, 偶尔使用常规分析流程、现成的生信软件做一些基础分析, 我要学啥?

  • 基本的linux操作;

  • 组学技术和测序建库原理有本的认识;

  • 了解常用的生信数据库和软件;

  • 善用搜索工具找到自己需要的软件, 并能看懂说明书;

  • 学会向生信专业人员描述问题, 快速获得帮助;


"切, 电脑里又种不出粮食"

  • 编程可以快速训练抽象的能力;

  • 生信从业者情绪不稳定(久坐+熬夜+头发少), 对我们友好一些🙂;


课程概览


1. 生信基础
  • 1.1 生物信息学导论和常用生物信息数据库
  • 1.2 针对生信的Linux系统介绍
  • 1.3 针对生信的Shell编程和生信分析软件介绍

  • 2. 数据挖掘
  • 2.1 生信分析中的统计知识导览
  • 2.2 生信编程语言导览
  • 2.3 基于R语言的数据可视化实践
  • 3. 生信分析专题系列
  • 3.1 转录组分析理论和实践
  • 3.2 基因家族分析理论和实践
  • 3.3 多组学分析概览
  • 3.4 遗传变异鉴定和群体分析
  • 3.5 遗传定位分析专题
  • 3.6 基因组分析专题

  • 绝知须躬行

    • 课上内容以框架、大纲为主;

    • 提供自学资源、资料;

    • 90%以上的内容需要课下自学掌握;