SequenceVariant可以使用Haplotype类型的构造函数直接获得变异信息。
Haplotype类型存储了参考序列信息, 可以利用reconstruct函数重建query序列:
提供 RawREF => NewREF的比对结果, 就可以用translate函数把变异切换到NewREF:
利用Variation构造函数:
利用variations()函数从Haplotype中提取:
translate函数也可以对Variation进行切换:
in函数用于在Haplotype中查找Variation
| Variation | Ovis aires | Homo sapiens |
|---|
| C22T | true | false |
| G29A | true | false |
| C4A | false | true |
| T13C | false | true |
| C14A | false | true |
| G17A | false | true |
| C19A | false | true |
| T20G | false | true |
| G25T | false | true |
用变异构建新的单倍型
Edits类型
Substitution类型
Deletion类型
Insertion类型
变异发生的位置不存储在以上数据结构中。
Haplotype{S<:BioSequence,T<:BioSymbol} 记录了一系列变异的集合 构造函数:
当从Edit和Variation构造时, 从序列的第一个位置到最后一个位置依次引用, 因此必须始终按照位置对向量排序。
reference(h::Haplotype): 提取h的参考序列
variations(h::Haplotype{S,T}) where {S, T}: 把h中的edits转变成Variation向量
reconstruct(h::"Haplotype): 重构query序列
translate(h::Haplotype{S,T}, aln::PairwiseAlignment{S,S}) where {S,T}
根据aln切换ref, 位于开头或结尾的INDEL可能无法保存。
Variation{S<:BioSequence,T<:BioSymbol} 包含ref和edit, 比
Edit类型更稳健。
构造函数:
鼓励使用
variations(h)的方式构造。