修饰碱基检测
Tombo 提供了四种方法(包括两种样本比较方法)来检测原始电流信号水平的偏移,这些偏移指示了非标准碱基的存在。这四种方法允许研究人员在任何样本类型下调查非标准碱基,并在适用时更准确地检测特定修饰。
所有四种方法都可以通过 tombo detect_modifications
命令组访问,如下所述。
TL;DR:
-
特定模型的方法(版本 1.5 新增;提供大肠杆菌 dcm 和 dam 以及 CpG 甲基化模型的特定基序)提供了最准确的修饰碱基检测,因此在适用时是首选方法。
- 通过
tombo detect_modifications alternative_model
命令访问这些模型,使用--alternate-bases dam dcm CpG
选项。
- 通过
-
所有上下文的替代模型(不如基序模型准确)在任何序列上下文中识别 5-甲基胞嘧啶(5mC;DNA 或 RNA)和 N6-甲基腺苷(6mA;仅 DNA),运行
tombo detect_modifications alternative_model
命令,使用--alternate-bases 5mC 6mA
选项。 -
对于更实验性的从头修饰碱基检测,运行
tombo detect_modifications de_novo
命令,仅提供一组读取以与标准碱基模型进行比较。 -
对于通过与对照样本(例如 PCR 或 IVT)比较进行修饰碱基检测,运行
tombo detect_modifications model_sample_compare
命令,并提供一组对照读取(--control-fast5-basedirs
)。 -
对于通过与任何第二个样本比较进行修饰碱基检测,运行
tombo detect_modifications level_sample_compare
命令,并提供第二组读取(--alternate-fast5-basedirs
)。 -
每个
tombo detect_modifications
命令将生成一个二进制文件(不打算在 Tombo 框架之外使用)。- 要提取有用的文本文件,请参见
tombo text_output
命令。 - 要可视化显著区域周围的原始信号,请使用
tombo plot most_significant
命令。 - 要根据基本事实(基序或先前识别的位点)评估测试结果,请使用
tombo plot motif_with_stats
、tombo plot roc
、tombo plot sample_compare_roc
、tombo plot per_read_roc
和tombo plot sample_compare_per_read_roc
命令。
- 要提取有用的文本文件,请参见
提示:
在处理 tombo detect_modifications
之前,必须对一组读取运行 tombo resquiggle
命令。
特定替代碱基检测(推荐)
为了检测特定的非标准碱基,使用 tombo detect_modifications alternative_model
命令。该命令识别信号匹配替代碱基预期水平优于标准碱基预期水平的位点。该命令计算类似于对数似然比(LLR)的统计量,但动态缩放以更稳健地处理异常信号水平。该统计量是为每个“交换碱基”在每个读取中计算的(例如,每个胞嘧啶用于 5mC 检测或每个腺苷用于 6mA 检测)。
该统计量通过将 LLR 按具有相同方差和标准碱基与替代碱基预期信号水平中间值的正态似然函数进行缩放来计算。为了给具有更大标准碱基与替代碱基预期信号水平差异的序列上下文更大的权重,增加了三个额外的缩放因子ÿ