关于++, ±, -+, --的解释
++对应着参考基因组的正链(有义链,非模板链,即hg38的序列,watson链);
+-代表正链的互补链(正常情况下正链的互补链是负链,但在重硫酸盐处理后正链和负链并不互补);
-+代表负链(模板链,crick链)
--代表负链的互补链。
bsmap的输出结果
使用的模式是
r=0: 只输出唯一比对上的reads(包括单端和双端)
n=1: map SE or PE reads to all 4 strands
p=8:线程数为8
S=1234:随机种子
上述输入的read pairs是8432889对,比对完后输出的bam文件有757427条记录。
对757427条记录进行拆解:516290(双端比对到同一染色体的reads数)+232457(单端比对上的reads数)+8680(双端比对到不同染色体的reads数)。
516290和输出结果中的unique pairs: 257594对不上(257594*2=515188),相差的1102条是read 1和read 2完全反向互补的reads(bam格式中第7列是=,第9列是0)。