我的HIFI数据是bam格式,今天遇到一个行家,大佬问我的bam是subreadsbam 还是ccsbam。这个问题难到我了,从老板那里拿到数据的时候我也没看名字,文件名里面也没有写。我草草给大佬截完图之后大佬说这是CCSbam,直接转fq就行,用bamTofq。我测试了一下!
bamToFastq [OPTIONS] -i <BAM> -fq <FASTQ>
结果是
bamtofastq v1.4.1
Unknown flag: '-i'
Usage:
bamtofastq [options] <bam> <output-path>
bamtofastq (-h | --help)
就在我十分无助的时候我找到了samtools自带的bam2fq,于是我有了如下命令。
samtools bam2fq new.bam > name.fastq && gzip -c name.fastq >name.fastq.gz
在执行这一步之前,我依旧是对我的bam文件进行了排序操作
samtools sort -n old.bam -o new.bam
这个地方,导致我的new.bam文件比old.bam文件小了0.3G,猛然间想起大佬说CCSbam不需要排序,直接转就行…?
![加群]charles_kiko@163.com 备注基因组加群。