章节实例:第4章 基因组序列比对
第二代测序片段比对软件Maq
Maq的下载地址为:http://maq.sourceforge.net/。该软件运行性能较高,比对结果精确,是一款著名的短序列片段比对软件。
首先,为了降低硬盘使用量,Maq将参考基因组序列转变转化为二进制的fasta格式(BFA),将短序列片段转化为二进制的fastq格式(BFQ)。具体步骤如下:
1)进入安装Maq的根目录,这里的安装路径为:~/C/First/Maq/maq-0.7.1。
2)将参考基因组FASTA文件转化为二进制FASTA文件,命令如下:
$ ./maq fasta2bfa ~/datalist/genome/E.coli/E.coli_genome.fa E.coli.bfa
其中,“./maq fasta2bfa”命令的作用是将参考基因组FASTA文件转化为二进制FASTA文件。具体格式如下:
./maq fasta2bfa 参考基因组FASTA文件地址 生成的二进制FASTA文件地址
3)将短序列片段转化为二进制的fastq格式(BFQ),命令如下:
$./maq fastq2bfq ~/datalist/SRR023978.fastq SRR023978.bfq
其中,“./maq fastq2bfq”命令的作用是将短序列片段FASTQ文件转化为二进制FASTQ文件。具体格式如下:
./maq fasta2bfq 短序列片段FASTQ文件地址 生成的二进制FASTQ文件地址
4)将短序列片段定位到参考基因组上,命令如下:
./maq map align.map E.coli.bfa SRR023978.bfq
其中,“./maq map”命令的作用是将短序列片段定位到参考基因组上。具体格式如下:
./maq map 比对结果文件地址 参考基因组二进制FASTA文件地址 短序列片段二进制文件地址
5)结果可视化。使用如下命令查看Maq的比对结果:
./maq mapview