第4章

章节实例:第4章 基因组序列比对



第二代测序片段比对软件Maq

Maq的下载地址为:http://maq.sourceforge.net/。该软件运行性能较高,比对结果精确,是一款著名的短序列片段比对软件。

首先,为了降低硬盘使用量,Maq将参考基因组序列转变转化为二进制的fasta格式(BFA),将短序列片段转化为二进制的fastq格式(BFQ)。具体步骤如下:

1)进入安装Maq的根目录,这里的安装路径为:~/C/First/Maq/maq-0.7.1。

2)将参考基因组FASTA文件转化为二进制FASTA文件,命令如下:

$ ./maq fasta2bfa ~/datalist/genome/E.coli/E.coli_genome.fa E.coli.bfa

其中,“./maq fasta2bfa”命令的作用是将参考基因组FASTA文件转化为二进制FASTA文件。具体格式如下:

./maq fasta2bfa 参考基因组FASTA文件地址 生成的二进制FASTA文件地址

3)将短序列片段转化为二进制的fastq格式(BFQ),命令如下:

$./maq fastq2bfq ~/datalist/SRR023978.fastq SRR023978.bfq

其中,“./maq fastq2bfq”命令的作用是将短序列片段FASTQ文件转化为二进制FASTQ文件。具体格式如下:

./maq fasta2bfq 短序列片段FASTQ文件地址 生成的二进制FASTQ文件地址

4)将短序列片段定位到参考基因组上,命令如下:

./maq map align.map E.coli.bfa SRR023978.bfq

其中,“./maq map”命令的作用是将短序列片段定位到参考基因组上。具体格式如下:

./maq map 比对结果文件地址 参考基因组二进制FASTA文件地址 短序列片段二进制文件地址

5)结果可视化。使用如下命令查看Maq的比对结果:

./maq mapview