章节实例:第1章 深度测序技术与生物信息学
第一部分:生物信息学杂志特刊中的软件及其分类
早在2009年深度测序技术刚刚兴起时,牛津大学出版社的Bioinformatics杂志就设了一个虚拟期号,将出版在该杂志上的相关文章收集在这一期刊的虚拟期上(virtual issue),及时更新相关的算法和软件信息,这是一个深度测序数据分析软件的重要信息源。当然在其它期刊如Nucleic Acids Research,Genome Biology,BMC Bioinformatics和PLOS computational biology也有一些报道。在Bioinformatics杂志上的工具软件分为以下十类:
1) Alignment(测序对比)
2) Assembly(测序组装)
3) Base calling(碱基识别)
4) ChIP-seq(研究蛋白质与DNA结合位点分析)
5) Diagnosis(诊断应用)
6) Miscellaneous(其它)
7) Pipeline(分析流程工具)
8) RNA-seq(转录组测序)
9) Variant detection(变异检测)
10) Visualization(可视化)
详情请参见:https://academic.oup.com/bioinformatics/pages/next_generation_sequencing。
第二部分:R与Bioconductor平台
R语言和基于R语言的Bioconductor是生物信息学家不可缺少的工具,Biocondictor平台上(http://www.bioconductor.org/),不仅可以下载生物信息学(包括深度测序数据分析)软件和数据,网页上还有大量的学习材料供初学者乃至专家熟悉相关的软件和生物信息学应用。
1)深度测序相关的软件包
目前,Biocondictor平台上有关生物技术相关的分析软件包有871个,其中测序相关的软件包约433个,见表1-1(详细信息见相关网页)。
* http://www.bioconductor.org/packages/release/BiocViews.html#___Technology
** http://www.bioconductor.org/packages/release/BiocViews.html#___Sequencing
2)深度测序相关的实验数据包
Biocondictor平台上有关生物技术相关的数据包有202个,其中测序相关的软件包有70个,见表1-2(详细信息见相关网页)。
* http://www.bioconductor.org/packages/release/BiocViews.html#___TechnologyData
** http://www.bioconductor.org/packages/release/BiocViews.html#___SequencingData