分子生物学常用软件

随着计算机技术和Internet数字化高速公路日新月异的飞速发展,生物信息(Bioinformation)和生物电脑化(Biocomputing)也飞速发展,愈来愈多的生物学家(Bioscientist)根据生物科学(Biosience)研究的实际需要,编写了大量的生物科学应用软件。生物科学软件应用范围非常广泛,从最基本的多媒体互动式教学到最高级的虚拟细胞生命过程的互动式模拟,可谓应有尽有[1,2,3]。这些软件的实际应用,为医学进一步信息数字化、信息全球共享化带来了光明的前景。而分子生物学作为生命科学一个极为重要的分枝,理所当然倍受重视,其相应的生物科学应用软件可谓枚不胜举[2,3,4]。分子生物学专业软件(MolecularBiologySoftware;Biosoft)的应用,为广大分子生物学研究人员的医、教、研工作带来了极大的便利性。

与普通的应用软件相同,分子生物学专业软件的种类主要有纯商业软件(只提供软件功能演示)、商业共享演示软件(全部或部分软件功能但使用时间极为有限)和免费软件[2]。对于前两种软件而言,只有付出一定的费用,才会得到全功能的商业软件,而后者却完全免费使用。对于大多数资金有限的从事分子生物学研究的教师、工作人员和学生等,免费软件通常是唯一的选择。因此,本文着重介绍在PC机WINDOWS95/98和Mac机OS操作系统上应用的分子生物学免费软件及其重要性,并指出在何处可以找到自己所需的免费软件以及在论文写作和发表中如何处理免费软件应用的相关问题。

一.分子生物学专业软件在分子生物学领域应用的重要性

在分子生物学研究领域中,引物设计、多序列比较分析、基因进化树结构分析、核酸/蛋白质高级结构预测等等,若单纯依靠手工设计与分析,几乎很难达到理想要求。而通过使用分子生物学专业软件,则可以很轻松地设计出符合要求的引物、简便快速地进行多序列的分析比较等。不仅如此,它还可制作具有专业水平的图形图像,如质粒图谱、克隆表达载体构建图谱、限制性酶切片段图谱等。分子生物学专业软件应用可以比较方便地解决分子生物研究人员从立项到最后写论文的实际问题,它在分子生物学的应用范围主要有:研究资料收集整理(如序列查询、文献检索)、序列分析和实验设计(如引物设计、限制性酶切分析、同源序列比较、质粒作图、基序查找、RNA二级结构预测、蛋白二级结构预测、克隆策略图谱、蛋白三级结构显示、序列格式转换、DNA测序样品原始胶图文件分析等)、实验数据统计和分析(如电泳条带定量分析、数据统计分析作图)、论文写作和发表(如文献引用、生成发表质量的图片、序列递交)。

二、分子生物学免费软件的索取与应用

从国际互联网Internet中可以发现并收集到大量分子生物学医、教、研免费软件。其中,大部分应用软件均由生物学家、化学家和软件开发者所写。

2.1免费软件与商业软件

当分子生物学家的科研需要一类新的分析演算法则时,就将其具体化成软件,如大部分免费的基本分子生物学序列分析软件包均是由生物科学家开发的,包括FastA、BLAST、Clustal、MFOLD、PHYLIP、Paup、CAP等。通常此类软件的源代码属于免费共享。与商业软件相比,免费软件往往在用户界面、易用性及集成性方面稍逊一畴,而且,商业软件包在软件的升级支持、技术支持等方面也有一定的优势。因此,在资金许可的情况下,商业软件通常是一种更好的选择。但免费软件的最大优势就在于它为广大从事分子生物学研究的相关人员提供了专业性相关最好的软件资源,甚至某此免费软件提供的功能比商业软件更强大,或者还提供了商业软件未能提供的功能。

此外,随着生物信息和生物电脑化的飞速发展,许多优秀的程序员都正在开发软件,其中许多人将此类软件作为一种免费软件。现在,许多免费软件都特别注重用户界面、易用性及集成性。对于大部分科学应用软件,由于其潜在的市场非常小,以致于有时免费软件包与昂贵的商业软件包在功能上没有明显的差别。

2.2Internet资源——分子生物学免费软件资源点

自从80年代开始,生物科学免费软件已经可以广泛地通过Internet获得。现在有许多专用于存放生物科学免费软件及其相应资料的档案文件库(Archives),而且,还有许多免费软件作者自己提供的网络服务器,从这些站点上,可以最大限度地收集到各种用途的分子生物学免费软件。

目前,存放分子生物学软件最常用的两个档案库是印地安那州大学的IUBio档案文件库(IUBio)和欧洲生物情报协会(EuropeanBioinformaticsInstitute,EBI)软件档案文件库,其统一资源定位器(RUL)地址分别是http://iubio.bio.indiana.edu/或ftp://iubio.bio.indiana.edu/(IUBio)和http://www.ebi.ac.uk/或ftp://ftp.ebi.ac.uk/(EBI)。

通过EBI可以连接到EMBL数据库及其它数据库的主页及许多分子生物学软件档案库主页,如生物软件目录表(BioCatalogofsoftware,http://www.ebi.ac.uk/biocat/biocat.html)。

IUBio也与许多生物软件主页相连,并提供对GenBank、SwissPort和PIR数据库关键字查询及生物网络新闻档案库服务(BionetNetworkNewsArchives)。IUBio在世界各地有许多镜像站点,包括芬兰、瑞典、日本、英国、法国、西班牙、以色列等。

除上述两个主要的档案库外,还有许多类似的分子生物学免费软件档案库,如http://kiwi.imgen.bcm.tmc.edu:8088/search-launcher/launcher.html、http://www.ncbi.nlm.nih.gov/、http://expasy.hcuge.ch/。

2.3查询与索取软件技巧

在知道软件名称及网址时,可直接方便地从网上下载相应的软件。但当不知道软件网址或仅仅想了解大部分软件时,就可以通过Internet上的各类搜索引擎进行查询,如Google(http://www.google.com)、Yahoo(http://www.yahoo.com/)、网易(http://www.163.com)、Altavista(http://www.altavista.digital.com/)等,此时,以软件名称进行特定的搜索查询,或以其它关键词,如molecularbiologicalsoftware进行广泛的搜索,即可查询到相关软件网址。

索取软件的方式通常有以下几种。首先可在软件所在网站直接下载:如Netscape、InternetExplore及其它网页浏览器均可通过HTTP(超级文本传输协议)或FTP(文件传输协议)下载软件。其次,某些软件还可通过Internet网站向用户以软盘或光盘形式免费提供商业软件演示版本软件包,此外,某些免费软件还可向软件作者直接以电子邮件的形式索取。

要牢记一点的就是软件是不断升级的,如果使用软件版本有问题的话,也许现在或很快就有新的版本。软件作者的主站点是检查软件是否升级的最好的地方,而档案服务器并不总贮存有软件的最新当前版本。

2.4安装和使用

通常,免费软件含有安装说明,但并不总是很详细,或不能涉及软件运行时涉及的所有问题。软件的特殊安装一般只有商业软件才会有,一般而言免费软件是不需要特殊安装的。对于部分特殊软件,特别是用Java或Perl语言写的软件,常会要求您还要安装其它免费的常用软件后才能使用,因此,一定要首先详细地阅读免费软件的安装说明。

2.5多平台软件

以1998年的统计而言,在当年访问IUBio及其它生物网络服务器的INTERNET浏览器中,30-50%的生物学家使用Mac计算机,40-70%使用Wintel系统(Microsoft和Intel的联合),少于10%使用XWindows系统作为工作平台。生物科学家对计算机系统及软件的保持不同,根据软件的运行环境,许多已经使用或将要使用多平台操作系统。在今后,有可能Mac上运行MSWindows软件运行,而在Wintel系统运行一些MacOS程序。

近年出现的Java语言使得开发跨平台的多种操作系统的软件成为可能,从而使一应用软件可在任何一台计算机上被任何需要它的人所使用,这无疑是软件应用的一种理想境界。诞生于SunMicrosystems(http://www.javasoft.com)的Java开发系统虽然与C++、C语言及其它语言所开发的程序相比,Java软件的运行速度还比较慢,但有望开发出多平台操作系统中运行流畅的应用软件。在今后,将会有许多用Java语言开发的生物科学软件,例如来自于Licor的序列分析软件包(http://www.licor.com)。

2.6客户端服务器软件

许多生命科学软件开发者的观念是将用户界面从分析应用程序中分离出来,从而增强应用程序的易用性。这一观念构成了软件客户端服务器软件的理论基础,如目前可以进行多种数据分析的网页界面的应用程序(如SeqPup)。

SeqPup功能及原理如下:它充许用户使用任何自己需要的分析软件,如Clustal、CAP、tacg、fastDNAml或别的软件,在客户端计算机或服务器计算机上运行。SeqPup提供了序列编辑、多序列比较、序列输入输出选项等功能。并可配置如上所述分析软件。这些分析应用程序通常没有命令行选项,但可对复杂的数据进行编辑和分析。有了如SeqPup的客户端应用程序后,使用这些软件就比较简单,并可按照自己的方法组织和管理自己的数据。

由PeterRice开发的一套免费分子生物学分析应用软件EMBOSS(http://www.sanger.ac.uk/Software/EMBOSS/)将运行于UNIX服务器计算机,有命令行界面。EMBOSS将包括多种序列分析项目,而且力求提供与其它公众域(PublicDomain,用户可以免费获得公众域的服务或文件)软件包集成的简便性。分析功能包括快速的数据库序列搜索、小片段基因组密码子作用分析、微生物基因序列识别、多序列的快速鉴别、蛋白基序识别、发表论文的出版工具等。

三.优秀免费软件举例

3.1Clustal:多序列比较(sequencealignment)

Clustal是一类多序列比较软件,目前最新版本叫ClustalW,可以应用于MacOS、Wintel、UNIX和VMS计算机。对多个核酸或蛋白序列的比较目前是分子生物学中一类很有用的分析工具,可用于寻找特征化蛋白家族的诊断模式、预测新序列的二级/三级结构、设计PCR引物,以及分析分子演变进程。Clustal可在EBI和IUBio的档案库ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW中下载。此软件的商业版本称之为ClustalX,它提供了一种图形界面,但功能相似。

3.2Entrez:基因组序列搜索引擎及MEDLINE检索工具

Entrez是可通过关键字搜索基因序列和检索MEDLINE文献的多平台操作系统软件,由美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)的成员开发,可以从http://ncbi.nlm.nih.gov/或ftp://ncbi.nlm.nih.gov/下载。Entrez的优点之一就是它包含了对MEDLINE的查询,从而可以检索向序列数据库递交的文献摘要。NCBI的万维网(WWW)服务还提供了可以通

过用户网页浏览器进行搜索的另一类型的Entrez。NCBI开发的Entrez应用程序源代码为其它生物科学应用程序提供了一个软件框架,如SeqPup、Clustal-X等。

3.3NIHImage:图像分析

NIHImage是由WayneRasband编写的Mac图像分析应用程序,可对图像面积、平均密度、重心及用户定义的多边形区域的分析,自动进行点的分析、测定路径长度和角度。该软件可在ftp://zippy.nimh.nih.gov/pub/nih-image/、http://rsb.info.nih.gov/nih-image/处下载。目前,已提供了针对MSWindows的新版本,可从http://www.scioncorp.com/处下载。

3.4PHYLIP:系统发生分析

PHYLIP是由JosephFelsenstein开发的多平台操作系统常用系统发生推论软件(PhylogenyInferencePackage),具有DNA和蛋白序列分析、限制性酶切位点分析、距离矩阵和基因频率、进化树绘制,可以通过许多选项精确控制分析过程。PHYLIP的下载网址为http://evolution.genetics.washington.edu/或ftp://evolution.genetics.washington.edu/。

3.5RasMol:分子模型浏览

RasMol是一类可以浏览蛋白、核酸和小分子物质的多平台操作系统常用分子图形观察器。此类软件的目的是显示、教学和制作出版质量的图像。RasMol以交互式界面、多种颜色和外形显示分子,并可对分子外框架线条的颜色与粗细、分子空间填充物球形、棒状、实心或空心等进行选择。RasMol下载的主站点是ftp://ftp.dcs.ed.ac.uk/pub/rasmol/。

3.6SeqPup:序列编辑

SeqPup是由DonGilbert用Java语言开发的多平台操作系统序列编辑和分析软件,其前身称SeqApp,其优势在于可外挂网络服务器及其它序列分析应用程序,如ClustalW、CAP、tacg、fastDNAml及其它相应软件,功能包括多序列的比较和单序列的编辑、读写多种序列文件格式、序列特征编辑等,可在ftp://iubio.bio.indiana.edu/molbio/seqpup/下载。

四.免费软件实际应用相关问题

4.1公众域版权问题

大部分免费软件的版权属于作者或赞助商。他们只是给你免费使用软件的权利,可能只是一种非商业性使用。使用商业软件或其它付款方式使用的软件,则取得作者认可的版权的使用。许多免费软件都一起提供了源代码,因此用户可以修改并进一步开发它。这对于富有经验的用户做自己所需的分析带来的极大的便利性,但必需注意商业软件包是不充许的。如果作者将其作品放在公众域,并不保留任何控制,那么软件就可以用于商业用途。

4.2软件出版索引

若在一项研究中应用了免费软件,则研究论文的发表将涉及到免费软件出版索引问题,正如引用了某篇参考文献一样。那么,如何使用索引呢?一些免费软件有公司出版的相关文章直接引用,而另一些则没有。因此对于后者若在杂志/卷号部分引用软件的InternetURL地址将是非常有用的。就目前Internet的使用情况而言,一般大部分软件可在10年或更长的时间位于Internet的同一个URL地址。因此,保留URL地址对于文献查阅者是非常有用的。下面,是索引的两个例子:

Felsenstein,J.1993.PHYLIP(PhylogenyInferencePackage)version3.5c.Distributed

ftp://evolution.genetics.washington.edu/.DepartmentofGenetics,UniversityofWashington,Seattle.

Gilbert,D.G.,1996.SeqPup,biosequenceeditor&analysisplatform,version

Seealsoftp://iubio.bio.indiana.edu/molbio/seqpup/

4.3向免费软件作者表达谢意

出于对生物科学免费软件的尊敬与感谢,当研究者能够在发表的研究论文末对相应的免费软件作者表达一份谢意,则一方面承认了免费软件在研究中的作用,另一方面可激励软件作者进一步开发软件的相关功能,有利于软件的进一步完善。此外,还可到Internet上专用的一此档案文件库所在地对作者表达自己的感谢,如以前80年代其主站点在Intelligenetics的GenBank就曾有一个免费分子生物学软件的档案文件库。

五.结束语

分子生物学应用软件随着分子生物学研究技术的不断发展和Internet网络资源的不断普及,正以前所未有的速度飞速发展,应用于分子生物学研究领域的软件不断由分子生物学研究及相关人员开发。这些专业性应用软件已经成为分子生物学研究的一类有力的辅助工具,极大地方便了分子生物学研究。相信随着分子生物学、计算机及Internet的进一步发展,分子生物学专业性应用软件将具有更广阔、更有价值的应用前景。

0.6.bytheauthoratBionet.Software,July1996.

参考文献:

1.PeruskiL.F.andPeruskiA.H,1997.TheInternetandtheNewBiology:ToolsforGenomicandMolecularResearch;LibraryofCongressCataloging-in-PublicationData,AmericanSocietyforMicrobiology1325MassachusettsAve.,NWWashington,DC.

2.DonGilbert,FreeSoftwareinMolecularBiologyforMacintoshandMSWindowscomputers(http://iubio.bio.indiana.edu/soft/molbio/Listings.html),June1998,BiologyDepartmentIndianaUniversity,Bloomington,IN47405/AboutSnarkware.html),Lastupdated13March1999,UniversityofWashington

3.EliMeir,WhoisSnarkWare/BeakerWare(http://www.snarkware.net

4.Hoyoyo,生物化学分子生物学软件下载区-分子生物一线实验人员软件解决方案,1999,生物化学分子生物学软件下载区(http://www4.nease.net/~hoyoyo/index.htm)

随着计算机技术和Internet数字化高速公路日新月异的飞速发展,生物信息(Bioinformation)和生物电脑化(Biocomputing)也飞速发展,愈来愈多的生物学家(Bioscientist)根据生物科学(Biosience)研究的实际需要,编写了大量的生物科学应用软件。生物科学软件应用范围非常广泛,从最基本的多媒体互动式教学到最高级的虚拟细胞生命过程的互动式模拟,可谓应有尽有[1,2,3]。这些软件的实际应用,为医学进一步信息数字化、信息全球共享化带来了光明的前景。而分子生物学作为生命科学一个极为重要的分枝,理所当然倍受重视,其相应的生物科学应用软件可谓枚不胜举[2,3,4]。分子生物学专业软件(MolecularBiologySoftware;Biosoft)的应用,为广大分子生物学研究人员的医、教、研工作带来了极大的便利性。

与普通的应用软件相同,分子生物学专业软件的种类主要有纯商业软件(只提供软件功能演示)、商业共享演示软件(全部或部分软件功能但使用时间极为有限)和免费软件[2]。对于前两种软件而言,只有付出一定的费用,才会得到全功能的商业软件,而后者却完全免费使用。对于大多数资金有限的从事分子生物学研究的教师、工作人员和学生等,免费软件通常是唯一的选择。因此,本文着重介绍在PC机WINDOWS95/98和Mac机OS操作系统上应用的分子生物学免费软件及其重要性,并指出在何处可以找到自己所需的免费软件以及在论文写作和发表中如何处理免费软件应用的相关问题。

一.分子生物学专业软件在分子生物学领域应用的重要性

在分子生物学研究领域中,引物设计、多序列比较分析、基因进化树结构分析、核酸/蛋白质高级结构预测等等,若单纯依靠手工设计与分析,几乎很难达到理想要求。而通过使用分子生物学专业软件,则可以很轻松地设计出符合要求的引物、简便快速地进行多序列的分析比较等。不仅如此,它还可制作具有专业水平的图形图像,如质粒图谱、克隆表达载体构建图谱、限制性酶切片段图谱等。分子生物学专业软件应用可以比较方便地解决分子生物研究人员从立项到最后写论文的实际问题,它在分子生物学的应用范围主要有:研究资料收集整理(如序列查询、文献检索)、序列分析和实验设计(如引物设计、限制性酶切分析、同源序列比较、质粒作图、基序查找、RNA二级结构预测、蛋白二级结构预测、克隆策略图谱、蛋白三级结构显示、序列格式转换、DNA测序样品原始胶图文件分析等)、实验数据统计和分析(如电泳条带定量分析、数据统计分析作图)、论文写作和发表(如文献引用、生成发表质量的图片、序列递交)。

二、分子生物学免费软件的索取与应用

从国际互联网Internet中可以发现并收集到大量分子生物学医、教、研免费软件。其中,大部分应用软件均由生物学家、化学家和软件开发者所写。

2.1免费软件与商业软件

当分子生物学家的科研需要一类新的分析演算法则时,就将其具体化成软件,如大部分免费的基本分子生物学序列分析软件包均是由生物科学家开发的,包括FastA、BLAST、Clustal、MFOLD、PHYLIP、Paup、CAP等。通常此类软件的源代码属于免费共享。与商业软件相比,免费软件往往在用户界面、易用性及集成性方面稍逊一畴,而且,商业软件包在软件的升级支持、技术支持等方面也有一定的优势。因此,在资金许可的情况下,商业软件通常是一种更好的选择。但免费软件的最大优势就在于它为广大从事分子生物学研究的相关人员提供了专业性相关最好的软件资源,甚至某此免费软件提供的功能比商业软件更强大,或者还提供了商业软件未能提供的功能。

此外,随着生物信息和生物电脑化的飞速发展,许多优秀的程序员都正在开发软件,其中许多人将此类软件作为一种免费软件。现在,许多免费软件都特别注重用户界面、易用性及集成性。对于大部分科学应用软件,由于其潜在的市场非常小,以致于有时免费软件包与昂贵的商业软件包在功能上没有明显的差别。

2.2Internet资源——分子生物学免费软件资源点

自从80年代开始,生物科学免费软件已经可以广泛地通过Internet获得。现在有许多专用于存放生物科学免费软件及其相应资料的档案文件库(Archives),而且,还有许多免费软件作者自己提供的网络服务器,从这些站点上,可以最大限度地收集到各种用途的分子生物学免费软件。

目前,存放分子生物学软件最常用的两个档案库是印地安那州大学的IUBio档案文件库(IUBio)和欧洲生物情报协会(EuropeanBioinformaticsInstitute,EBI)软件档案文件库,其统一资源定位器(RUL)地址分别是http://iubio.bio.indiana.edu/或ftp://iubio.bio.indiana.edu/(IUBio)和http://www.ebi.ac.uk/或ftp://ftp.ebi.ac.uk/(EBI)。

通过EBI可以连接到EMBL数据库及其它数据库的主页及许多分子生物学软件档案库主页,如生物软件目录表(BioCatalogofsoftware,http://www.ebi.ac.uk/biocat/biocat.html)。

IUBio也与许多生物软件主页相连,并提供对GenBank、SwissPort和PIR数据库关键字查询及生物网络新闻档案库服务(BionetNetworkNewsArchives)。IUBio在世界各地有许多镜像站点,包括芬兰、瑞典、日本、英国、法国、西班牙、以色列等。

除上述两个主要的档案库外,还有许多类似的分子生物学免费软件档案库,如http://kiwi.imgen.bcm.tmc.edu:8088/search-launcher/launcher.html、http://www.ncbi.nlm.nih.gov/、http://expasy.hcuge.ch/。

2.3查询与索取软件技巧

在知道软件名称及网址时,可直接方便地从网上下载相应的软件。但当不知道软件网址或仅仅想了解大部分软件时,就可以通过Internet上的各类搜索引擎进行查询,如Google(http://www.google.com)、Yahoo(http://www.yahoo.com/)、网易(http://www.163.com)、Altavista(http://www.altavista.digital.com/)等,此时,以软件名称进行特定的搜索查询,或以其它关键词,如molecularbiologicalsoftware进行广泛的搜索,即可查询到相关软件网址。

索取软件的方式通常有以下几种。首先可在软件所在网站直接下载:如Netscape、InternetExplore及其它网页浏览器均可通过HTTP(超级文本传输协议)或FTP(文件传输协议)下载软件。其次,某些软件还可通过Internet网站向用户以软盘或光盘形式免费提供商业软件演示版本软件包,此外,某些免费软件还可向软件作者直接以电子邮件的形式索取。

要牢记一点的就是软件是不断升级的,如果使用软件版本有问题的话,也许现在或很快就有新的版本。软件作者的主站点是检查软件是否升级的最好的地方,而档案服务器并不总贮存有软件的最新当前版本。

2.4安装和使用

通常,免费软件含有安装说明,但并不总是很详细,或不能涉及软件运行时涉及的所有问题。软件的特殊安装一般只有商业软件才会有,一般而言免费软件是不需要特殊安装的。对于部分特殊软件,特别是用Java或Perl语言写的软件,常会要求您还要安装其它免费的常用软件后才能使用,因此,一定要首先详细地阅读免费软件的安装说明。

2.5多平台软件

以1998年的统计而言,在当年访问IUBio及其它生物网络服务器的INTERNET浏览器中,30-50%的生物学家使用Mac计算机,40-70%使用Wintel系统(Microsoft和Intel的联合),少于10%使用XWindows系统作为工作平台。生物科学家对计算机系统及软件的保持不同,根据软件的运行环境,许多已经使用或将要使用多平台操作系统。在今后,有可能Mac上运行MSWindows软件运行,而在Wintel系统运行一些MacOS程序。

近年出现的Java语言使得开发跨平台的多种操作系统的软件成为可能,从而使一应用软件可在任何一台计算机上被任何需要它的人所使用,这无疑是软件应用的一种理想境界。诞生于SunMicrosystems(http://www.javasoft.com)的Java开发系统虽然与C++、C语言及其它语言所开发的程序相比,Java软件的运行速度还比较慢,但有望开发出多平台操作系统中运行流畅的应用软件。在今后,将会有许多用Java语言开发的生物科学软件,例如来自于Licor的序列分析软件包(http://www.licor.com)。

2.6客户端服务器软件

许多生命科学软件开发者的观念是将用户界面从分析应用程序中分离出来,从而增强应用程序的易用性。这一观念构成了软件客户端服务器软件的理论基础,如目前可以进行多种数据分析的网页界面的应用程序(如SeqPup)。

SeqPup功能及原理如下:它充许用户使用任何自己需要的分析软件,如Clustal、CAP、tacg、fastDNAml或别的软件,在客户端计算机或服务器计算机上运行。SeqPup提供了序列编辑、多序列比较、序列输入输出选项等功能。并可配置如上所述分析软件。这些分析应用程序通常没有命令行选项,但可对复杂的数据进行编辑和分析。有了如SeqPup的客户端应用程序后,使用这些软件就比较简单,并可按照自己的方法组织和管理自己的数据。

由PeterRice开发的一套免费分子生物学分析应用软件EMBOSS(http://www.sanger.ac.uk/Software/EMBOSS/)将运行于UNIX服务器计算机,有命令行界面。EMBOSS将包括多种序列分析项目,而且力求提供与其它公众域(PublicDomain,用户可以免费获得公众域的服务或文件)软件包集成的简便性。分析功能包括快速的数据库序列搜索、小片段基因组密码子作用分析、微生物基因序列识别、多序列的快速鉴别、蛋白基序识别、发表论文的出版工具等。

三.优秀免费软件举例

3.1Clustal:多序列比较(sequencealignment)

Clustal是一类多序列比较软件,目前最新版本叫ClustalW,可以应用于MacOS、Wintel、UNIX和VMS计算机。对多个核酸或蛋白序列的比较目前是分子生物学中一类很有用的分析工具,可用于寻找特征化蛋白家族的诊断模式、预测新序列的二级/三级结构、设计PCR引物,以及分析分子演变进程。Clustal可在EBI和IUBio的档案库ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW中下载。此软件的商业版本称之为ClustalX,它提供了一种图形界面,但功能相似。

3.2Entrez:基因组序列搜索引擎及MEDLINE检索工具

Entrez是可通过关键字搜索基因序列和检索MEDLINE文献的多平台操作系统软件,由美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)的成员开发,可以从http://ncbi.nlm.nih.gov/或ftp://ncbi.nlm.nih.gov/下载。Entrez的优点之一就是它包含了对MEDLINE的查询,从而可以检索向序列数据库递交的文献摘要。NCBI的万维网(WWW)服务还提供了可以通

过用户网页浏览器进行搜索的另一类型的Entrez。NCBI开发的Entrez应用程序源代码为其它生物科学应用程序提供了一个软件框架,如SeqPup、Clustal-X等。

3.3NIHImage:图像分析

NIHImage是由WayneRasband编写的Mac图像分析应用程序,可对图像面积、平均密度、重心及用户定义的多边形区域的分析,自动进行点的分析、测定路径长度和角度。该软件可在ftp://zippy.nimh.nih.gov/pub/nih-image/、http://rsb.info.nih.gov/nih-image/处下载。目前,已提供了针对MSWindows的新版本,可从http://www.scioncorp.com/处下载。

3.4PHYLIP:系统发生分析

PHYLIP是由JosephFelsenstein开发的多平台操作系统常用系统发生推论软件(PhylogenyInferencePackage),具有DNA和蛋白序列分析、限制性酶切位点分析、距离矩阵和基因频率、进化树绘制,可以通过许多选项精确控制分析过程。PHYLIP的下载网址为http://evolution.genetics.washington.edu/或ftp://evolution.genetics.washington.edu/。

3.5RasMol:分子模型浏览

RasMol是一类可以浏览蛋白、核酸和小分子物质的多平台操作系统常用分子图形观察器。此类软件的目的是显示、教学和制作出版质量的图像。RasMol以交互式界面、多种颜色和外形显示分子,并可对分子外框架线条的颜色与粗细、分子空间填充物球形、棒状、实心或空心等进行选择。RasMol下载的主站点是ftp://ftp.dcs.ed.ac.uk/pub/rasmol/。

3.6SeqPup:序列编辑

SeqPup是由DonGilbert用Java语言开发的多平台操作系统序列编辑和分析软件,其前身称SeqApp,其优势在于可外挂网络服务器及其它序列分析应用程序,如ClustalW、CAP、tacg、fastDNAml及其它相应软件,功能包括多序列的比较和单序列的编辑、读写多种序列文件格式、序列特征编辑等,可在ftp://iubio.bio.indiana.edu/molbio/seqpup/下载。

四.免费软件实际应用相关问题

4.1公众域版权问题

大部分免费软件的版权属于作者或赞助商。他们只是给你免费使用软件的权利,可能只是一种非商业性使用。使用商业软件或其它付款方式使用的软件,则取得作者认可的版权的使用。许多免费软件都一起提供了源代码,因此用户可以修改并进一步开发它。这对于富有经验的用户做自己所需的分析带来的极大的便利性,但必需注意商业软件包是不充许的。如果作者将其作品放在公众域,并不保留任何控制,那么软件就可以用于商业用途。

4.2软件出版索引

若在一项研究中应用了免费软件,则研究论文的发表将涉及到免费软件出版索引问题,正如引用了某篇参考文献一样。那么,如何使用索引呢?一些免费软件有公司出版的相关文章直接引用,而另一些则没有。因此对于后者若在杂志/卷号部分引用软件的InternetURL地址将是非常有用的。就目前Internet的使用情况而言,一般大部分软件可在10年或更长的时间位于Internet的同一个URL地址。因此,保留URL地址对于文献查阅者是非常有用的。下面,是索引的两个例子:

Felsenstein,J.1993.PHYLIP(PhylogenyInferencePackage)version3.5c.Distributed

ftp://evolution.genetics.washington.edu/.DepartmentofGenetics,UniversityofWashington,Seattle.

Gilbert,D.G.,1996.SeqPup,biosequenceeditor&analysisplatform,version

Seealsoftp://iubio.bio.indiana.edu/molbio/seqpup/

4.3向免费软件作者表达谢意

出于对生物科学免费软件的尊敬与感谢,当研究者能够在发表的研究论文末对相应的免费软件作者表达一份谢意,则一方面承认了免费软件在研究中的作用,另一方面可激励软件作者进一步开发软件的相关功能,有利于软件的进一步完善。此外,还可到Internet上专用的一此档案文件库所在地对作者表达自己的感谢,如以前80年代其主站点在Intelligenetics的GenBank就曾有一个免费分子生物学软件的档案文件库。

五.结束语

分子生物学应用软件随着分子生物学研究技术的不断发展和Internet网络资源的不断普及,正以前所未有的速度飞速发展,应用于分子生物学研究领域的软件不断由分子生物学研究及相关人员开发。这些专业性应用软件已经成为分子生物学研究的一类有力的辅助工具,极大地方便了分子生物学研究。相信随着分子生物学、计算机及Internet的进一步发展,分子生物学专业性应用软件将具有更广阔、更有价值的应用前景。

0.6.bytheauthoratBionet.Software,July1996.

参考文献:

1.PeruskiL.F.andPeruskiA.H,1997.TheInternetandtheNewBiology:ToolsforGenomicandMolecularResearch;LibraryofCongressCataloging-in-PublicationData,AmericanSocietyforMicrobiology1325MassachusettsAve.,NWWashington,DC.

2.DonGilbert,FreeSoftwareinMolecularBiologyforMacintoshandMSWindowscomputers(http://iubio.bio.indiana.edu/soft/molbio/Listings.html),June1998,BiologyDepartmentIndianaUniversity,Bloomington,IN47405/AboutSnarkware.html),Lastupdated13March1999,UniversityofWashington

3.EliMeir,WhoisSnarkWare/BeakerWare(http://www.snarkware.net

4.Hoyoyo,生物化学分子生物学软件下载区-分子生物一线实验人员软件解决方案,1999,生物化学分子生物学软件下载区(http://www4.nease.net/~hoyoyo/index.htm)


相关内容

  • 常用生物信息学软件
  • 常用生物信息学软件简介 2007-7-1 一.基因芯片 1.基因芯片综合分析软件. ArrayVision 7.0 一种功能强大的商业版基因芯片分析软件,不仅可以进行图像分析,还可以进行数据处理,方便protocol的管理功能强大,商业版正式版:6900美元. Arraypro 4.0 Media ...

  • 各行业有限元软件比较
  • 序号 软件名称 简介 功能和应用领域 供应商信息 支持并行 情况 通用软件 1. FLUENT Fluent的软件设计基于CFD软件群的思想,从用户需求角度出发,针对各种复杂流动的物理现象,FLUENT软件采用不同的离散格式和数值方法,以期在特定的领域内使计算速度.稳定性和精度等方面达到最佳组合,从 ...

  • 北京大学毕业硕士生博士生已派遣报到证
  • 北京大学毕业硕士生博士生已派遣报到证 毕业年份 姓名 2001李洪亮2001陈文2001郭兴林2001陈彬2002王力2002熊鹏2002李丹2002郝朝艳2002蒋楠2002洪夏2002毕卫涛2002郑小平2003王京2003孙科峰2003涂骏2003付光辉2003李伟2003王楷2003郑惠文2 ...

  • [干货]质谱常用离子源
  • 通常我们会说打个质谱图,要做个高分辨质谱,有时候我们又会说用电喷雾质谱,这是一样还是不一样的呢?这要从质谱仪的结构说起,质谱仪由进样系统.离子源.质量分析器.检测器和数据处理系统构成,如下图所示 质谱仪之间分类一般是按质量分析器来分,如通常我们所说的飞行时间质谱或者四级杆质谱等,但同一台质谱仪可以配 ...

  • 计算机模拟进行分子对接
  • 计算机模拟进行分子对接 北京市陈经纶中学 王子巍.王喆 学科:信息学化学 [内容摘要] 所谓分子对接就是受体和底物之间通过能量匹配和几何匹配而互相识别的过程.分子对接在超分子建筑学和药物设计中都具有非常重要的意义,运用分子对接我们可以揭示超分子体系的结构和形成过程.分子对接主要研究分子间(即配体和受 ...

  • 生物分离工程试卷
  • 南京工业大学 生物分离工程 试题 ( A )卷 一.填充题(40分,每小题2分) 1. 生物产品的分离包括Removal of insolubles ,Isolation,Purification和Polishing. 2. 发酵液常用的固液分离方法有离心和过滤等. 3. 离心设备从形式上可分为管式 ...

  • 生物信息学软件
  • 生物信息学软件 Bioinformatics software 课程编号: X10001 总学时数: 20学时 主讲教师: 肖 云 教材名称: 生物信息学 出 版 社: 人民卫生出版社 出版时间: 2010年 主 编: 李 霞 开课教研室: 生物信息教研室 学 分: 1学分 开课学期: 第1学期 课 ...

  • PDBbind数据库在计算机辅助药
  • APPLICATION PDBbind数据库在计算机辅助药 物设计中的应用 刘志海 程铁军 王任小 中国科学院上海有机化学研究所,上海 200032 本文首先回顾了e-Science的产生背景与内涵,分析了信息化技术在现代计 算机辅助药物设计中的重要作用与意义.然后介绍本课题组科研工作的主要内容与框 ...

  • 胶粘剂与涂料_试卷和答案B
  • <胶粘剂与涂料>试卷 B卷 一.名词解释(15分) 吸附胶接理论: API: 润湿性: 甲阶酚醛树脂: 热熔胶粘剂: 二.判断改错题(20分,每题2分) 1.常用木材胶粘剂的耐老化性能由大到小依次为:热固性酚醛树脂.脲醛树脂.聚醋酸乙烯乳液.三聚氰胺甲醛树脂.() 2.环氧树脂本身是线型 ...