生物信息学作业实验5-3.doc

上传人:豆**** 文档编号:17668767 上传时间:2022-05-25 格式:DOC 页数:18 大小:524KB
返回 下载 相关 举报
生物信息学作业实验5-3.doc_第1页
第1页 / 共18页
生物信息学作业实验5-3.doc_第2页
第2页 / 共18页
点击查看更多>>
资源描述

《生物信息学作业实验5-3.doc》由会员分享,可在线阅读,更多相关《生物信息学作业实验5-3.doc(18页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流生物信息学作业实验5-3开课学院及实验室:生命科学学院 计机楼407 2013年 11 月 29 日 学 院生命科学学院年级、专业、班生物工程姓名学号10142000实验课程名称生物信息学成绩实验项目名称实验5-3 多重序列比对及系统发生树的构建指 导 教 师一、实验目的1、熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识;2、掌握使用Clustalx进行序列多重比对的操作方法;3、掌握使用Phylip软件构建系统发生树的操作方法。二、实验内容1、采用以上例子给出的DNA序列进行系统发育树的构

2、建结果。(包括序列比对结果及最终生成的树)2、以下给出的是蛋白质序列,使用以上方法构建系统发育树。(包括序列比对结果及最终生成的树)RATMEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNNPKGMIPLKGSTLTSPCQDFGKRMFVLKITTTKQQDHFFQAAYLEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGIHUMAN MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFKITTTKQQDHFFQAAF

3、LEERDAWVRDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGICANFA MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFKITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGIMOUSE MEPKRIREGYLVKKGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVLKITTTKQQDHFFQAAFLEERDAWV

4、RDIKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDPEKGICanis MEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFKITTTKQQDHFFQAAFLEERDSWVRDTKKAIKCIEGGQKFARKSTRRSIRLPETVDLGALYLSMKDIEKGIGallus gallusMEREPMRIREGYLVKKGSMFNTWKPMWVVLLEDGIEFYKRKSDNSPKGMIPLKGSTINSPCQDFGKRMFVFKLTAAKQQDHFFQASYLEERDAW

5、VRDIKKAIQCIDGGQRFARKSTRKSIRLPETINLSALYLSMKDPEKDanio rerioMEPTTIREGYLVKKGTVLNSWKAVWVVLKDDAIEFFKKKTDRNAKGMIPLKGATLTSPCQDFSKRALVFKVSTAKNQDHYFQATHLEEREHWVKDIRRAITCLQGGKKFARKSTRRSIRLPESVNLSELYVCMKDPDRGVchimpanzeeMEPKRIREGYLVKRGSVFNTWKPMWVVLLEDGIEFYKKKSDNSPKGMIPLKGSTLTSPCQDFGKRMFVFKITTTKQQDHFFQAAFLEERDAWV

6、RDMKKAIKCIEGGQKFARKSTRRSIRLPETIDLGALYLSMKDTEKGI3、以上构建系统进化树的方法为N-J法,请总结采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。三、实验步骤1、DNA序列进行系统发育树的构建结果图中的8和50分别表示8个序列和每个序列有50个碱基。 2、用PHYLIP软件推导进化树1、进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。 图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的条件就会发生改变。D选项无须改变。J选项有三种条件可以选择,分别是Bootstrap、Jack

7、knife和Permute。文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。这样,一个序列就可以变成了许多序列。一个多序列组也就可以变成许多个多序列组。根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。Jackknife则是另外一种随机选取序列的方法。它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个

8、缩短了一半的新序列。Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。R选项让使用者输入replicate的数目。所谓replicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的replicate,此处选200,输入Y确认参数并在Random number seed (must be odd) ?的下面输入一个奇数(比如3)。当我们设置好条件后按回车,程序开始运行,并在EXE文件夹中产生一个文件outfile,Outfile用记事本打开如下:这个文件包括了200个replicate。2、文件

9、outfile改为infile。点击DNADIST程序。选项M是输入刚才设置的replicate的数目,输入D选择data sets,输入200。设置好条件后,输入Y确认参数。程序开始运行,并在EXE文件夹中产生outfile,部分内容如下: 3、EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。输入M更改参数。输入200。输入奇数种子3。输Y确认参数。程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。outtree文件是一个树文件,可以用treeview等软件打开。outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用

10、记事本直接打开。部分内容如下: 4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为infile、intree。点击CONSENSE程序。输入Y确认设置。EXE文件夹中新生成outfile和outtree。Outfile文件用记事本打开,内容如下:5、 将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。点击DRAWTREE程序,输入font1文件名,作为参数。输Y确认参数。程序开始运行,并出现Tree Preview图。6、 点击DRAWGRAM程序,输入fon

11、t1文件名,作为参数。输Y确认参数。程序开始运行,并出现Tree Preview图。 1以FASTA格式准备8个蛋白质序列test.seq(或txt)文件。2、双击进入CLUSTALX程序,点FILE进入LOAD SEQUENCE,打开test.seq(或txt)文件。点ALIGNMENT,在默认alignment parameters下,点击Do complete Alignment 。在新出现的窗口中点击ALIGN进行比对,这时输出两个文件(默认输出文件格式为Clustal格式):比对文件test.aln和向导树文件test.dnd。 3、点FILE进入Save sequence as,在

12、format 框中选PHYLIP,文件在PHYLIP软件目录下以test.phy存在,点击OK。将PHYLIP软件目录下的test.phy文件拷贝到EXE文件夹中。用计事本方式打开的test.phy文件的部分序列如下:二、用PHYLIP软件推导进化树。 1、 进入EXE文件夹,点击SEQBOOT程序输入test.phy文件名,回车。依次输入r 200 y 3 2、文件outfile改为infile。点击protdist程序。选项M是输入刚才设置的replicate的数目,输入D选择data sets,输入200。 设置好条件后,输入Y确认参数。程序开始运行,并在EXE文件夹中产生outfile

13、3将outfile文件名改为infile,为避免与原先infile文件重复,将 原先文件名改为infile1。EXE文件夹中选择通过距离矩阵推测进化树的算法,点击NEIGHBOR程序。输入M更改参数。输入200。输入奇数种子3。输Y确认参数。程序开始运行,并在EXE文件夹中产生outfile和outtree两个结果输出。outtree文件是一个树文件,可以用treeview等软件打开。outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。部分内容如下: 4、将EXE文件夹中原有的outfile改为其他名,新生成的的outfile和outtree文件名改为in

14、file、intree。点击CONSENSE程序。输入Y确认设置。EXE文件夹中新生成outfile和outtree。Outfile文件用记事本打开,内容如下:5、 将EXE文件夹中原有的outfile和outtree改为其他名,新生成的outfile和outtree改为infile和intree。点击DRAWTREE程序,输入font1文件名,作为参数。输Y确认参数。程序开始运行,并出现Tree Preview图。 6、点击DRAWGRAM程序,输入font1文件名,作为参数。输Y确认参数。程序开始运行,并出现Tree Preview图。3,采用蛋白质序列构建系统进化树与采用DNA序列构建系统进化树所选用的程序的区别。DNA采用的是这个exe而蛋白质的构建采用的是这一个_.精品文档.广州大学学生实验报告

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com