如何查找一个基因的启动子序列.doc

上传人:创****公 文档编号:1875397 上传时间:2019-10-30 格式:DOC 页数:3 大小:31KB
返回 下载 相关 举报
如何查找一个基因的启动子序列.doc_第1页
第1页 / 共3页
如何查找一个基因的启动子序列.doc_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《如何查找一个基因的启动子序列.doc》由会员分享,可在线阅读,更多相关《如何查找一个基因的启动子序列.doc(3页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、如何查找一个基因的启动子序列关键词: 基因 启动子序列 软件 定义:启动子是参与特定基因转录及其调控的 DNA 序列。包含核心启 动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对 不同的环境条件作出应答,对基因的表达水平做出相应的调节。区域:启动子的范围非常大,可以包含转录起始位点上游 2000bp,有 些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范 围。这项搜寻要从 UCSC 基因组浏览器开始,网址为 http:/genome.ucsc.edu/。以编码 pendrin (PDS)的基因为例来说明上述问题。 PDS 与耳蜗的异常发育、感觉神经性听力下

2、降以及弥散性甲状腺增大(甲状腺 肿)有关。进入 UCSC 的主页后,在 Organism 的下拉菜单中选择 Human,然后点 击 Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在 assembly 的下拉菜单中选择 Dec. 2001,在 position 框中键入 pendrin,然后 点击 Submit。返回的页面结果显示一个已知的基因和两个 mRNA 序列。继续点 击 mRNA 序列的登录号 AF030880,出现包含这个 mRNA 区域的图解概要。为了获 得这个区域更清晰的图像,点击紧靠 zoom out 的 1.5X 按钮。最后点击页面中 部的 reset

3、all 按钮,使各个路径的设置恢复默认状态。然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视 图利用页面底部的 Track Controls 按纽,将一些路径设置为 hide 模式(即不 显示),其他设置为 dense 模式(所有资料密集在一条直线上);另一些路径 设置为 full 模式(每个特征有一个分开的线条,最多达 300)。在考虑这些路 径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必 要的,许多这些讨论是由外界提供给 UCSC 的。下面是对基因预测方法的更进一 步讨论,这些信息也可以在其他地方找到。对于 Known Genes(已知基因)和预测的基因路

4、径来说,一般的惯例 是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示 5端和 3端非翻译区。起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的 箭头指示。Known Genes 来自 LocusLink 内的 mRNA 参照序列,已经利用 BLAT 程 序将这些序列与基因组序列进行比对排列。Acembly Gene Predictions With Alt-splicing 路径是利用 Acembly 程序将人类 mRNA 和 EST 序列数据与人类基因组序列进行比对排列而来的。 Acembly 程序试图找到 mRNA 与基因组序列的最好的比对排列以及判断选择性剪

5、接模型。假如有多于 1 个的基因模型具有统计学意义,则它们都全部显示出来。 有关 Acembly 的更多信息可以在 NCBI 的网站找到 (http:/www.ncbi.nih.gov/IEB/Research/Acembly/)。Ensembl Gene Predictions 路径由 Ensembl 提供。Ensembl 基因通过 许多方法来预测,包括与已知 mRNA 和蛋白质进行同源性比较,ab initio 基因 预测使用 GENSCAN 和基因预测 HMMs。 http:/www.ebi.ac.uk/ensembl/Fgenesh+ Gene Predictions 路径通过寻找基因

6、的结构特征来预测基 因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一种动态的程 序算法推定编码区域和推定外显子 5端和 3端的内含子区域;这个方法也考 虑到蛋白质相似性的资料。Genscan Gene Predictions 路径由 GENSCAN 方法衍生而来,通过这个 方法,可以确定内含子、外显子、启动子区域和 poly(A)信号。此时,这个方 法并不期望查询的序列只出现 1 个基因,因此可以对部分基因或被基因之间的 DNA 分隔的多个基因进行准确的预测。Human mRNAs from Genbank 路径显示基因库的人类 mRNAs 与基因组序 列的比对排列。Spliced

7、ESTs 和 Human EST 路径显示来自 GenBank 的 ESTs 序列与基 因组的序列对齐比较。由于 ESTs 通常代表了转录基因的片断,一个 EST 很有可 能对应于某个外显子区。最后,Repeating Elements by RepeatMasker 这个路径显示的是重复 元件,例如散在的或长或短的核元素(SINEs 和 LINEs),长末端重复序列(LTRs) 和低复杂性区域(http:/repeatmasker.genome.washington.edu/cgi- bin/RepeatMasker)。一般来说,在将基因预测方法应用于核苷酸序列之前,需 要去掉或掩饰这些成分

8、。回到视图显示的例子,可以看到大多数路径返回了几乎同样的基因预 测结果。作为一个规则,通过多种方法预测的外显子提高了预测的正确率而不 会出现“假阳性”结果。多数方法显示 3端非翻译区,以左侧大而短的块状 表示。Acembly 路径显示除了全长序列产物(如这个部分第 3 条线所示)之外 还有 3 个可能的选择性剪接,其它大多数路径显示与此预测结果相符。Genscan 路径从左、右方向往远处延伸:GENSCAN 可以被用于预测多个基因。尽管这些图解概要很有用,然而研究者更需要与这些垂直线或块状相 对应的序列。以此为例,用 Fgenesh+预测作为获得原始序列数据的基础,但 不管选择哪个路径其步骤都

9、是一样的。点击标有 Fgenesh+ Gene Predictions 的路径,出现的是一个描述预测的概要页面。序列的区域与 pendrin 基因相似(从这个例子一开始就已经知道了)。 给出了序列的大小及序列开始和结束的预测,并显示预测是以负链为基础的。 想要获得序列,点击 Genomic Sequence。使用者将被带到一个标题为 Get Genomic Sequence Near Gene 的查询页面,在这个页面上,可以获得转录物、 编码区、启动子或转录物加启动子的序列。点击 Transcript 返回的页面显示完整的转录子,外显子以大写字母表 示。点击 Coding Region Only 得到的是编码区,外显子以大写字母表示。点击 Transcript + Promoter,返回的页面显示的是在上述选择 Transcript 所获序列的 5端添加了启动子序列,以大写字母表示外显子。启 动子的长度显示在文本框内。点击 Promoter 返回的页面正好是启动子区

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 教育教学

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com