生物信息学.doc

上传人:创****公 文档编号:1884963 上传时间:2019-10-30 格式:DOC 页数:13 大小:1.63MB
返回 下载 相关 举报
生物信息学.doc_第1页
第1页 / 共13页
生物信息学.doc_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《生物信息学.doc》由会员分享,可在线阅读,更多相关《生物信息学.doc(13页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、生物信息学札记(第生物信息学札记(第 4 版)版)樊龙江樊龙江浙江大学作物科学研究所浙江大学作物科学研究所 浙江大学生物信息学研究所浙江大学生物信息学研究所 浙江大学浙江大学 IBMIBM 生物计算实验室生物计算实验室20172017 年年 9 9 月月本材料已由浙江大学出版社出版:生物信息学 ,樊龙江主编,2017部分内容可通过下列网址获得: http:/ 这份材料是我学习和讲授生物信息学课程时的备课笔记,材料大多是根据当时收集的 一些外文资料翻译编辑而成。学生在学习过程中经常要求我给他们提供一些中文的讲义或 材料,这促使我把我的这份笔记整理并放到网上,供大家参考。要提醒使用者的是,这份 材

2、料仅是根据我对生物信息学的一些浮浅的认识整理而成,其中的错误和偏颇只能请读者 自鉴了。2001 年 6 月第二版第二版 自 1999 年开始接触生物信息学以来,一晃已近六年,而本札记也近四岁了。2001 和 2002 年中国科学院理论物理所的郝柏林院士在浙江大学首次开设生物信息学研究生课程,我作 为他的助教系统地学习了生物信息学;同时,借着我国水稻基因组测序计划的机遇,在他 的带领下从 2001 年开始从事水稻基因组分析,从此自己便完全投入到这一崭新、引人入胜 的领域中来。 不断有来信向我索要本札记的电子版文件,同时在不少网站上看到推荐该札记的内容。生 物信息学、基因组学等发展很快,现在再回头

3、审看该札记,有些部分已惨不忍读,这促使 我下决心更新它。但因时间和学识问题,还是有不少部分自己不甚满意,就只有待日后再 努力了。欢迎告诉我札记中的 BUG,我的信箱 或 。2005 年 3 月 30 日第三版第三版 近年来高通量测序技术产生的序列数据大量出现(如小 RNA 和大规模群体 SNP 数据) ,本 次更新根据这一进展增加了两章内容,分别是第七章有关小 RNA 的分析和第八章遗传多 态性及正向选择检测。两章内容由我的博士生王煜为主编写,李泽峰和刘云参与了文献整 理。另外还更新了第四章有关水稻基因组分析一节。2010 年 1 月第四版第四版 2014 年浙江大学开展本科生教材建设工作,

4、我当时作为系主任要带头,就承诺编写我主讲 的生物信息学教材。编写教材的确不是一件容易的事,经过几番挣扎和多方努力,总 算完成了编写,算是了却了一桩心思。该教材内容比较完整,也跟踪了生物信息学领域的 最新进展。我就权且把该教材内容作为札记的第四版,也算给该札记一个完美的结尾。2017 年 9 月IIIIV生物信息学生物信息学前言自开始接触生物信息学以来,一晃已近二十年了。我是在攻读博士期间开 始注意并学习生物信息学的。我的博士生导师胡秉民为应用数学专业教授,主 要从事生态系统模型模拟研究。虽然已具备一定数量统计和数量遗传学基础, 但当时对于生物信息学,我还是非常陌生的,通过自学才开始一点点了解这

5、门 新兴学科。2001-2003 年间,中国科学院理论物理所郝柏林院士在浙江大学首 次开设“生物信息学”研究生课程,我作为他的助教,系统地学习了生物信息 学;同时,在他的带领下从事水稻基因组分析。自那时起,浙江大学生物信息 学学科和相应研究机构也逐步建立起来。2004 年郝院士离开杭州加入复旦大学, 生物信息学研究生课程就由我和朱军教授承担下来。现在该课程作为浙江大学 全校性研究生公共课程,已成为一门重点建设课程,每年选课人数都在 150 人 左右。 上个世纪末,我国生物信息学还处于起步阶段,学习资料很少。学生时常 索要学习材料,于是我整理了备课笔记,取名生物信息学札记 ,于 2001 年 6

6、 月挂到实验室主页上供学生参考。随着生物信息学发展,分别于 2005 年 3 月 和 2010 年 1 月更新札记两次。由于网络传播的作用,许多生物信息学初学者都 读过该札记,在国内形成一定的影响。本书是在该札记框架基础上,补充大量 新材料编写而成。 生物信息学学科内容涵盖广且发展很快。基于国内外生物信息学相关教材, 以及自身对生物信息学的粗浅理解,我把生物信息学大致分为四部分(篇)内 容:第一部分即基础篇,为生物信息学的基础知识。这部分内容总体变化不大 (与 10-15 年前比较) ,它是生物信息学的核心知识,生物信息学教学最重要部 分,为应为必讲内容;第二部分高通量测序数据分析篇,最近十年

7、才出现的生 物信息学新内容。2005 年高通量测序技术突破后,针对该技术产生的序列数据, 出现大量生物信息学新算法和新工具;第三部分生物信息学外延与交叉,重点 介绍与生物信息学密切相关的其他生物学学科。生物信息学引入了这些学科的 部分核心技术(或反过来被引入) ,如数量遗传学、群体遗传学和新兴学科合成 生物学;第四部分为生物信息学资源与实践篇。生物信息学数据库和软件工具 对生物学学科至关重要,所以这部分也是生物信息学重要组成部分。同时,该 篇中以实践为目的的生物信息学教学资源是课堂教学的一个很好补充。 我重点编写了本书第一部分基础篇。我的学生参与撰写了有关章节,同时 也邀请了相应领域研究者参与

8、部分章节撰写(徐海明:数量遗传学;阮松林: 蛋白质组学) ,最后由我统稿。我们尽可能完整地列出参考书目,标注材料来源, 但一定还会有所遗漏。本书受浙江大学本科专业核心课程教材建设专项经费资 助出版。 每次拿起书稿总是能发现一些错误或不准确的地方,但由于出版计划一再 拖延,只好交稿付印了。如果你发现书中问题,望赐教指正 () ,以便我们再版时更正。樊龙江V2016 年 9 月VI生物信息学生物信息学简要目录及简要目录及 PDFPDF 下载(二校稿,以出版为准)下载(二校稿,以出版为准) 绪论PDF 第一篇:生物信息学基础第一篇:生物信息学基础 第 1-1 章生物信息类型及其产生途径PDF 第 1

9、-2 章分子数据库和常见记录格式 第 1-3 章两条序列联配及其算法PDF 第 1-4 章多条序列联配及功能域分析PDF 第 1-5 章基因预测与功能注释PDF 第 1-6 章系统发生树构建 第 1-7 章蛋白质结构预测与药物设计 第 1-8 章生物信息学计算机基础 第二篇:高通量测序数据分析第二篇:高通量测序数据分析 第 2-1 章基因组拼接与分析PDF 第 2-2 章基因组变异与分析 第 2-3 章转录组分析 第 2-4 章非编码 RNA 分析PDF 第 2-5 章甲基化与组蛋白修饰 第 2-6 章宏基因组分析 第 2-7 章蛋白质组分析 第三篇:生物信息学外延与交叉第三篇:生物信息学外延

10、与交叉 第 3-1 章系统生物学 第 3-2 章群体遗传学 第 3-3 章数量遗传学 第 3-4 章合成生物学 第四篇:生物信息学资源与实践第四篇:生物信息学资源与实践 第 4-1 章生物信息学常用代码和关键词 第 4-2 章生物信息学常用英语术语及释义 第 4-3 章生物信息学主要数据库与工具PDF 第 4-4 章生物信息学实验PDF 参考文献参考文献详细目录 序郝柏林院士 前言绪论 第一节生物信息与生物信息学 第二节生物信息学简史与展望 第三节本书的组织和使用第一篇:生物信息学基础第一篇:生物信息学基础VII第 1-1 章生物信息类型及其产生途径 第一节生物信息的类型 第二节DNA 测序技

11、术 1、第一代测序技术 2、第二代测序技术 3、第三代测序技术 第三节高通量测序技术的应用 1、DNA/RNA 相关测序 2、蛋白质-DNA/RNA 互作 3、甲基化/宏基因组 第四节蛋白质序列及其结构测定 1、蛋白质序列与蛋白质互作测定 2、蛋白质结构测定 第 1-2 章分子数据库和常见记录格式 第一节分子序列数据库概述一、分子数据库概念 二、数据库记录格式 三、数据库冗余、序列递交和检索 第二节核苷酸及其相关数据库一、DNA/RNA 序列数据库 二、基因组数据库 三、非编码 RNA 数据库 第三节蛋白质及其相关数据库第四节代谢途径等专业数据库1、代谢途径数据库 2、代谢组学等数据库 第 1

12、-3 章两条序列联配及其算法 第一节序列联配基本概念 第二节计分矩阵1、计分矩阵的一般原理2、氨基酸替换矩阵四、位置特异性计分矩阵(PSSM) 第三节两条序列联配算法一、Needleman-Wunsch 算法二、Smith-Waterman 算法 第四节BLAST 算法及数据库搜索1、BLAST 算法2、利用 BLAST 进行数据库序列搜索三、序列相似性的统计推断 第 1-4 章多条序列联配及功能域分析 第一节多序列联配概念及其算法1、多序列联配概念2、多序列全局联配算法三、多序列局部联配算法VIII第二节蛋白质序列功能域分析与模型1、功能域概念二、功能域模型 第三节熵及矩阵信息量1、不确定性

13、与信息量二、信息熵的应用 第 1-5 章基因预测与功能注释 第一节基因组序列构成与基因预测一、基因组序列的基本构成 二、基因预测及其基本方法三、基因注释流程 第二节从头预测隐马尔可夫模型(HMM)方法1、马尔可夫和隐马尔可夫模型二、隐马尔可夫模型问题及其算法三、HMM 基因预测模型及其应用 第三节贝叶斯统计及其基因预测应用1、贝叶斯统计与生物信息学2、利用贝叶斯统计进行基因预测 第四节基因功能注释一、利用序列和结构域数据库进行注释二、利用功能分类和代谢途径信息进行注释 第五节基因序列构成分析一、碱基构成与分布二、DNA 行走与 Z 曲线三、同向重复序列分析四、蛋白质序列跨膜等特征分析 第 1-

14、6 章系统发生树构建 第一节系统发生树与遗传模型一、系统发生树概述二、遗传模型 第二节距离法1、非加权平均连接聚类法(UPGMA 法)二、Fitch-Margoliash 算法三、邻接法 第三节简约法 第四节似然法一、DNA 序列的似然模型二、两条序列系统发生树三、三条及多条序列系统发生树 第五节基因组组分矢量方法IX1、组分矢量方法(CVTree 算法)2、基因组关联“距离”与系统发生树构建 第 1-7 章蛋白质结构预测与药物设计 第一节蛋白质结构概述1、蛋白质结构及其预测2、蛋白质结构数据库3、蛋白质结构主要预测工具 第二节蛋白质二级结构预测1、二级结构预测方法2、结构预测实例 第三节蛋白

15、质三级结构预测一、同源建模法二、折叠识别法 第四节计算机辅助药物设计1、间接药物设计二、直接药物设计 第 1-8 章生物信息学计算机基础 第一节使用 Unix/Linux 操作平台一、Unix/Linux 操作系统及其结构二、Linux Shell 常用命令 第二节掌握一门计算机编程语言1、计算机编程语言2、Python 语言简介3、R 语言4、MySQL 语言 第三节并行与自动化一、并行式计算二、并行化模型及其实例 第四节其他一、算法二、可视化与画图第二篇:高通量测序数据分析第二篇:高通量测序数据分析 第 2-1 章基因组拼接与分析 第一节基因组序列拼接概念1、基因组短序列拼接问题2、基因组

16、从头拼接主要方法3、利用遗传图谱等进行基因组组装 第二节图论及基于德布鲁因图拼接算法1、图论X2、基于德布鲁因图的拼接算法 第三节第三代测序数据拼接方法 第四节基于字符串(K-mer)的基因组调查与分析1、基因组大小估计2、基因组复杂度估计3、基因组“肖像”及缺失字符串分析 第 2-2 章基因组变异与分析 第一节基因组变异类型与检测方法1、基因组变异类型2、基因组变异检测方法 第二节基因组重测序及其应用1、基因组重测序应用领域2、基因组重测序数据分析 第 2-3 章转录组分析 第一节转录组测序与拼接1、转录组及其技术平台2、转录组序列拼接 第二节基因表达分析1、差异表达基因的鉴定2、差异表达基

17、因富集分析 第三节可变剪切和基因融合分析1、基因可变剪切2、融合基因 第 2-4 章非编码 RNA 分析 第一节非编码 RNA 简介1、非编码 RNA 类型与功能2、非编码 RNA 进化3、样品采集及其测序方法4、非编码 RNA 主要数据库 第二节小 RNA 计算识别与靶基因预测1、miRNA 主要特征及计算识别2、siRNA 主要特征及计算识别3、miRNA 和 siRNA 靶基因预测 第三节长非编码 RNA 鉴定与功能分析1、线性 lncRNA 鉴定2、环化 RNA 鉴定3、lncRNA 功能预测 第 2-5 章甲基化与组蛋白修饰 第一节表观遗传机制 第二节甲基化测序与分析XI1、甲基化测

18、序原理2、生物信息学分析方法 第三节组蛋白修饰测定与分析1、组蛋白的样品制备2、组蛋白修饰分析方法 第 2-6 章宏基因组分析 第一节宏基因组及其分析方法1、宏基因组概述2、宏基因组学技术应用 第二节16S rDNA 序列分析1、技术方法与分析流程2、物种多样性分析3、物种丰富度估计4、群落结构分析 第三节全基因组序列数据分析1、分析流程与内容2、基因预测及功能注释 第 2-7 章蛋白质组分析 第一节蛋白质组学概述1、蛋白质组及其分析2、高通量分离和鉴定技术 第二节双向电泳图像与质谱组合分析1、胶图获取与分析2、利用指纹图谱鉴定蛋白质 第三节质谱数据采集与分析1、质谱数据采集策略2、肽段数据库

19、搜索与质量控制 第四节定量蛋白质组分析1、同位素标记定量分析2、非同位素标记定量分析第三篇:生物信息学外延与交叉第三篇:生物信息学外延与交叉 第 3-1 章系统生物学 第一节系统生物学概述第二节网络与生物网络1、无标度和阶层网络 2、生物网络模块及其算法工具 第三节基因调控网络1、布尔网络模型 2、贝叶斯网络模型 第 3-2 章群体遗传学XII第一节群体遗传多态性与结构1、遗传多态性及其估计 2、群体结构 第二节正向选择的统计检验1、自然选择与中性检验 2、基于种内多态性的检验方法 3、基于种内多态和种间分歧度的检测方法 第三节群体进化的溯祖测验一、溯祖理论 二、溯祖测验应用 第四节统计测验分

20、析问题与策略 第 3-3 章数量遗传学 第一节数量性状遗传基本概念第二节连锁分析1、连锁分析原理 2、试验群体的连锁分析 3、常用连锁分析软件 第三节关联分析1、关联分析基本原理 2、常用关联分析软件 第 3-4 章合成生物学 第一节什么是合成生物学?1、合成生物学定义和研究内容 2、合成生物学引发的争议 第二节从“基因线路”开始:模块化工程化1、基因线路的基本概念 2、几个经典基因线路设计 第三节从最小基因组开始:基因组人工合成1、基因组的人工合成和重构 2、噬菌体基因组人工合成与重构 3、细菌基因组人工合成与重构第四篇:生物信息学资源与实践第四篇:生物信息学资源与实践 第 4-1 章生物信

21、息学常用代码和关键词第一节核苷酸和氨基酸代码第二节遗传密码第三节核苷酸和蛋白质序列记录特征关键词 第 4-2 章生物信息学常用英语术语及释义 第 4-3 章生物信息学主要数据库与工具 第一节重要门户网站和分子数据库第二节 主要在线分析工具第三节主要开放分析软件 第 4-4 章生物信息学实验 实验 1生物序列数据库记录格式与检索实验 2数据库搜索与未知序列功能预测XIII实验 3抗性基因多序列联配及其功能域预测实验 4蛋白质编码基因预测与功能注释实验 5非编码 miRNA 二级结构及其靶基因预测实验 6基因组浏览器 GBrowser 及其应用实验 7系统发生树构建实验 8蛋白质结构与功能预测参考文献参考文献

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 教育教学

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com