2022年2022年基因芯片数据的聚类分析 .pdf

上传人:C****o 文档编号:33388490 上传时间:2022-08-10 格式:PDF 页数:7 大小:1.65MB
返回 下载 相关 举报
2022年2022年基因芯片数据的聚类分析 .pdf_第1页
第1页 / 共7页
2022年2022年基因芯片数据的聚类分析 .pdf_第2页
第2页 / 共7页
点击查看更多>>
资源描述

《2022年2022年基因芯片数据的聚类分析 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年基因芯片数据的聚类分析 .pdf(7页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 7 页 - - - - - - - - - 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 7 页 - - - - - - - - - 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,

2、共 7 页 - - - - - - - - - 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 7 页 - - - - - - - - - 基因芯片数据的聚类分析作者:王富刚, 陈先农作者单位:300192,天津,中国医学科学院,中国协和医科大学生物医学工程研究所刊名:国外医学(生物医学工程分册)英文刊名:BIOMEDICAL ENGINEERING FOREIGN MEDICAL SCIENCES年,卷(期):2004 ,27(2)被引用次数:8次参考文献(17条)1.

3、 Dudoit S . Yang YH . Callow MJ Statistical methods for identifying differenctially expressed genes inreplicated cDNA microarray experiments 20022. Bozinov D . Rahnenfuhrer JUnsupervised technique for robust target separation and analysis of DNAmicroarray spots through adaptive pixel clustering 2002

4、3. Jain AK . Murty MN. Flynn PJData clustering: a review 19994. vant Veer LJ. Dal H. van de Vijver MJGene expression profiling predicts clinical outcome of breastcancer 20025. Horimoto K . Toh H Statistical extimation of cluster boundaries in gene expression profile data 20016. Medvedovic M. Sivagan

5、esan S Bayesian infinite mixture model based clustering of gene expressionprofiles 20027. Golub TR. Slonim DK. Tamayo PMolecular classification of cancer: class discovery and classprediction by gene expression monitoring 19998. Mavroudi S . Papadimitriou S. Bezerianos AGene expression data analysis

6、with a dynamically extendedself-organized map that exploits class information 20029. Xu Ying . Olman V. Xu Dong Clustering gene expression data using a graph-theoretic approach:anapplication of minimum spanning trees 200210.Mclachlan GJ . Bean RW . Peel D A Mixture Model-based Approach to the Cluste

7、ring of MicroarrayExpression Data 200211.Lukashin AV . Fuchs R Analysis of temporal gene expression profiles:clustering by simulatedannealing and determining the optimal number of clusters 200112.Smet FD. Mathys J . Marchal M Adaptive quality-based clustering of gene expression profiles 200213.Whitf

8、ield CW . Cziko AM. Robinson GE Gene expression profiles in the brain predict behavior inindividual honey bees 200314.Nguyen DV . Rocke DMTumor classification by partial least squares using microarray gene expressiondata 200215.Rhodes DR . Miller JC. Haab BBCIT:identification of differentially expre

9、ssed clusters of genes frommicroarray data 200216.Sturn A . Alatko JQGenesis:cluster analysis of microarray data 200217.Xia Xu-hua . Xie Zheng AMADA:analysis of microarray data 2001相似文献(10条)1.期刊论文朱小锋. 毕树生. 王浤西. 刘红星. Zhu Xiaofeng . Bi Shusheng. Wang Hongxi. Liu Hongxing微阵列PCR 基名师资料总结 - - -精品资料欢迎下载 -

10、- - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 7 页 - - - - - - - - - 因芯片扫描仪的研制- 军民两用技术与产品 2007(4) 介绍了微阵列 PCR 基因芯片扫描仪的基本结构、工作原理和关键技术,给出了光学系统的参考标准构型 ,重点讨论了 PCR 反应温度控制系统的特性和特点,以及扫描仪中 CCD的选用原则 .实验采用 cNDA 为模板的反应体系进行 PCR 反应,通过实验前后检测样品荧光变化的强弱测定微阵列PCR 基因芯片扫描仪的检测性能 .实验结果初步表明 ,该扫描仪可用于微阵列 PCR 基

11、因芯片的检测.2.学位论文李笑 基于神经网络的微阵列基因芯片数据分析2006 微阵列技术的到来将对生物学和医学产生一场革命,通过它可以同时观测成千上万个基因的表达水平,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。微阵列基因表达数据已经应用到肿瘤分型、肿瘤分类、基因功能研究、基因之间调控网络构建以及药物靶位识别等许多方面,对表达谱数据的分析已成为生物信息学研究的焦点。本文主要研究基于基因表达数据的数据分析方法,并针对已有的算法与模型当中所存在的问题,提出对算法的改进。 本文在介绍了微阵列数据原理的基础上,首先介绍了数据预处理和特征提取过程,之后讨论了两个紧密相关的应用领域:

12、肿瘤分类和聚类。在肿瘤分类中,主要研究了基于 BP 神经网络的方法和基于支撑向量机 (SupportVectorMachine ,SVM) 用于多类别分类的方法。实验结果表明,BP 网络设计适当的情况下能够得到很好的分类结果,识别率高。而用两类支撑向量机构造多类别分类器,应用到14 个类别的基因表达数据中,取得了较好的实验效果,同时与KNN 方法进行比较,可以看出基于 SVM构成的分类系统尤其适合于多类别的基因表达谱数据集分类。在基于SVM的方法用于多类别问题中,对比了两种构造方法 OnevsAll(OVA) 以及AllPairs(AP) 的结果,两种结合方法中 OVA 方法的识别率优越于其他

13、方法,性能稳定。分类性能均达到或超过了公开发表的实验结果。 在研究组织样本的聚类分析过程中,实现并对比了以下几种方法:层次聚类法、k均值法,同时本文采用了一种非常新颖的自组织特征映射神经网络的改进模型 -DoubleSelf-OrganizingMap(DSOM)方法。实验证明 DSOM网络应用到癌症基因表达谱数据分析中是很有效和可靠的,而且此方法具有可视化的优点,将高维的数据投射到二维平面上,更清楚地观测到聚类效果。聚类结果可以辅助病理学家进行进一步的有关肿瘤诊断和治疗。3.会议论文阴启明. 叶嘉明. 谢永元. 周勇亮 超亲疏水图案改善微阵列质量2007 虽然以基因芯片为代表的微阵列 (Mi

14、croarray) 技术已经在生物、检疫、制药等领域得到较广泛的应用,但其数据的不精确性仍然是阻碍应用普及以及获得卫生医药部门认可的重要障碍之一。本文提出以超疏水的基底上制作超亲水的微图案作为微阵列的基底,减轻“咖啡效应”,提高微阵列样品点的均匀性,并进行了免疫蛋白微阵列的制作及免疫反应等初步试验。4.学位论文骆婷婷 用户化的微阵列数据库平台研究2006 随着近代分子生物学实验技术和计算机技术的迅猛发展,以及人类基因组草图(HGD) 绘制的顺利完成,标志着现代生命科学研究已经进入了后基因组时代,研究者把关心的焦点由结构基因组学转向了功能基因组学。基因芯片(genechip,microarray

15、)作为一种新型的高通量的检测技术方法,可以同时测量成千上万个基因的表达水平,已成为“后基因组时代”研究基因与基因间相互作用的一个强有力的工具。 如何对该技术产生的海量实验数据进行准确而合理地管理和分析已成为是否能有效应用该项技术的主要问题,并决定着当前生物信息学的重要研究内容和主要研究方向。虽然目前已有许多学术性或商业化的微阵列系统软件应运而生,但具有全面解决方案的系统却尚属罕见,并时常会出现缺少实用性、可扩展性或标准界面等情况。另外,开发一种整合系统,往往需要一个统一、先进的软件架构来加强其安装和维护。所以,为满足上述需求,本课题在生物科学、微电子学以及计算机科学等学科相互交叉的基础上,提出

16、了一个名为MDME的微阵列数据分析软件架构,此数据库拥有较完善的研制方案,可根据特定的实验环境、样本环境为用户提供全面的检索服务。 本文研究工作如下: 1.研制了该微阵列数据库系统的整体架构,在此基础上提出了数据库存储后端、用户验证、管理及访问控制模块、数据分析及其可视化模块、数据标注模块的实现方法。 2.在数据分析及其可视化模块的实现过程中,引入了一种新的聚类算法和一个用于分析multi-variable 微阵列基因表达数据的通用 3-D 可视化工具,有效地提高了系统的分析效率。 3.开发并研制了一个基于关系数据库中 persistence层的代码产生器 ODBI ,详细阐述了该代码产生器的

17、数据模式结构、各组成模块、通信协议以及ODBI 设计器的实现过程。 4.对ODBI 代码产生器的运行状况进行评估,达到了预期的效果,并提出改进措施。 研究结果表明,该课题为用户提供了从数据存储、分析、解析到共享等一系列全面的服务,有效地避免了微阵列数据分析过程中的某些不连贯情况,从而帮助用户能够更快、更准确地得到相应的生物学信息。另外,系统中的ODBI 代码产生器也很好地解决了我们在将面向对象编程与关系数据库进行关联时,两者处理对象不一致的矛盾,使系统可以在一个较高的层次上对关系数据表进行操作,增强了系统的通用性及可维护性。通过对基于生物信息学的微阵列数据库平台的研制和开发,为基因数据的存储、

18、分析和结果的交流提出了一种更为广泛的方法,从而对基因芯片数据分析的发展起到了重要的推动作用。5.期刊论文余志文. 于军. 徐静平 . 周文利 . YU Zhi-wen. YU Jun. XU Jing-ping . ZHOU Wen-li 基因芯片中点阵的微电子加工技术-微电子学 2001,31(2) 基因芯片是运用微电子加工技术以及基因分子的自组装技术在微小芯片上组装成千上万个不同的DNA 微阵列,实现以基因为主的生命信息的大规模检测。文章利用氧化、光刻、蒸发、溅射等一系列集成电路工艺技术,研究了适于电化学检测的基因芯片微阵列的制备,提出了这种芯片中微流路的制备方案。6.学位论文张瑾 基因微

19、阵列数据的双向聚类算法研究2008 基因芯片是由大量 DNA 或寡核苷酸探针密集排列所形成的探针阵列。基因芯片上探针与经荧光标记的目标样品进行生物反应,利用专用芯片检测系统并借助于一定的软件即可得到基因表达数据。这个技术应用于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究、疾病诊断、新药开发、食品卫生监督等领域带来二场革命。 本文的贡献主要体现在以下几个方面: 首先,对基因数据分析中的一种双向聚类方法格子模型法进行了深入的分析,并对其进行了改进。格子模型是一个混合有二进制变量和连续变量的模型。对于该模型,传统的用于连续变量的

20、优化算法不再适用。为此,本文提出了一种新颖的神经网络方法来解决这种混合有二进制变量和连续变量的优化问题,并将该方法应用于酵母数据分析,实验结果表明使用这种方法后双聚类的精度得到了很大的提高。 其次,本文还对基因数据分析的另一种方法非负矩阵分解方法进行了改进。传统的非负矩阵分解算法有一定缺陷,其初始值是随机设定的,因此在迭代过程中会出现微小的抖动。为此本文在迭代计算过程中加入了数据平滑处理,并将该方法用于一组白血病微阵列数据分析。实验结果表明,改进过的非负矩阵分解算法提高了分类的准确率,同时这个方法避免了NMF算法的“零值”问题。 第三,本文介绍了 NNMF算法的基本原理,对其加入了一个平滑处理

21、,增加了数据元素之间的联系,同时这个方法由于抬高了数据,避免了NMF算法中的“零值”问题。本文首次将 NNMF算法应用于生物信息学中,用白血病微阵列数据进行了实验。实验结果表明,该方法提高了分类的准确率及算法的收敛速度。7.期刊论文曹玉. 韩锐 基因芯片在抗肿瘤药物研究中的应用- 中华肿瘤杂志 2003,25(5) 基因芯片 ,又称DNA 微阵列 ,是指采用原位合成或直接点样的方法 ,将DNA 片段或寡核苷酸片段排列在硅片、玻璃等载体上形成微矩阵,待测样品用荧光分子标记后 ,与芯片上的 DNA 或寡核苷酸片段杂交 ,通过荧光扫描及计算机分析后获得大量的基因信息,其突出特点在于能够对微量样本中的

22、核酸序列信息进行快速、高通量的检测和分析.8.期刊论文高利宏. 曹佳 基因芯片可靠性分析及数据处理- 第三军医大学学报 2006,28(1) 基因芯片 (gene chip) 又称为 DNA 微阵列 (DNA microarray),其基本原理是将众多的靶基因序列或寡聚核苷酸片段有序而高密度地排列在玻璃、硅、尼名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 7 页 - - - - - - - - - 龙膜等固相载体上 ,用待检测的标记样本分子与之杂交 ,并利用激光共聚焦显

23、微扫描等技术对芯片上成千上万的杂交信号进行实时、灵敏而准确的检测,辅以计算机统计分析从而得到样本的基因表达信息.9.学位论文马煜 微阵列数据的聚类算法研究2006 随着人类基因组计划的进展,对于基因的功能和基因组内各基因的研究逐步深入。研究基因在不同时间和条件下的表达情况,是认识基因功能的一个主要途径。 cDNA 微阵列技术可以同时测量全基因组的表达情况,是生物学家认识基因的重要工具。微阵列技术产生了大量基因表达数据,要从中提取有价值的信息,采用数据挖掘的技术是十分必要的。 功能相近的基因其表达模式相似,通过发现相似的表达模式可以预测未知基因的功能。数据挖掘中的聚类算法是按照数据的相似性进行划

24、分,实现物以类聚的思想。采用聚类技术对基因表达数据进行处理,可以把表现模式相近的基因聚集到一起,这种划分有助于专业人员发现基因功能和遗传模式。 目前基因芯片邻域中的大多数聚类算法在实际应用中存在着一些不足之处,例如K-均值和自组织映射都需要预先输入簇的个数,而在对基因表达谱进行聚类时,簇的个数通常是未知的,改变这一参数往往会极大地影响聚类结果;传统的聚类算法对噪声数据非常敏感,对规模的可伸缩性差;传统聚类算法最早是起源自非生物相关的研究邻域,所以通常的聚类结果并不包含明确的生物学意义。本文针对以上不足,将K 最近邻先吸收思想和已知基因的生物学知识引入了基于密度的聚类算法中,设计并实现了一种新的

25、基于密度的K 最近邻先吸收的聚类算法,在聚类过程中利用已知基因的生物学意义生成最初的簇集。最后将所提出的算法应用于酵母细胞有丝分裂下的基因芯片数据,对聚类的结果从簇结构的合理性和生物学上的意义两方面给出了明确的比较,从对比结果知本文所提出的算法无论从簇结构的合理性还是生物学意义上都明显高于K-均值聚类算法。10.期刊论文刘德勇 . 李晓杰 . 李金花 . 谢海龙 . LIU De-yong . LI Xiao-jie. LI Jin-hua. XIE Hai-long应用cDNA 微阵列基因芯片筛选胃低分化腺癌相关基因的研究-中国癌症杂志 2007,17(8) 背景与目的 :胃低分化腺癌癌变的

26、分子机制至今不清楚,关键是未找到与胃低分化腺癌密切相关的基因.本研究拟建立胃低分化腺癌基因表达谱,筛选差异表达基因 ,进一步分析差异表达基因与胃癌发生、发展关系.方法:用含10 000 个已知基因的 cDNA 微阵列分析胃低分化腺癌和癌旁正常胃黏膜基因表达谱的变化 ,免疫组化研究差异表达基因与胃癌的关系.结果:二倍以上的差异表达基因 212 个,其中在胃低分化腺中表达上调 169 个,表达下调 43 个.S-P免疫组化结果显示 :EMS1 蛋白表达定位于胞质 ,呈黄色至棕黄色 ;EMS1 蛋白在 20 例正常胃黏膜阳性表达率为 20%(4/20), 在146 例胃癌中阳性表达率为 89.72%

27、(131/146);EMS1 蛋白在胃癌中的表达高于正常胃黏膜 (P0.001). 结论:发现EMS1与胃癌有关 ,为进一步寻找胃癌相关基因提供了重要的研究线索.引证文献(8条)1. 曹晖. 席斌. 米红 一种新聚类算法在基因表达数据分析中的应用期刊论文-计算机工程与应用 2007(18)2. 方梅. 胡波. 侯媛媛 . 肖丹 毛细管电泳在基因研究中的应用期刊论文-生物技术通报 2006(2)3. 姜明宇. 马文丽 . 郑文岭 基于遗传算法的基因表达数据的 K-均值聚类分析期刊论文-上海生物医学工程 2006(3)4. 朱婵. 许龙飞 聚类算法在基因表达数据分析中的应用研究期刊论文-计算机工程

28、与应用 2006(15)5. 涂晓芝. 颜学峰 . 钱锋 基于SOM网络的基因表达数据聚类分析期刊论文-华东理工大学学报(自然科学版)2006(8)6. 朱婵. 许龙飞 聚类算法在基因表达数据分析中的应用期刊论文-华侨大学学报(自然科学版) 2005(1)7. 曾立 小鼠短期饥饿模型的基因芯片研究及人类新基因的克隆与功能研究学位论文博士 20058. 王兴 糖肾平胶囊对STZ 和高脂肪饲料诱导的实验性型糖尿病 C57BL/6J 小鼠相关组织基因表达的影响学位论文博士后 2004本文链接: http:/ (xajtdx) ,授权号:a1894104-ce32-4695-81b1-9e9900c1d047下载时间:2011 年3月1日名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 7 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com