培训-中科院计算所生物信息学室优秀PPT.ppt-得力文库

资源描述

《培训-中科院计算所生物信息学室优秀PPT.ppt》由会员分享，可在线阅读，更多相关《培训-中科院计算所生物信息学室优秀PPT.ppt（64页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、生物信息处理专用计算机探讨与开发（曙光4000H）验收报告徐志伟中国科学院计算技术探讨所中国科学院北京基因组探讨所l课题探讨背景课题探讨背景l课题执行状况评价课题执行状况评价 l取得的成果的水平和作用取得的成果的水平和作用l探讨队伍的建设和人才培育探讨队伍的建设和人才培育 l组织管理工作组织管理工作l下一步工作设想下一步工作设想主要内容主要内容探讨背景探讨背景l人类基因组支配引爆生物信息的大发展l计算成为了生物学家的重要探讨工具l蛋白质结构的预料l序列联配和序列拼接 l用于生物信息学的计算计系统不断升级l一般的台式机l工作站、服务器l高性能的对称多处理器系统l大规模并行计算机系统生物数据库的

2、增长趋势及挑战生物数据库的增长趋势及挑战 l到2004年底GenBank中的DNA序列总量已超过445亿碱基对 l相对增长量和确定增长量都很大摩尔定律l浩大的基因数据库为更加精确地进行生物信息的分析供应了可能l算法的计算困难度高l对计算实力提出了挑战解决方案之一：解决方案之一：研制更困难的通用巨型计算机系统研制更困难的通用巨型计算机系统BlueGene/L：65536颗700MHz主频的PowerPC440360TFlops将来的1年之内规模再增加一倍分子动力学通用系统的优缺点通用系统的优缺点l利用通用型巨型机的优点l计算机用途广泛l程序移植便利l利用通用型巨型机的缺点l费用高l通用型巨型机

3、的价格特别昂贵l维护费用高（电力、制冷、场地、管理等）l效率低l性能提高的速度难以跟上生物信息处理的须要l生物信息处理算法受计算机内硬件资源制约生物信息学中算法的特点生物信息学中算法的特点 l生物信息学中还有很多算法（如各种基因组探讨的算法）具有数据量较大、算法相对简洁、并行度较高、运算类型单一、重复性较强的特点，很多计算过程都可以归类于字符串的查找和比对等简洁操作。通常对字符进行操作只须要816位数据宽度，计算类型多为各种简洁的逻辑运算和算术运算，无需浮点计算，但须要进行大量的推断和转移。l目前通用处理器的设计通常都接受32位或64位字长，集成有数个困难的浮点计算单元，为了提高指令级并行一般

4、都接受超标量技术，而为了提高系统的工作频率，几乎全部的通用处理器都接受了深度流水线技术。这些特点使得通用处理器在进行字符串操作时往往是英雄无用武之地，有些技术如深度流水线甚至会对计算带来负面影响，因为一旦发生转移预料失败，就须要清空流水线，因而会奢侈很多时钟周期。因此，用现有的大规模并行机或超级服务器等通用系统解决这些问题，既奢侈系统的资源，运用维护也比较困难，有些问题甚至无法在限定的时间内完成。解决方案之二：解决方案之二：研制专用的计算机系统研制专用的计算机系统TimeLogic：lAll bacterial proteins(4,242 proteins sequences)were co

5、mpared against 192 E.coli genomes(775 million symbols in 6-frames).lDeCypherBLAST systems with 1 and 2 Engines complete the seach in 32 and 16 minutes respectively.lThe DeCypher systems were installed in a 2 CPU Dell server.lAn 8-CPU cluster requires over 1 week to complete the task(216 hrs).lResult

6、s:For this search,DeCypher delivers the performance of 400-800 CPUs.专用计算机系统的优缺点专用计算机系统的优缺点l利用专用硬件加速方案的优点l计算速度快、计算效率高l运用费用低l机器成本l维护费用低廉（功耗低、体积小）l利用专用硬件加速方案的缺点l程序移植困难l可重构计算将便利算法的硬件实现过程几种算法的计算速度和数据质量比较几种算法的计算速度和数据质量比较序列联配算法的加速方法序列联配算法的加速方法l启发式算法lFASTAlBLASTl这两种方法会损失敏感度l并行计算方法l把数据库分布在多个节点l运用MPI通讯l硬件加速计

7、算方法硬件加速的典型工作硬件加速的典型工作 lR.J.Lipton和D.P.Lopresti在1985年视察到并指出，可以利用动态规划算法中隐含的并行性将其映射到一个脉动阵列结构中，并且可以通过恰当地设置编辑操作的分值以有效地简化每个PE的设计。l在此基础上，他们于1987年实现了P-NAC（Princeton Nucleic Acid Comparator）系统l91年加州理工的BISP(Biological Information Signal Processor)l9193年布朗高校的B-SYS(Brown Systolic Array)和Splash l9799年UCSC（Univ.o

8、f Cal.at Santa Cruz）开发了Kestrel l96年法国IRISA在BISP基础上改进实现了SAMBAlTimeLogic公司DeCypher系列产品lParacel公司的GeneMacherII、BlastMachine（Closed）l2002年Xilinx JBits Smith-Watermanl2003年香港中文高校Pilchard序列联配算法的加速方法总结序列联配算法的加速方法总结l除了启发式算法，主要还有以下一些方法用于对各种序列联配算法进行加速：l接受超级计算机进行并行计算：最具弹性，如加速比相对较小、性价比较低、运用维护比较困难等。l接受专用的的VLSI：对

9、某个算法性能最高，典型的系统如P-NAC、BioScan、BISP、SAMBA等，但研制费用高、周期长、敏捷性较差。l接受可编程的处理器阵列：这种做法希望能够兼顾敏捷性、专用性和加速性，典型的系统有B-SYS、Kestrel等，但对限制的要求较高，虽然可编程，但由于运算精度、运算类型、运算速度等多方面的因素使这种系统并没有得到大规模的应用。l接受可重构硬件：设计修改相对比较便利，例如早期的Splash和Splash-2，近期的Pilchard、以及Decypher等系统。尤其是在近年来，随着微电子技术的进步，这种方法的优点日见突出传统加速方法的局限性传统加速方法的局限性l大部分的工作都集中于如

10、何实现更多的计算单元以及如何提高峰值的处理速度等方面l很多设计因为结构的问题限制序列的长度不能超过阵列的长度l很多设计要求主机系统保证序列能够刚好地进入脉动阵列，对主机操作系统的实时性也提出了较高的要求。l大部分加速卡和主机系统的总线接口带宽相对较低，这也影响了他们在其他类型的算法中的应用l 这些问题影响了加速卡在实际系统中的应用华大基因中心和计算所的合作华大基因中心和计算所的合作 l计算所研制的曙光2000和曙光3000系统安装在华大中心l华大利用曙光3000系统上完成了水稻基因组框架图绘制工作，这一工作以封面文章的形式发表在2002年4月的Science杂志上l近期华大正在进行超级杂交水稻

11、基因组分析等工作 l在进一步的工作中，我们发觉现有的高性能计算实力仍旧不能满足高速增长的需求：l水稻基因组完全图的绘制工作，须要对1000万个短片段进行拼接，假如运用现有的拼接算法，如Phrap、CAP3、GAP4，无论是内存还是计算速度都无法满足需求；l序列比对：现在的Blast只适合于长度为几兆的片段之间的比对，而且该算法的敏感度不够好，而现在感爱好的是对两个长达数百兆的基因组之间的比对，这已远远超出了现有的计算实力。课题执行状况评价本课题总体目标要求：l最终目标：研制一套生物信息学专用系统，以相对较低的硬件成本达到4万亿次系统的处理实力，以实现专用、高效、经济的目的。l面对生物信息处理l

12、处理基因数据、功能基因组分析、蛋白功能分析l探讨基因联配、蛋白质折叠等算法的硬件实现技术l从算法、体系结构、芯片设计、存储系统设计、快速数据传递等几方面，探讨专用数据处理硬件系统的设计技术l2-3项独创专利l10篇左右有影响的高质量学术论文课题组完成如下工作：l生物专用机（曙光4000H一台）；l申请独创专利3项，软件登记1项。达到课题任务书规定的23项专利技术；l发表SCI、EI收录学术论文11篇。完成了课题任务书规定的高质量学术论文10篇要求。l开展应用试算，完成基因组水平的水稻杂交优势探讨；完成黑猩猩人类基因组比较计算；完成mRNA预料计算。相关探讨成果将在Science等刊物上发表。取

13、得的成果的水平和作用取得的主要成果(1)l研制曙光研制曙光4000H生物信息处理专用计算机生物信息处理专用计算机 l接受接受“通用体系结构通用体系结构+专用硬件加速部件专用硬件加速部件”相结合的方相结合的方法来实现的技术方案法来实现的技术方案l从算法、体系结构、芯片设计、存储系统设计、快速数从算法、体系结构、芯片设计、存储系统设计、快速数据传递等几方面探讨关键技术，充分利用现有的曙光超据传递等几方面探讨关键技术，充分利用现有的曙光超级服务器成熟的级服务器成熟的Cluster技术技术l接受高密度化、微型化的技术路途，解决了数据密集型接受高密度化、微型化的技术路途，解决了数据密集型问题问题l开展了

14、动态规划算法细粒度并行计算探讨，使之适合硬开展了动态规划算法细粒度并行计算探讨，使之适合硬件的大规模并行处理，并成功研制专用硬件加速部件件的大规模并行处理，并成功研制专用硬件加速部件4000H网络拓扑结构图网络拓扑结构图生物专用机的通用体系结构生物专用机的通用体系结构 l该系统具有通用的Cluster结构l5个服务节点l40个计算节点组成，l节点类型：双Xeon SMP系统l节点数量：45个lCPU数量：90个l系统总内存容量：130GBl系统总存储容量：2TBl系统互连网络：双千兆以太网l通用部分峰值浮点计算实力：5040亿次取得的主要成果(2)基于FPGA的算法可重构硬件加速卡基于基于F

15、PGA的算法可重构加速卡的算法可重构加速卡lFPGA容量已高达数百万门，管脚1000条，频率可高达100200MHzl可以将成百上千个比较简洁的PE设计到一片FPGA中，这些PE可以构成一维或二维的脉动阵列，以脉动的方式工作。l由于每个PE在一个时钟周期内能够完成的工作往往相当于几十条通用CPU的指令，因此其主频通常只有100MHz左右，但相对于通用CPU仍能得到上百倍甚至数千倍的加速比。lFPGA与ASIC相比有很多优点：lFPGA是可重构的，也就是说当算法发生变更时，可以特别便利地对其逻辑进行重新构造，重构一次只有几十ms；lFPGA的开发周期相对比较短，没有ASIC设计过程中的版图设计等

16、特别耗时的后端设计过程。序列联配问题的定义与分类序列联配问题的定义与分类l序列的联配(Alignment）定义如下：将两个或多个符号序列按字母比较，并尽可能准确地反映它们之间的相像或相异，这一过程称为序列的联配。l主要的生物序列的分析和计算任务：l序列相像性的比较 l多序列的联配两条序列联配的主要问题两条序列联配的主要问题l全局联配（Global Alignment）：输入两个具有相同长度的序列S和T，输出两个序列之间的最大相像度差异并找出最佳的排列。l局部联配（Local Alignment）：输入两个序列S和T，两者的长度可能不同，输出S的一个子序列和T的一个子序列的最大相像度（最小差异

17、），并找出具有最大相像度的两个子序列编辑距离及加速思想l编辑距离能够在很大程度上测量出两条序列的相像性 l须要运用动态规划算法对矩阵相像度进行计算，但并不须要输出矩阵的每个点的分值，只须要最终的矩阵的右下角的分值，这个值也就表示了这两条序列之间的编辑距离 l编辑距离的计算过程和全局联配Smith-Waterman算法的计算过程是等价的，主要区分l编辑距离的计算是一个求最小值的过程，l全局联配S-W算法是一个求最大值的过程。l硬件加速的技术思想：l利用加速卡对数据库中的序列进行快速的过滤或筛选，l再用主机对少数筛选出来的结果进行更进一步的分析，包括完整得分矩阵的计算和路径的回溯等编辑距离的计算

18、方法l前提条件为：l递推关系为：算法到逻辑的简洁映射的问题l每个PE中将有5个加法器、6个比较器、1个二选一以及多级组合逻辑电路，lPE的数据宽度也将随着PE的个数而增加，例如，当N512时，PE的数据宽度至少应当等于10l每个PE至少将消耗约120个LEl假如接受Altera Stratix系列的EP1S30 FPGA，只能实现约256个PE。l这样的设计方法将很难提高PE的工作频率，其工作频率通常只能达到5060MHz。l因此，必需探讨高效的算法硬件实现方法编辑距离算法处理单元PE编辑距离算法脉动阵列编辑距离算法核心逻辑电路编辑距离算法核心逻辑电路 Matrix-PCI型加速卡型加速卡Ma

19、trix-PCI型加速卡型加速卡编辑距离算法在加速卡的性能测试编辑距离算法在加速卡的性能测试编辑距离算法编辑距离算法在加速卡上的测试结果分析在加速卡上的测试结果分析 lXeon 2.8GHz CPU进行得分矩阵的计算时，每完成1个分值的计算须要约45个汇编指令，同时可以统计出该CPU的平均CPI0.6，所以每个循环将消耗约27个CPU周期，则该CPU的计算实力折合为103.7MCUPS。l而加速卡的每个PE完成该计算过程则只须要1个周期，工作在133.33MHz的3072个PE阵列的峰值计算实力为409.6GCUPS，所以理论上的加速比最高可以达到3950倍。l实际测试最高加速比3800倍 C

20、lustalW多序列联配算法多序列联配算法lClustalW是目前运用最广泛的多序列联配程序。它是一种渐进的联配方法，计算过程主要包括以下三个步骤：l运用动态规划算法计算全部两两序列最优联配的分值，基于最优联配得到序列的两两之间的相像度，依据相像度再进一步构造距离矩阵。l从距离矩阵动身，接受NJ计算产生系统进化指导树（Guide Tree），对关系亲密的序列进行加权。l从引导树的叶节点动身，遍历整个树直到根节点，逐步得到最终的多序列联配结果。l该程序的第一个步骤须要对全部的序列进行两两联配，假如序列的数量为n，序列的长度为l，则这一步过程的计算时间困难度为O(n2l2)，这也是整个程序中最耗时

21、的部分，为加速计算供应了可能。多序列联配整体加速比测试多序列联配整体加速比测试多序列联配程序串行部分比例多序列联配程序串行部分比例多序列联配整体加速比测试结论多序列联配整体加速比测试结论l从图中可以看出，在确定范围内，多序列联配整体加速比与序列数量基本上成正比关系，即序列的数量越多，整体上得到的加速比越大。l加速比的增长应当有一个极限，但由于多序列联配的时间特别之长，我们在测试过程中没有测到增长曲线的拐点。l事实上，序列的数量越多，ClustalW中的串行部分即不行加速部分所占的百分比越低，随着序列数量的增长，程序中串行部分的比例快速降低，但随着序列数量的进一步增长，程序中串行部分的比例逐

22、步趋于极限，这也示意了加速比的增长也将趋于极限。局部最优序列联配局部最优序列联配l局部联配在某些生物信息学中的应用可能要比全局联配更有实际的意义。在蛋白质序列的比较中，由于亲缘关系较远的蛋白质序列可能只有一些相互独立的相同片段，所以对其进行局部相像性分析更为重要也更为合理。l另一方面，前面介绍的编辑距离算法中较少地考虑到序列的生物学意义，但事实上，在生物序列联配过程中，某些字符的匹配可能比另外一些字符的匹配更为重要，而不是仅仅考虑两个字符是否相同。因此，生物学家在统计分析的基础上建立了一套特地的替换矩阵(substitution matrices)用于联配的计算序列局部联配算法PE设计l数据宽

23、度为20位 l序列的长度为32Kl由硬件逻辑限制加减法器的下溢问题 lMax电路由比较器和二选一电路两级电路来实现 l关键路径：从F-in、E-out和H-out到H-out上包括了1级减法器、1级寄存器、3级比较器和3级二选一，共计8级电路，这条关键路径的延迟依靠于FPGA器件的特性局部联配算法局部联配算法PE在在FPGA中的实现中的实现 lLUT部分用于实现(Si,Ti)功能项，即查找替换矩阵。l这个模块共有10位输入和4位输出，假如运用一般的组合逻辑来实现须要消耗很多逻辑资源。l用RAM来实现该LUT：10位输入和4位输出的LUT可以等价于一个有10位地址线的4位宽度的ROM，该ROM

24、可以运用Altera FPGA中的M4K RAM配置来实现，ROM中的数据可在FPGA上电时有Flash加载进去。l运用ROM来替代LUT，不仅节约了FPGA中的逻辑资源，而且对该ROM的访问可以在1个周期内完成，也能够提高系统的工作速度。lPE中的其它逻辑，将消耗约270个LE，其中约有190个LE中运用了寄存器，其他LE则只运用了查找表。lStratix 1S30共有一共有32470个LE，除了接口逻辑和其他限制逻辑，还可以实现约80个PE。l上述的关键路径中的从输入到加减法中间结果一级须要约5ns，剩下的路径须要约13ns，通过优化，PE阵列的最高工作频率可以达到80MHz，其峰值计算实

25、力为6.4GCUPS。局部联配算法在加速卡的性能测试局部联配算法在加速卡的性能测试40kbp（4kbp、20kbp、40kbp、60kbp、80kbp）（时间单位，秒）序列长度PCI_LSWXeon2.8GHz加速比40.0279.170340.14 200.13245.679 347.45 400.12691.332 349.66 600.394137.861 349.48 800.525184.302 351.79 取得的主要成果(3)l提出了提出了STE-Blast核心算法及其并行算法核心算法及其并行算法 lBlast是运用最广泛的序列相像性搜寻工具，接受启发式算是运用最广泛的序列相像性

26、搜寻工具，接受启发式算法，其计算困难性从法，其计算困难性从S-W算法的算法的O(n2)降为降为O(n)；Mega-Blast优化了优化了NCBI-BLAST算法，对查询序列进行批处理，算法，对查询序列进行批处理，同时在进行序列联配过程中接受了贪欲算法，其速度又有了同时在进行序列联配过程中接受了贪欲算法，其速度又有了大幅提高。但由于引入了批处理，使得内存消耗更大。大幅提高。但由于引入了批处理，使得内存消耗更大。l我们从体系结构的观点动身，结合系统软件和操作系统的特我们从体系结构的观点动身，结合系统软件和操作系统的特点，提出了一种较好的可扩展的算法，通过对库造表，并将点，提出了一种较好的可扩展的算

27、法，通过对库造表，并将计算和输出重叠并行进行，隐藏计算和输出重叠并行进行，隐藏I/O开销，不变更处理精度，开销，不变更处理精度，大幅降低了内存开销，成倍提高了计算速度；完善了大幅降低了内存开销，成倍提高了计算速度；完善了STE-BLAST并行版本探讨。并行版本探讨。STE-Blast与与MegaBlast运行时间测试对比运行时间测试对比并行化的并行化的STE-Blast和和MegaBlast运行时间对比测试运行时间对比测试取得的主要成果(4)lRNA二级结构的硬件实现探究探讨二级结构的硬件实现探究探讨 lRNA二级结构预料接受二级结构预料接受Vienna Package的算法，须要完成边长

28、为的算法，须要完成边长为N2的的最小自由能三角矩阵的计算，而后可以找寻全局最小能量并进行路径回最小自由能三角矩阵的计算，而后可以找寻全局最小能量并进行路径回溯找到最佳折叠结构。确定由硬件完成矩阵计算，回溯则由软件完成。溯找到最佳折叠结构。确定由硬件完成矩阵计算，回溯则由软件完成。lPCI-X接口可以给系统供应一个高效的数据传输通道，由接口可以给系统供应一个高效的数据传输通道，由PCI接口主机接口主机可以和卡上可以和卡上DDR RAM进行数据交换，将经过软件预处理的矩阵下载到进行数据交换，将经过软件预处理的矩阵下载到DDR RAM中，计算完成后矩阵数据通过中，计算完成后矩阵数据通过PCI口输入到

29、主机中完成后续口输入到主机中完成后续的路径回溯等工作。的路径回溯等工作。l能量矩阵的计算大致可以划分为能量矩阵的计算大致可以划分为VM项（计算多环结构的能量）与项（计算多环结构的能量）与VBI项的计算（计算内环结构的能量）。由于项的计算（计算内环结构的能量）。由于VM与与VBI计算所须要的数据计算所须要的数据以及计算特点有很大的差别，因此在设计中确定实行不同的硬件来完成。以及计算特点有很大的差别，因此在设计中确定实行不同的硬件来完成。VM项的计算量为项的计算量为1/6N3，计算涉及大量的数据，计算涉及大量的数据IO，因此在设计中如何，因此在设计中如何压缩数据压缩数据IO量是最为关键的问题。量是

30、最为关键的问题。l由于其中数据依靠过于困难，导致逻辑限制特别困难，有关探讨工作仍由于其中数据依靠过于困难，导致逻辑限制特别困难，有关探讨工作仍在进行中。在进行中。取得的主要成果(5)l蛋白质空间结构特征是蛋白质功能分析、蛋白质相互作用、进化树构建和药物设计等探讨的基础，我们综合运用图论、机器学习及数理统计方面理论，构建蛋白结构模板库，并基于该模板库，提出了一种新的同源建模预料算法，可以更精确地预料出更多的蛋白质空间结构。相关探讨成果将在Genome Research上发表。取得的主要成果(6)l系统生物学主要多个基因如何通过相互作用，共同完成困难的生理功能的。我们发挥计算所在算法方面多年积累的

31、优势，运用图论、矩阵论等工具，和生物物理所、北京基因组探讨所合作，在基因调控网络分析方面，提出了相互作用网络的谱分析方法,相关文章已经发表在NAR。取得的主要成果(7)l我们主要运用统计理论工具，和生物物理所、北京基因组探讨所合作，在蛋白质质谱数据分析方面，提出了基于Extreme Value Distribution的区分match和mismatch方法。现在正在和PG公司合作，探讨洗衣粉中蛋白酶的鉴定。取得的主要成果(8)lSTE-BLAST应用。以数据量达到440MB的杂交水稻PA64的原始Reads和已有的336MB水稻基因组的比较，从而加速了PA64的组装工作。同时从比对的结果中发觉

32、了一些有差异性的区域，这些差异区域对于探讨杂交水稻的优势工作具有重要的意义。lICT-ClustalW应用。该数据为1129 个基因家族，每个家族含有从哺乳类动物人、黑猩猩、小鼠、大鼠，到鸡、果蝇，直到酵母、植物等多个物种，包含了目前已测序的真核生物范围。这样的计算对于揭示真核生物的进化关系具有重要的意义。lICT-FindRNA应用。开发用于从内含子发觉microRNA；并对80Mbp，共45万条基因序列的内含子中，找寻microRNA。miRNA参与着生物体中很多基本生命过程的调控，在生命活动中起着特别重要的作用。创新点、主要意义与影响在硬件加速方面的创新在硬件加速方面的创新l成功研制了全

33、局动态规划加速卡PCI_GSW。包含3072个处理单元，主频达到133.3MHz，一块卡的性能就达到409.6GCUPS。和通用CPU（Xeon 2.8GHz）相比，对于全局动态规划专用算法，性能加速3600倍以上。在此基础上，进一步研制了局部动态规划加速卡，包含80个处理单元，主频达到80MHz，性能6.4GCUPS。l在Blast内核算法改进和并行化方面。我们从体系结构的观点动身，结合系统软件和操作系统的特点，提出了一种较好的可扩展的算法，通过对库造表，并将计算和输出重叠并行进行，隐藏I/O开销，不变更处理精度，大幅降低了内存开销，成倍提高了计算速度。目前该算法是全部的BLAST性能最优的

34、。在高性能计算方面的创新在高性能计算方面的创新l在Blast内核算法改进和并行化方面。我们从体系结构的观点动身，结合系统软件和操作系统的特点，提出了一种较好的可扩展的算法，通过对库造表，并将计算和输出重叠并行进行，隐藏I/O开销，不变更处理精度，大幅降低了内存开销，成倍提高了计算速度。目前该算法是全部的BLAST性能最优的算法方面的创新点算法方面的创新点l提出了一种新的同源建模预料算法，可以更精确地预料出更多的蛋白质空间结构。l在蛋白质质谱数据分析方面，提出了Extreme Value Distribution的区分match和mismatch方法。l在基因调控网络分析方面，提出了相互作用网络

35、的谱分析方法,相关文章已经发表在NAR。社会和经济效益（1）l曙光4000H项目已经通过有关部门的资产评估，其技术价值高达以2400万元l天津曙光计算机产业基地公司：天津曙光计算机产业基地公司：该项目注册资金6,000万元人民币，中科院计算所投资2,400.00万元（曙光4000H技术成果），天津新技术产业园区管理委员会投资1,200万元，北京市曙光计算机公司投资2,400万元。社会和经济效益（2）l促进了我国生命科学探讨。为广袤基因组学、蛋白质组学、医药科学、生物信息学等探讨工作者供应一个先进、易用的科研工具，同时，增加我国在生物科学等基础学科探讨领域的实力，在基因组探讨方面占据国际领先地位

36、。l促进可重构计算这一新学科的发展。可重构计算近年来受到高度重视，是高性能计算的重要分支。传统的高性能计算在很多传统行业，比如石油、气象、天文等领域都发挥了重要作用，而面对生命科学提出的挑战，可重构计算也越来越显示出其巨大的威力，同时也提出了很多新的课题。在本课题执行过程中，课题组接连获得三项相关领域国家自然科学基金项目支持，可重构计算学科成长起来。l促进我国在生物信息产业的发展。生物信息学产生的技术、应用、算法、软件和数据库，比如疾病相关基因、分子标记协助育种技术、药物筛选技术等，都具有重要的经济价值，最终都将产品化，创建干脆的经济效益。最终完成的生物信息处理专用计算机和软件包将占据国内市场

37、，并力求在国际市场占有一席之地。l促进多领域的沟通，培育一批跨领域的优秀人才。生物信息学是一门新兴的交叉学科，它位于信息学、物理学、数学和生物学的交叉点上，因此多领域的联合和沟通是促进这个领域发中的关键。我们通过建立联合试验室、合署办公、建立多专业领域人才队伍、举办生物信息学探讨班等方式做了一些尝试，并将进一步开阔思路，摸索促进沟通的新方法、新措施。l探讨队伍的建设探讨队伍的建设l课题探讨阶段，培育探讨员课题探讨阶段，培育探讨员/副探讨员副探讨员6名，出站博士后名，出站博士后2名，博士毕业生名，博士毕业生3名，硕士毕业生名，硕士毕业生5名。在读博士生、硕名。在读博士生、硕士生和硕士毕业生士生和

38、硕士毕业生10名。名。l其中已经有三人作为课题负责人，成功申请到国家自然科其中已经有三人作为课题负责人，成功申请到国家自然科学基金支持。一批跨学科专业人才成长起来，以可重构学基金支持。一批跨学科专业人才成长起来，以可重构计算为学术方向的科研团队已经形成。计算为学术方向的科研团队已经形成。l国内外合作和学术沟通状况国内外合作和学术沟通状况l出国访问探讨出国访问探讨3.5人年，即将出国访问探讨人年，即将出国访问探讨4.5人年，海外人年，海外学者来访学者来访3人次。参与国内外学术沟通人次。参与国内外学术沟通6人次。和法国、人次。和法国、加拿大、美国等相关探讨机构建议起亲密的学术沟通和加拿大、美国等相

39、关探讨机构建议起亲密的学术沟通和合作探讨关系。合作探讨关系。探讨队伍的建设和人才培育下一步工作设想下一步工作设想设想(1):百万亿次高密度基因组处理系统探讨l将来35年，基因测序技术将面临重大突破，1000美元，1天时间，完成一个特定个体的全基因组测序将成为现实。这将为以基因组学为基础的将来疾病诊断和治疗开拓广袤的前景，同时，对计算机技术提出前所未有的挑战。目前万亿次超级计算机完成人类基因组序列拼接计算，须要大约1年时间。因此，计算实力必需在35年内提高3个数量级才能满足要求。依据Moore定律，是不能满足该要求的。l我们希望科学院启动“生物信息处理专用计算机”二期工程，在2007年底，完成百

40、万亿次高密度基因组处理系统设想(2):粒子相互作用系统探讨l课题组已经和中国科学院过程工程探讨所合作，开展“粒子相互作用专用计算系统”前期探讨，“粒子相互作用”是对计算化学、计算物理、计算生物学中相当一类计算问题的抽象，具有广泛适用性，全球在研最快的千万亿次超级计算机Grape-6，就是面对类似应用问题的，目前已经达到360万亿次。预料在2008年前，可以完成全系统研制。曙光4000H的研制成功，为研制“粒子相互作用专用计算系统”奠定了坚实基础。l我们希望及早启动相关探讨，以“粒子相互作用”为应用背景，力争2008年，研制百万亿次；在2010年，研制成功千万亿次超级计算机设想(3):面对网络信息平安的专用计算机l探讨一种面对网络信息平安的专用计算机系统l接受通用系统标准接口专用部件的技术路途l软硬结合：l软件主要用于完成系统的数据流程的限制l硬件主要用于完成关键算法的加速，解决系统的瓶颈l实现按需扩展、系统均衡：对于网络、解码、匹配等瓶颈可以实现按需扩展，已达到系统均衡的目的l专用硬件主要实现以下系统功能：高效捕包、协议还原、数据解码、字符匹配l探讨实现基于FPGA的算法可重构硬件加速卡，可以对某几种算法进行加速计算，如BASE64硬件解码算法、LZ77硬件解压缩算法、字符匹配硬件算法，使专用计算机于通用系统相比系统的性能提高10倍以上感谢！感谢！

展开阅读全文