容错技术与容错服务器.pptx

上传人:一*** 文档编号:82677900 上传时间:2023-03-26 格式:PPTX 页数:46 大小:2.71MB
返回 下载 相关 举报
容错技术与容错服务器.pptx_第1页
第1页 / 共46页
容错技术与容错服务器.pptx_第2页
第2页 / 共46页
点击查看更多>>
资源描述

《容错技术与容错服务器.pptx》由会员分享,可在线阅读,更多相关《容错技术与容错服务器.pptx(46页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、容错技术与容错服务器容错技术与容错服务器上海海得控制系统股份有限公司上海海得控制系统股份有限公司上海海得控制系统股份有限公司上海海得控制系统股份有限公司第1页/共45页p 成立时间:成立时间:1994年年3月月15日日p 注册资本:注册资本:2.2亿人民币亿人民币p 公司性质:上市公司公司性质:上市公司-002184(2007年年11月深交所)月深交所)p 员工总数:员工总数:1029(2010年底)年底)p 主营收入:近主营收入:近14亿人民币(亿人民币(2011年底)年底)p 分支机构:覆盖全国的分支机构:覆盖全国的22个销售分、子公司及办事处个销售分、子公司及办事处p 研发能力:企业技术

2、中心、机电一体化的软硬件研发平台、电力电子系统研发平台研发能力:企业技术中心、机电一体化的软硬件研发平台、电力电子系统研发平台海得公司概况海得公司概况-基本信息基本信息第2页/共45页企业文化的核心理念企业文化的核心理念p 海得的使命:海得的使命:为各个领域提供最有竞争力的信息化与自动化产品及系统解决方案为各个领域提供最有竞争力的信息化与自动化产品及系统解决方案 和服务,持续为客户创造最大价值。和服务,持续为客户创造最大价值。p 海得的愿景:海得的愿景:成为中国工业自动化及信息化的领先者成为中国工业自动化及信息化的领先者p 海得的企业精神:海得的企业精神:海纳百川,得立千仞海纳百川,得立千仞p

3、 海得的经营理念:海得的经营理念:优质高效,追求卓越优质高效,追求卓越第3页/共45页海得销售网络海得销售网络北京沈阳大连济南南京上海总部无锡杭州武汉福州西安广州新疆成都HITEHITE销售、服务网络销售、服务网络销售、服务网络销售、服务网络 系统集成、工程、解决方案系统集成、工程、解决方案系统集成、工程、解决方案系统集成、工程、解决方案 代理产品分销、产品服务代理产品分销、产品服务代理产品分销、产品服务代理产品分销、产品服务长春重庆 新能源合作公司新能源合作公司新能源合作公司新能源合作公司第4页/共45页6 6内内 容容qq容错技术与容错服务器容错技术与容错服务器qq单机容错单机容错 VS.

4、双机热备双机热备qq容错带给客户的价值容错带给客户的价值qq行业应用行业应用第5页/共45页7 7什么是容错?容错是什么?什么是容错?容错是什么?这就是容错这就是容错这就是容错这就是容错 我们不用担心某一个部件的损坏会导致整个系统的失效我们不用担心某一个部件的损坏会导致整个系统的失效我们不用担心某一个部件的损坏会导致整个系统的失效我们不用担心某一个部件的损坏会导致整个系统的失效 系统能容忍任一部件的失效并继续工作系统能容忍任一部件的失效并继续工作系统能容忍任一部件的失效并继续工作系统能容忍任一部件的失效并继续工作 计算机系统可靠性设计方案计算机系统可靠性设计方案避错设计技术避错设计技术 容错设

5、计技术容错设计技术第6页/共45页8 8 世界上最可靠的服务器技术和解决方案美美国容错技术有限公司国容错技术有限公司|Stratus Technologies|Stratus Technologies1980-硬件级容错计算机系统厂商Stratus成立(位于美国波士顿),主要投资者有 Intel,NEC,Investcorp,MidOcean Partners1981-首先推出基于硬件的容错计算机系统1986-建立世界上第一个提供24小时服务的远程服务网1990 推出世界上第一个容错的 UNIX 操作系统-FTX1991-推出 RISC 结构的 XA/R 系列容错计算机系统1995-推出 RI

6、SC 结构的 Continuum 系列容错计算机系统1997-推出容错的 HP-UX 操作系统2001-推出世界上第一台推出世界上第一台 WinNT X86 平台硬件容错服务器平台硬件容错服务器 ftServer2005-推出支持推出支持 RedHat Linux Enterprise 的的X86平台硬件平台硬件容错服务器容错服务器第7页/共45页9 9技术合作伙伴技术合作伙伴 基于基于基于基于 OS OS 可用性特征的合作可用性特征的合作可用性特征的合作可用性特征的合作 内存再同步内存再同步内存再同步内存再同步 强化驱动程序强化驱动程序强化驱动程序强化驱动程序 企业关键应用的支持方式企业关键

7、应用的支持方式企业关键应用的支持方式企业关键应用的支持方式 ftServerftServer W W 系列产品安置在系列产品安置在系列产品安置在系列产品安置在 Redmond Redmond 测试实验室测试实验室测试实验室测试实验室 共同决定处理器的使用程序共同决定处理器的使用程序共同决定处理器的使用程序共同决定处理器的使用程序(LockStep(LockStep技术技术技术技术)更早得到最新处理器更早得到最新处理器更早得到最新处理器更早得到最新处理器 ftServer WftServer W系列产品安置在系列产品安置在系列产品安置在系列产品安置在 IntelIntel实验室实验室实验室实验室

8、 ftServer WftServer W系列产品安置在系列产品安置在系列产品安置在系列产品安置在 EMC EMC 认证实验室认证实验室认证实验室认证实验室 CLARiiONCLARiiON产品的转销产品的转销产品的转销产品的转销 合作支持方式合作支持方式合作支持方式合作支持方式第8页/共45页1010容错服务器的优越性容错服务器的优越性容错服务器的优越性容错服务器的优越性连续处理技术连续处理技术操作简单操作简单价格优势价格优势第9页/共45页1111Continuous ProcessingContinuous Processing TechnologyTechnology快速部署快速部署,

9、简化操作简化操作;最高级别的在线运行时间最高级别的在线运行时间保障连续运行的最佳方案保障连续运行的最佳方案连续处理技术连续处理技术第10页/共45页1212StratusStratus连续处理连续处理 技术(一)技术(一)第11页/共45页1313锁步技术锁步技术(时钟同步技术时钟同步技术)零切换时间零切换时间零切换时间零切换时间单软件映象单软件映象单软件映象单软件映象消除单点故障消除单点故障消除单点故障消除单点故障CPUCPUN way SMPN way SMPSNPSNPASICASICMemoryMemoryChipsetChipsetTMRTMRCPUCPUN way SMPN way

10、 SMPSNPSNPASICASICMemoryMemoryChipsetChipsetCPUCPUN way SMPN way SMPSNPSNPASICASICMemoryMemoryChipsetChipsetDMRDMRLockstep CPUsDiskPCISSPSSPASICASICPCISSPSSPASICASICDisk第12页/共45页1414错误检测错误检测和和隔离隔离嵌入式嵌入式嵌入式嵌入式 I/OI/OPCIPCI磁盘磁盘处理器处理器处理器处理器芯片集芯片集芯片集芯片集内存内存内存内存错误检测错误检测和和隔离隔离错误检测错误检测和和隔离隔离嵌入式嵌入式嵌入式嵌入式 I/

11、OI/OPCIPCI磁盘磁盘处理器处理器处理器处理器芯片集芯片集芯片集芯片集内存内存内存内存错误检测错误检测和和隔离隔离同步锁定同步锁定 CPUs多路径多路径 I/O模块方式实现模块方式实现模块方式实现模块方式实现6600 第13页/共45页1515StratusStratus连续处理连续处理 技术(二)技术(二)第14页/共45页1616Windows 2003:Server,Enterprise Server,Data Center ServerI/O SystemSecurityLocalVirtualProcess StructureObject ServicesFile Server

12、Object management/executive run timeDevice Drivers(Level 1)Level 2Platform InterfaceI/ODevicesDMAControlBIOSCacheControlPrivilegedArchitectureHardware Abstraction Layer(HAL)PCI ConfigIOVAInterruptsKernelDaemonsServicesApplicationsManagementFile ServerSecuritySession ManagerReplicatorLogonAltererEven

13、t LoggerOtherSQL ServerMS ExchangeWeb ServerDiagnosticsRemote ConsoleServer ManagementStratus Value AddDevice Drivers(Level 1)Level 2BIOSHardware Abstraction Layer(HAL)PCI ConfigIOVAInterruptsDiagnosticsRemote ConsoleServer Management StratusStratus软件增强透明性软件增强透明性第15页/共45页1717故障安全软件机制故障安全软件机制软件屏蔽瞬间硬件

14、错误软件屏蔽瞬间硬件错误强化驱动程序预防软件故障强化驱动程序预防软件故障广泛综合和错误插入测试广泛综合和错误插入测试软件在线升级服务软件在线升级服务内存和磁盘数据保护内存和磁盘数据保护故障防范故障防范故障防范故障防范故障防范故障防范!软件可靠性软件可靠性预防、诊断、和解决软件问题预防、诊断、和解决软件问题第16页/共45页1818 StratusStratus连续处理连续处理 技术(三)技术(三)第17页/共45页1919 ActiveServiceActiveService 体系结构体系结构自动的故障检测和隔离自动的故障检测和隔离(服务器的自身纠错机制服务器的自身纠错机制)集成的故障集成的故

15、障”回叫回叫”和远程支持和远程支持(Stratus CAC)Stratus 和第三方的合作支持和第三方的合作支持系统非工作状态的管理能力系统非工作状态的管理能力技术激活的服务方式技术激活的服务方式技术激活的服务方式技术激活的服务方式在问题引发系统停顿前检测和报告错误在问题引发系统停顿前检测和报告错误在问题引发系统停顿前检测和报告错误在问题引发系统停顿前检测和报告错误 故障防范故障防范故障防范故障防范管理管理访问访问网络网络ActiveService体系结构第18页/共45页2020 ActiveServiceActiveService 体系体系:自动获得可用性自动获得可用性热插拔部件非常热插拔

16、部件非常容易容易更换更换系统自动同步更换的部件系统自动同步更换的部件系统正常处理贯穿整个更换过程系统正常处理贯穿整个更换过程系统正常处理贯穿整个更换过程系统正常处理贯穿整个更换过程!系统自动订购系统自动订购正确正确的更换部件的更换部件Next DayNext DayDelivery Delivery ServiceService部件故障部件故障.系统系统隔离隔离错误并通知错误并通知 Stratus 有有CPU 故障故障 第19页/共45页2121Guest OS 问题分析处理问题分析处理一站式的技术支持一站式的技术支持Count on Stratus&HiteCount on Stratus&

17、Hite第20页/共45页2222最新推出的第六代容错服务器最新推出的第六代容错服务器采用最新架构Intel Xeon processor E5 处理器 服务器整体性能提升125%以上;逻辑内存可扩展至 256GB;内置8对 2.5”SAS 磁盘,物理存储容量可达 8TB;集成远程管理模块,服务器的管理更加智能灵活Up to8.0 GT/s第21页/共45页2323Note:All I/O options specified in logical count,physical count is 2 times numbers specified 2700 2700 Low-end system

18、Low-end system47004700Mid-tier systemMid-tier system64006400High-end systemHigh-end systemPositioningValueFlexibilityPerformanceProcessors1-socket2-socket2-socketCore per processorQuad-coreQuad-coreOcta-coreMemory Slots8 DIMM Slots8 or 16 DIMM Slots16 DIMM SlotsMaximum System Memory 32 GB (Using 8 G

19、B)256 GB(using 16 GB)256 GB(using 16 GB)Embedded Ports 6 Gb SAS,4 x USB 2.0(3 rear,1 front),2 x COMM,VGA,DVD R/W(front)Ethernet ports2 x 1 GbE1 x VTM 1 GbE2 x 1 GbE1 x VTM 1 GbE2 x 1 GbE2 x 10 GbE1 x VTM 1 GbEPCI Slots2 x PCIe x4 Gen 22 x PCIe x4 Gen 22 x PCIe x4 Gen 22 x PCIe x8 Gen 2Disk Slots8 x

20、2.5”HDD/SSD SAS DisksForm Factor4U RackOptional EmbeddedSlots/GbE PortsNot Available2 x PCIe x8 Gen 22 x 10 GbEIncluded Standard第22页/共45页2424内容内容qq容错技术与容错服务器容错技术与容错服务器qq单机容错单机容错 VS.双机热备双机热备qq容错带给客户的价值容错带给客户的价值qq行业应用行业应用第23页/共45页2525委屈求全的委屈求全的“容错容错”方案方案-Cluster-ClusterHAHA方案,方案,方案,方案,High Availabilit

21、yHigh Availability但这并不是真正意义上的容错!但这并不是真正意义上的容错!但这并不是真正意义上的容错!但这并不是真正意义上的容错!第24页/共45页2626集群是如何工作的集群是如何工作的Data Disk(Mirror)OSOSSCSIENETSMMServer-PrimaryCluster AppCluster AppMiddlewareMiddlewareApplicationApplicationOSOSSCSIENETSMMServer-StandbyCluster AppCluster AppMiddlewareMiddlewareApplicationAppli

22、cationStorage EnclosureHeart-Beat CheckingWorkstation2Workstation3123Workstation1第25页/共45页2727 系统架构对比系统架构对比Stratus ftServer(Single System)System&DataDisk(Mirror)SCSISCSIStorage EnclosureENETENETSMMSMMOSOSMiddlewareMiddlewareApplicationApplicationData Disk(Mirror)Storage EnclosureCluster(Mulitple Sys

23、tems)OSOSSCSIENETSMMServer-PrimaryCluster AppCluster AppMiddlewareMiddlewareApplicationApplicationOSOSSCSIENETSMMServer-StandbyCluster AppCluster AppMiddlewareMiddlewareApplicationApplication第26页/共45页2828拓扑结构比较拓扑结构比较心跳线心跳线p 系统结构复杂系统结构复杂p 环节过多,外部连接环节过多,外部连接p 故障发生点多故障发生点多无单点故障的集群方案无单点故障的集群方案无单点故障的容错方案

24、无单点故障的容错方案n 系统结构简单系统结构简单n 如同单机,内部连接如同单机,内部连接n 故障发生点少故障发生点少第27页/共45页2929工作原理比较工作原理比较容错容错Passive BackplanePassive BackplaneSSPSSPSSPSSPSNPSNPSNPSNPI/OI/OCPUCPU1+1=1+1=?1+1=1+1=?MEMMEM2 22 2DiskDisk所有运算在不同板上所有运算在不同板上同时进行同时进行同时进行同时进行I/O I/O I/O I/O 板板板板CPU/MEM CPU/MEM CPU/MEM CPU/MEM 板板板板第28页/共45页3030当当

25、CPUCPU主板出现问题时主板出现问题时.Passive BackplanePassive BackplaneSSPSSPSNPSNPI/OI/OCPUCPU1+1=1+1=?1+1=1+1=?MEMX XDiskDiskSNPSNPSSPSSP2 2MEM2 2任何一块任何一块CPUCPU板上的任何部件损坏,都不会影响系统的正常运行。正在进行的运算和操作会象没发生问题一样继续下去。板上的任何部件损坏,都不会影响系统的正常运行。正在进行的运算和操作会象没发生问题一样继续下去。第29页/共45页3131如果如果I/OI/O板再出现问题呢?板再出现问题呢?Passive BackplanePass

26、ive BackplaneSSPSSPSNPSNPI/OI/OCPU1+1=1+1=?DiskDiskSSPSSP2 2MEM2 2X任何一块任何一块I/OI/O板上的任何部件损坏,也不会影响系统的正常运行。正在进行的运算和操作同样象没发生问题一样继续下去。板上的任何部件损坏,也不会影响系统的正常运行。正在进行的运算和操作同样象没发生问题一样继续下去。I/O I/O I/O I/O 板板板板CPU/MEM CPU/MEM CPU/MEM CPU/MEM 板板板板第30页/共45页3232工作原理比较工作原理比较-集群集群I/OCPU1+1=1+1=?MEM2 2I/OCPU1+1=1+1=?M

27、EM2 2Disk0100010110100010101010111010111010010110001100011101X1+2=1+2=3 3CPUCPU、内存和等待、内存和等待、内存和等待、内存和等待I/OI/O的所有数据的所有数据的所有数据的所有数据丢失丢失丢失丢失,数据库、应用、文件系统都没有被安全关闭,数据库、应用、文件系统都没有被安全关闭,数据库、应用、文件系统都没有被安全关闭,数据库、应用、文件系统都没有被安全关闭需要需要需要需要时间时间时间时间等待备机检测到故障发生等待备机检测到故障发生等待备机检测到故障发生等待备机检测到故障发生需要需要需要需要时间和运气时间和运气时间和运气

28、时间和运气进行磁盘组切换、需要进行磁盘组切换、需要进行磁盘组切换、需要进行磁盘组切换、需要时间和运气时间和运气时间和运气时间和运气进行文件系统检查进行文件系统检查进行文件系统检查进行文件系统检查需要需要需要需要时间时间时间时间重新启动应用程序,需要重新进行一些运算以回到断点重新启动应用程序,需要重新进行一些运算以回到断点重新启动应用程序,需要重新进行一些运算以回到断点重新启动应用程序,需要重新进行一些运算以回到断点需要需要需要需要时间和运气时间和运气时间和运气时间和运气重新启动数据库并进行数据库修复工作重新启动数据库并进行数据库修复工作重新启动数据库并进行数据库修复工作重新启动数据库并进行数据

29、库修复工作最重要的是:切换并不一定总是成功!最重要的是:切换并不一定总是成功!最重要的是:切换并不一定总是成功!最重要的是:切换并不一定总是成功!系统系统系统系统 A A A A系统系统系统系统 B B B B第31页/共45页3333集群和容错方案硬软件工作原理比较集群和容错方案硬软件工作原理比较通用通用通用通用HAHA容错容错CA交易丢失选择新平台业务延滞故障故障出现出现故障故障恢复恢复数据丢失,后期会花费大量的力量来找回数据丢失,后期会花费大量的力量来找回数据丢失,后期会花费大量的力量来找回数据丢失,后期会花费大量的力量来找回恢复总时间恢复总时间=基本系统恢复时间基本系统恢复时间+数据库

30、恢复时间数据库恢复时间+应用程序恢复时间应用程序恢复时间+网络恢复时间网络恢复时间 第32页/共45页3434计算机业界对可靠性的定义计算机业界对可靠性的定义方案可靠性方案可靠性99.999%99.99%99.9%99%容错服务器容错服务器容错服务器容错服务器独立独立服务服务器器使用外使用外部磁阵部磁阵的独立的独立服务器服务器简易的简易的集群系集群系统统消除单消除单点故障点故障的集群的集群系统系统大型主机大型主机第33页/共45页3535$Windows 2003 x 22套主机系统集群部件以及存储阵列应用程序和中间件 x 2系统维护以及停机损失应用程序和中间件 x 1集群软件集群规划实施费用

31、-集群设计-集群测试验证-应用程序设置简单的单机管理Win2003 x 1Rapid Disk Resync用户成本比较用户成本比较容错容错ftServerTCO 比较比较一套一套ftServerCluster集群集群第34页/共45页36362003 2003 美国供电中断美国供电中断是由于集群切换方案的失败是由于集群切换方案的失败区域供电中断区域供电中断13分钟分钟第35页/共45页3737当我们有彻底当我们有彻底避免灾难避免灾难的方案时的方案时为什么还要选择灾难恢复方案呢为什么还要选择灾难恢复方案呢灾难灾难灾难灾难恢复恢复恢复恢复集群方案集群方案灾难灾难灾难灾难预防预防预防预防容错方案容

32、错方案“Why choose a server designed to recover from a failure,rather than a server designed not to fail?”Vernon Turner,IDC第36页/共45页3838内容内容qq容错技术与容错服务器容错技术与容错服务器qq单机容错单机容错 VS.双机热备双机热备qq容错带给客户的价值容错带给客户的价值qq行业应用行业应用第37页/共45页3939容错为客户带来价值容错为客户带来价值Stratus Stratus 向客户提供解决方案:向客户提供解决方案:向客户提供解决方案:向客户提供解决方案:具有连

33、续可用性能力具有连续可用性能力具有连续可用性能力具有连续可用性能力 -拥有无可比拟的优势拥有无可比拟的优势 (99.9998+%uptime)操作简便性操作简便性操作简便性操作简便性 -提供具有显著的操作简便性提供具有显著的操作简便性财务优势财务优势财务优势财务优势 -产品和解决方案产品和解决方案(最小的最小的TCO)第38页/共45页4040内容内容qq容错技术与容错服务器容错技术与容错服务器qq单机硬件容错单机硬件容错 VS.双机热双机热备备qq容错带给客户的价值容错带给客户的价值qq行业应用行业应用第39页/共45页4141行业应用行业应用连续可用性是必需的,停机时间是不能容忍的实时关键

34、领域应用实时关键领域应用24 x 7小时可用性小时可用性第40页/共45页4242工业工业控制系统的应用控制系统的应用ftServer systems:one of first servers to earn ftServer systems:one of first servers to earn the ABB “Industrial IT Certified”designationthe ABB “Industrial IT Certified”designation第41页/共45页4343秒秒 分钟分钟 小时小时 班组班组 天天 周周 月月 年年L1/L2 L3 L4数据信息指令计划

35、生产控制系统生产控制系统DCS/PLC,SCADA,HistorianERPXML,ETL,ODBC/OLE DBMES制造执行系统制造执行系统ODBC,OPC,HDA,XMLXML,Netwaver,ODBC最可靠的容错服务器无处不在最可靠的容错服务器无处不在第42页/共45页4444行业应用案例概况行业应用案例概况n冶金行业冶金行业系统:系统:HMI/SCADA Server;PCS Database Server,Application HMI/SCADA Server;PCS Database Server,Application Server;MES/EMSServer;MES/EM

36、S业绩:业绩:宝钢集团、鞍本钢、首钢集团、济钢、重钢、天铁、西南铝宝钢集团、鞍本钢、首钢集团、济钢、重钢、天铁、西南铝n电力行业电力行业系统:电厂系统:电厂SISSIS、MISMIS、BOPBOP项目中项目中I/O Server I/O Server、Database ServerDatabase Server等;变等;变电站综合自动化系统电站综合自动化系统业绩:阳西电厂、兰溪电厂、新疆天业电厂、国家电网、福建莆田业绩:阳西电厂、兰溪电厂、新疆天业电厂、国家电网、福建莆田LNGLNGn交通行业交通行业系统:系统:高速路隧道桥梁高速路隧道桥梁HMI/SCADAHMI/SCADA监控系统、收费系统

37、、城市智能交通控监控系统、收费系统、城市智能交通控制系统、机场弱电系统集成等制系统、机场弱电系统集成等业绩:上海长江隧桥、宁杭高速、无锡城市隧道监控系统、业绩:上海长江隧桥、宁杭高速、无锡城市隧道监控系统、SCATSSCATS智能信号智能信号控制控制n煤炭、化工、烟草行业、汽车制煤炭、化工、烟草行业、汽车制造造系统:煤矿综合自动化、系统:煤矿综合自动化、MESMES;化工;化工DCSDCS系统、实时系统、实时/历史数据库系统;物历史数据库系统;物流、制丝生产控制系统;汽车流、制丝生产控制系统;汽车SCESCE、MESMES系统系统业绩:淮南矿业集团、神华集团、广州烟厂、杭州烟厂、宗申摩托、丰田汽业绩:淮南矿业集团、神华集团、广州烟厂、杭州烟厂、宗申摩托、丰田汽车车第43页/共45页4545联系我们联系我们联系我们联系我们 第44页/共45页4646感谢您的观看。感谢您的观看。第45页/共45页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文献 > 管理工具

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com