数据中心监控系统技术白皮书.doc

上传人:小** 文档编号:2793635 上传时间:2020-05-06 格式:DOC 页数:122 大小:237KB
返回 下载 相关 举报
数据中心监控系统技术白皮书.doc_第1页
第1页 / 共122页
数据中心监控系统技术白皮书.doc_第2页
第2页 / 共122页
点击查看更多>>
资源描述

《数据中心监控系统技术白皮书.doc》由会员分享,可在线阅读,更多相关《数据中心监控系统技术白皮书.doc(122页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、#+For personal use only in study and research; not for commercial use数据中心监控系统技术白皮书Data Center Monitoring SystemTechnical White Paper中国工程建设标准化协会信息通信专业委员会数据中心工作组2013年10月序言为促进数据中心的技术发展,2012年X月,数据中心工作组开始编制数据中心监控系统技术白皮书。在编写过程中,编写组根据国内外相关技术标准规范的要求,进行了多次专题研究和调查分析,广泛征求各方面的意见,总结归纳国内外数据中心XXXXXXX的实践经验,经多次修改和专家

2、审查,于201X年X月定稿。本白皮书作为数据中心建设的参考文献,技术内容的解释由中国工程建设标准化协会信息通信专业委员会数据中心工作组负责。在应用过程中如有需要修改和补充的建议,请将有关资料XXXXXX主编单位:共济科技有限公司参编单位:银联结算上海数据中心课题技术负责人:钟景华主编:易南昌参编:丁波饶云飞林德昌徐康华刘晓彬审核:排版与文字校对:张莹目 录/CONTENTS1 引言/INTRODUCTION41.1 编写目的/purpose41.2 适用范围/scope41.3 编写依据/reference41.4 编写原则/principle52 数据中心分级与分类/DATA CENTER

3、CLASSIFICATION62.1 概述/general62.2 数据中心等级/data center tier62.3 数据中心类别/data center class72.4 数据中心规模/data center scale82.5 系统匹配设计基本原则/basic system design principle83 系统架构与功能/SYSTEM ARCHITECTURE & FUNCTION103.1 概述/general103.2 系统架构/system architecture103.3 系统功能/system function153.4 系统性能/system performan

4、ce223.5 系统集成/system integration224 系统基础构件与技术/SYSTEM BASIC MODULE & TECHNOLOGY384.1 概述/general384.2 软件系统基础构件/software basic module384.3 硬件系统基础构件/hardware basic module495 系统设计/SYSTEM DESIGN545.1 设计概要/general545.2 设计原则/system design principle545.3 系统设计需求分析/system requirement analysis555.4 监控管理需求分析/moni

5、toring management requirement analysis555.5 需求分析其他相关问题/miscellaneous615.6 系统架构设计/system architecture design625.7 系统功能设计/system function design715.8 系统性能设计/system performance design755.9 设备选型/equipment selection776 工程实施/IMPLEMENTATION836.1 工程实施概述/general836.2 前期准备/preparation836.3 现场实施/implementation

6、 & deployment846.4 验收交付/delivery & acceptance927 总控中心场地建设/ECC CONSTRUCTION957.1 概述/general957.2 总控中心的组成/ecc constitution957.3 总控中心的场地设计/ecc site design967.4 总控中心的工艺设计/ecc process design977.5 总控中心的施工技术要求/technical specification988 发展趋势/TREND1018.1 发展回顾/overall review1018.2 顶层设计/top-level design1018.3

7、 监控管理技术发展/development of monitoring management technique1028.4 监控管理系统与绿色数据中心/monitoring management system & green data center1038.5 实用技术的应用/pratice of related technique1049 名词解释/GLOSSARY1111 引言提高现代数据中心可用性与降低运营管理成本是数据中心管理永恒的主题。数据中心监控系统(下称监控系统,无歧义的地方称系统),能够帮助管理者增强数据中心可用性、提高运维效率并降低运维成本,是现代数据中心必不可少的监控管理

8、信息化工具,在数据中心的运行、维护、管理中,发挥着越来越重要的作用。数据中心监控系统技术白皮书(下称白皮书)将依据国家相关规范,参照国际相关标准与行业最佳实践,定义系统概念、界定系统范围、描述系统架构与构件、介绍系统功能、确立性能指标、规范设计与施工方法。白皮书也对监控管理系统及相关技术的发展趋势作了简要介绍。1.1 编写目的白皮书基于标准,又泛于标准、细于标准。本白皮书的目的在于为现代数据中心监控系统规划、设计、建设、维护、使用人员提供参考资料,也为行业人员进行国内外技术交流提供相对统一的语言范本。1.2 适用范围监控管理系统是数据中心运行维护人员必不可少的自动化、信息化工具,是数据中心规划

9、、建设、必不可少的部分。本白皮书可供数据中心监控系统的新建、改建、扩建工程的技术选择、规划设计、工程实施、运行管理以及系统开发等相关人员参考。1.3 编写依据白皮书是以国家相关标准规范为依据,结合了我国行业现状,参考国际相关规范与行业发展趋势,由多位行业专家编制完成的。主要参考文件有:电子信息系统机房设计规范GB 50174-2008电子信息系统机房施工及验收规范GB 50462-2008 电子计算机场地通用规范GB/T 2887-2011供配电系统设计规范GB 50052电能质量供电电压偏差GB/T 12325建筑物电子信息系统防雷技术规范GB 50343低压配电设计规范GB 50054建筑

10、设计防火规范GB 50016计算机和数据处理机房用单元式空气调节机GB 19413-2010采暖通风与空气调节设计规范GB 50019-2003民用建筑电气设计规范JGJ/T16-2008 Telecommunications Infrastructure Standard for Data CentersTIA942Data Center Site Infrastructure Tier Standard1.4 编写原则实用性原则数据中心是极其复杂的监控管理对象。本白皮书不可能包罗万象、面面俱到,但将按照数据中心不同类型、不同等级、不同规模、不同发展阶段(建设管理阶段)的现实需要,尽可能完整

11、地描述系统主流的、典型的软硬件功能模块、设备与设计,尽量做到能对数据中心基础设施的监控管理相关工作发挥实际指导作用。先进性原则IT技术发展迅速,信息化社会对数据中心的可用性要求也在迅速提高,数据中心管理理念、方法及其信息化技术也在不断推陈出新,数据中心相关的新的管理方法、技术往往能更有效地解决问题。监控管理系统适度超前的设计是数据中心监控管理的实际需要。白皮书将适当介绍相关领域比较前沿的技术与设计方法。2 数据中心分级与分类2.1 概述监控管理系统是数据中心监控管理信息化工具,因此其设计应该与数据中心管理目标、体系与架构相适应、相匹配,这需要我们梳理数据中心的分级与分类。数据中心(DC)是一个

12、安装有场地设施、IT设施与系统,能实现数据的集中处理、存储、传输、交换、管理的场所,是信息系统的核心节点。数据中心可以由具有多个机房模块的楼宇群组成,也可以是一个建筑物中独立的物理空间(俗称机房)。数据中心按规模有大小之分,按用途有类别之分,按重要性(可用性)有等级之分。监控管理系统需要根据数据中心的大小、重要性、类别(管理属性)等进行匹配设计。本章节将继承GB 50174-2008电子信息系统机房设计规范对数据中心基础设施分级的定义,参考国际相关标准,并结合数据中心的其它特性,对不同种类的数据中心进行分级、分类说明,以便在随后的章节中对应不同级别与种类的数据中心介绍不同设计与配置的监控管理系

13、统。2.2 数据中心等级我国GB 50174-2008电子信息系统机房设计规范按机房的可用性将机房分为A、B、C三级,国际数据中心相关研究机构Uptime Institute数据中心场地设施等级标准(Data Center Site Infrastructure Tier Standard)与TIA 942数据中心电信基础设施标准(Telecommunications Infrastructure Standard for Data Centers)把机房可用性等级分为四级,国内外数据中心等级对照如表2.2-1。对于按照国标GB 50174-2008设计的数据中心,系统可用性将按ABC三级匹配

14、设计;对于参照国际标准设计的数据中心,系统可用性则应按四级匹配设计。表2.2-1 机房可用性等级定义GB 50174-2008冗余度级别定义(GB)可用性描述国际标准 A容错1、电子信息系统运行中断将造成重大的经济损失;2、电子信息系统运行中断将造成公共场所秩序严重混乱。该级别数据中心具有多重的、独立的、物理上相互分隔的冗余设备与线路,各设备与线路并行工作,无单点故障,所有计算机设备都具备双电源并按照场地架构拓扑连接。制冷系统也要求不间断工作。Tier 设备与线路冗余该级别数据中心具有冗余设备与线路,所有计算机设备都具备双电源并按照场地架构拓扑连接。Tier III只要求任何时刻有一条线路被使

15、用。Tier B冗余1、电子信息系统运行中断将造成较大的经济损失;2、电子信息系统运行中断将造成公共场所秩序混乱。该级别数据中心具有冗余设备,但是所有设备仍由一套线路系统相连通。Tier C基本满足需求不属于A 级或B 级的电子信息系统机房应为C 级。该级别数据中心满足数据中心运行所需的基本需求,无冗余。Tier 2.3 数据中心类别数据中心按照服务的对象主要分为两大类:一类是企业数据中心(EDC),另一类是互联网数据中心(IDC)。EDC包括金融、电力、石油、研究院等企事业单位的数据中心和政府的数据中心(GDC)。该类数据中心主要特征是由机构自建、自管、自用,且主要使用自建或租用的网络资源组

16、成相对封闭的私有广域网络(俗称内网)为本单位的业务与管理提供信息化支撑平台,不盈利或不直接盈利。当然,越来越多的单位也会通过互联网(俗称外网)为其业务服务对象提供安全访问入口。在我国,这类数据中心以前更多地被称为“信息中心”。小型组织可以有一个数据中心,大型组织往往因为业务或管理范围覆盖全国甚至全球,其信息系统通常包含分布于不用地域具有一定管理层级关系的多个数据中心。与管理架构(决策层、管理层、执行层或三层网络架构)匹配,EDC与管理层级对应可分为数据中心、数据分中心或一级、二级、三级数据中心等。随着信息共享要求的提高,数据大集中成为趋势。相应地,较大型组织EDC通常匹配组织管理架构,呈金字塔

17、形分布,越往组织的低层,机房规模越小,数量越多,或反之。IDC是互联网营运企业建设的数据中心。该类数据中心主要特征一是主要面向企业以出租各种数据中心相关软硬资源而盈利为目的,如机房场地、网络、存储、计算等资源出租,并提供IT设备托管等Iaas服务业务,以及IT系统运行监控、维护、运维管理等相关增值服务;二是IDC租户主要面向公众用户提供基于互联网的信息服务。中国拥有IDC的企业主要有两类,一类是拥有网络(有线、无线)资源的电信营运商,另一类是第三方IDC服务商。表2.3-1EDC与IDC数据中心分层对比表EDCIDC“中央”级信息中心数据中心(可含多栋楼)“省级”数据中心楼栋(可含多个机房)“

18、地市、区级”数据分中心机房(独立物理空间)“网点”(业务集中受理点)级机房微模块、虚拟机房、机柜表2.3-1说明:1、 “中央”级信息中心的规模可能是很大的,如各大银行总行信息中心也会由多栋建筑多个机房模块组成,此时EDC既有跨地区联网管理的层级关系(“中央”级、“省级”、“地市、区级”、“网点”),其“中央”级大型数据中心也有如单个大型IDC分层管理的层级关系。2、 在中国,目前中小型组织自建的为自身业务信息化服务的小型数据中心数量相当多。这些数据中心层级结构很简单,可能接入机房都没有,用户通过散布的交换机直接接至机房。相信随着社会诚信度与网络安全技术的提高、数据中心运维成本压力的加大,这类

19、组织将成为IDC的用户而不再自建机房。2.4 数据中心规模按面积,数据中心大致可以分为超大型、大型、中大型、中型、小型数据中心(如表2.4-1)。通常IDC以大型、超大型为主。而小型、超小型数据中心主要是机构的接入层机房(比如银行、证劵的网点机房、政府各部门服务窗口),汇聚层机房(多个接入层机房的汇聚)等。超大型数据中心可由多栋建筑组成,每栋建筑包含多个机房模组(独立物理空间),每个机房包含多个微模块、虚拟机房、列。数据中心监控管理的最小管理域可达机柜。多个机房模块组成的超大型数据中心可以由不同等级的机房组成,这样可以以相对合理的建设与运维成本满足用户对不同可用性等级的需要。表2.4-1数据中

20、心规模划分数据中心规模使用面积(平方米)值守情况小型数据中心小于200酌情值守中型中型200-500基本24小时值守中大型500-200024小时值守大型大型2000-1000024小时值守超大型大于1000024小时值守另外,数据中心的值守模式也影响监控管理系统设计。根据数据中心的重要性程度与运行管理成本,通常独立的小型、超小型机房基本上不会安排现场值守,中型数据中心一般会根据业务需要安排值守,联网管理的数据中心群、大型、超大型数据中心都会安排24小时值守(如表2.4-1)。随着信息化应用的深入,人们的工作、生活对信息化系统依赖程度的进一步增强,通过24小时实时监控与及时的维护来保证中小型数

21、据中心的可用性成为必然。有些企业已经开始依托监控管理系统提供远程监控值守与运维外包服务,较好地解决了中小型数据中心运行值守要求与运维成本的矛盾。2.5 系统匹配设计基本原则2.5.1 系统与数据中心可用性等级匹配设计原则系统的可用性设计应与数据中心基础设施的可用性等级相匹配,原则上监控管理系统的可用性设计应该不低于该数据中心基础设施的可用性等级。如对于A级机房,监控管理系统也应该设计成容错的。同一个数据中心,不同业务的机房按其重要性也需要按不同可用性设计,相应地基础设施监控管理系统的可用性也应匹配设计。如IDC为满足租户对可用性不同要求,会按机房模块、微模块设计不同可用性;2.5.2 系统与数

22、据中心类别匹配设计原则 不同类别(服务对象)的数据中心,系统设计也有不同,其架构、功能等都要针对性地匹配设计。如IDC管理主要具有局域特征,而EDC除具有局域特征外,还具有广域特征,即分级监控管理或全国(跨地区)统一(联网)监控管理;IDC围绕商业目的开展运营管理,EDC围绕保证组织的业务运作开展运行管理,两者的管理重点也不相同,因此其系统设计与管理功能模块匹配是不尽相同的。2.5.3 系统与数据中心规模匹配设计原则 数据中心规模不同,监控管理系统设计方案也不同。数据中心规模与可用性要求有一定关系,一般规模越大,数据集中度高,影响面大,可用性要求也越高(需要说明在大型、超大型数据中心,不同机房

23、模块的可用性等级设计可以根据业务或市场需求而有所不同);数据中心规模越大,监控对象越多,对监控系统的处理能力要求越高。对于中大型数据中心,一般标配总控中心系统,有24小时值班安排;而对于小型特别是超小型机房,则往往是组织的接入层机房而只需进行采集信息,重要的可以使用24小时监控值守外包服务(一种由服务商通过VPN网络提供的远程监控职守服务)。3 系统架构与功能3.1 概述监控管理系统是数据中心工作人员的信息化工具,系统架构设计应考虑与数据中心组织管理架构相对应,以便相关人员履行岗位职责,系统功能必须满足数据中心工作人员对数据中心进行监控、维护与管理的需要。监控管理系统应用计算机软件技术、网络通

24、信技术、数据库技术、工业自动控制技术、传感技术等,通过采集、处理数据中心各种智能型和非智能型的设备或系统的运行状态、参数及信息,对数据中心基础设施进行全面监控,并通过分析处理监控信息驱动管理与决策,从而及时高效地做好运行维护,保证数据中心的可用性。本章主要描述一般监控管理系统的软硬件架构、系统组成和功能等。3.2 系统架构监控管理系统首先是一个多系统集成的综合系统,这是由它监控的对象及其特征所决定的。数据中心的监控对象包括:数据中心供配电动力状况及其相关设备、机房环境状况及其相关设备、机房空间物理安全状况及其相关设备。这些在数据中心承担不同功能的设备,类型多,数量多,参数多,连接多;而且它们自

25、身也可以组成一个个相对独立的硬件系统。因此,通过一个统一的监控管理平台,集成这些系统,就可以组成一个完整的监控管理系统。监控管理系统也是一个数据采集、加工处理、统计分析的数据管理平台。系统监测的数据,一方面用来实时反映基础设施当前的运行状态指标,以便数据中心机房维护管理人员第一时间发现问题,及时消除,避免对数据中心所支撑的各个业务应用的影响;另一方面,按照一定的原则和要求,保存历史监控数据,用于日后事故追踪、查询统计和趋势分析。监测的数据经过加工,驱动管理。以下分别从逻辑架构、物理架构、系统部署架构三个方面介绍监控管理系统的整体架构。3.2.1 系统逻辑架构逻辑架构描述了监控管理系统软件由哪些

26、逻辑构件组成、以及这些逻辑构件之间的关系。系统逻辑架构由以下四大逻辑构件组成:监控系统,运行管理系统,总控中心系统,基础服务系统。如下图图 数据中心监控系统逻辑架构图(1)监控系统监控系统完成对数据中心基础设施的监控,由以下两大子系统组成:1)信息采集子系统信息采集子系统完成对供配电、环境、安防等监控对象的状态、参数、数据、设备属性、配置等信息的采集,并将信息按标准格式传输到信息处理子系统。同时,信息采集子系统还响应上层信息处理子系统的控制指令,控制受控设备或系统。2)信息处理子系统信息处理子系统主要完成信息的汇聚、存储和处理。信息处理子系统接收信息采集子系统的数据,对数据进行加工运算处理,按

27、照告警规则产生新的告警信息,对众多的告警信息进行关联压缩、过滤,完成故障定位,实现对数据中心的全方位一体监控。重要实时监控信息送总控中心系统展示;管理相关的信息驱动管理流程;其他重要数据,信息处理子系统进行存储管理,形成历史数据供运行管理系统调用,并按要求形成统计分析报告。信息处理子系统不仅完成监视功能,还可以完成一定调节与控制功能(实际工作中,对于可能影响数据中心可用性的控制需要谨慎)。可以根据应用需要,对数据中心基础设施设备进行手动和自动调节与控制。(2)运行管理系统运行管理系统利用一体化监控系统汇聚的数据再加上用户输入的一些必要的管理信息,实现数据中心运维管理(服务请求管理、事件管理、巡

28、检管理等)、能耗管理、资产管理、容量管理等,完成数据中心运行的“故障预防性管理”、“故障恢复性管理”及旨在降低运维难度与成本,提高工作效率的日常运维工作的信息化管理,使数据中心在高效运转的同时,尽可能不发生故障或少发生故障,发生故障后能尽快恢复,从而提高数据中心可用性,并降低运行成本。(3)总控中心系统总控中心(又称ECC)是数据中心运维人员对数据中心运行状况进行监控值守的场所。包含以下子系统:1)服务台子系统运维值守与管理人员能通过服务台的各种通信方式收集记录用户使用信息,借助知识库,回复或解决用户常见问题;分发、跟踪复杂、疑难问题;通过监控展示信息,分析、发现异常运行情况,启动、跟踪处理流

29、程,回访服务结果。呼叫子系统一种基于计算机电话集成技术、与企业连为一体的直接与客户交流的服务窗口子系统系统。电话呼入型呼叫子系统的特点是接听顾客来电,为顾客提供一系列的服务客服,处理来自客户的电话垂询,尤其具备同时处理大量来话的能力,还具备主叫号码显示,可将来电自动分配给具备相应技能的人员处理,并能记录和储存所有来话信息。呼叫是即时通信的重要方式,是服务台子系统的重要构件。2)展示子系统展示系统提供监控系统、总控中心系统、运行管理系统的统一门户。并提供了各种丰富的展示终端,如总控中心大屏幕系统、移动监控终端系统;丰富的信息展示技术,如3D虚拟现实,温度场等仿真组态技术等;丰富多样的报警信息输出

30、方式,如声光、短信、电话等。(4)基础服务系统基础服务管理系统为以上述功能构件提供一些公共的基础服务,如统一权限认证、系统日志、系统管理(配置、维护)、在线帮助等。监控管理系统需要处理实时数据,也要处理历史数据。通过历史数据形成各种运行报告、报表可以更好地为预防性运维管理提供决策依据。对于大型或联网管理的数据中心,监控管理系统的数据库引入数据仓库是必要的。3.2.2 系统物理架构物理架构规定了系统的物理元素、这些物理元素之间的关系、以及它们部署到硬件上的策略。物理架构可以反映出软件系统动态运行时的组织情况。随着分布式系统的流行,“物理层(Tier)”的概念大家早已耳熟能详。物理层和分布有关,通

31、过将一个整体的软件系统划分为不同的物理层,可以把它部署到分布在不同位置的多台计算机上,从而为远程访问和负载均衡等提供了手段。数据中心监控系统物理架构如下图图(1)智能接口和传感器大部分被监控设备都设置有智能接口,以和上层采集设备进行数据交换。常见的智能接口有RS232、RS422/485、OPC,也有基于以太网的SNMP智能接口。监控管理系统不仅需要对设备进行监控管理,同时需要对设备运行的基础物理环境进行监控管理,因此还需要补充一些传感器,才能对数据中心进行全方位监控,常见的传感器设备有:温湿度、烟感、红外、漏水和I/O干接点等。(2)采集设备采集设备主要完成从智能接口或者传感器到采集设备的信

32、号转换和数据交换协议的适配。采集设备从功能上分一般有两类,一类主要完成信号透传,RS232和RS422/RS485接口的串口数据流转换成基于TCP/IP的以太网网络数据流,常见的该类设备有动力环境监测仪、串口服务器;一类不仅完成信号透传,还可以进行协议适配,将种类繁多的各个设备厂商的协议转换成统一的标准协议,常见的该类设备有智能数据采集单元。(3)监控服务设备监控服务设备将采集设备采集到的数据进行汇聚、加工、运算、存储等处理。监控服务设备可以独立完成监控管理系统中的简单监控功能,常见的监控服务设备有嵌入式服务器、工控机服务器、智能数据处理单元等。(4)网络传输设备网络传输设备包含网络传输介质及

33、对应的连接管理设备。网络传输介质是网络中发送方与接收方之间的物理通路,它对网络的数据通信具有一定的影响。常用的传输介质有:双绞线、同轴电缆、光纤、无线传输媒介。连接设备按照OSI七层网络模型分,常见的有物理层的集线器,链路层的交换机、路由器等;还有一些特殊应用的如进行网络过滤的网络防火墙,进行集群系统负载均衡的负载均衡器等。(5)管理服务设备管理服务设备是整个监控管理系统的物理核心,核心监控系统和管理系统均运行其上。管理服务设备一般包含处理设备、存储设备等。(6)展示设备展示设备作为监控管理系统人机交互的界面,用来完成监控管理信息的输入输出。常见的展示设备有警灯警笛、电话、短信猫、音箱、总控中

34、心电子大屏、各种显示终端、打印机等。3.2.3 系统部署架构监控管理系统设计充分考虑了系统性能、可靠性、可扩展性和可伸缩性,在部署时需根据系统规模和最大在线用户数进行配置。一个通用的部署原则是将数据和应用分布在不同物理服务器;当管理设备增加时,可以将不同应用模块分布到不同物理服务器;当用户数增加时,增加服务器数量均衡负载;为保证高可用性,可以将一个应用模块部署到多个物理服务器生成多个应用实例;可实现灾备系统,生产系统和备份系统分别运行在不同空间和物理区域,避免自然灾害和战争等不可抗力对系统造成的毁灭性损失。典型的部署架构如图图(1)最小运行系统针对少量管理设备和用户数,并且无需联网的单一监控区

35、域,只需要配置一台应用服务器,在其上安装平台服务、应用、Web服务器和数据库。由于最小运行系统需要运行监控管理系统的所有组件,因此对应用服务器的性能有较高要求。(2)可伸缩的分布式系统针对庞大的管理设备和用户数,并且分散分布在全球各地的区域,需要进行集中监控管理,出于系统性能和安全考虑,通常需要采用可伸缩的分布式部署方式。可以将监控管理系统的各个组件分离在不同物理服务器上运行,也可以在不同的物理服务器上运行多份系统,进行负载均衡。(3)灾备系统为避免极端情况下(如地震和台风等自然灾害),不仅需要对监控管理系统单个节点进行备份,还要考虑在异地(指地理位置、供电系统、网络和人员完全分离)建立另外一

36、套相同配置结构的灾备系统,当灾难发生对在线系统造成致命性损害时,可以在短时间切入灾备系统,使得用户不会中断对系统的访问。3.3 系统功能数据中心监控系统的核心功能按照逻辑关系可划分成四大功能集:监控系统功能、运行管理功能、总控中心功能、系统服务功能(含数据库)。监控系统及其监控管理对象概览见图3.3,系统主要功能一览表见表3.3-1,系统的主要监控管理对象见表3.3-2、表3.3-3,随后将分别对这些功能和监控对象进行介绍。图3.3 基础设施监控管理系统及其对象概览表3.3-1系统主要功能一览表(功能树)总控中心管理功能系统功能监控功能监控对象显示多屏展示运维管理数据库数据采集功能供配电类2D

37、 3D展示资产管理日志管理数据传输功能环境空调类温度场展示容量管理账号权限管理数据处理功能安防类粗颗粒GIS能耗管理看门狗功能调节与控制功能消防WEB移动终端双机热备功能数据存储功能IT设施类报表报告功能数据管理联动控制其他相关类告知告警终端系统管理告警管理服务台呼叫子系统工作台表3.3-2供配电类主要监控管理对象一览表供配电类对象发电机组低压进线总柜ATS自动切换开关空调配电柜UPS输入配电柜UPS不间断电源蓄电池组UPS输出配电柜STS静态切换开关智能列头柜智能PDU防雷表3.3-3空调环境类主要监控管理对象一览表环境空调类对象冷冻水系统空调系统环境冷水机组冷冻水泵冷却塔冷却水泵板式换热器

38、蓄冷罐补水系统精密空调普通空调加湿器漏水检测新风机空气质量机房温湿度机房正压表3.3-4 数据中心常见监控子系统一览表常见监控子系统消消防系统安防类子系统其它监控子系统视频摄像系统门禁系统防盗系统电力监控蓄电池监控智能布线3.3.1 监控系统功能数据中心基础设施监控功能主要完成数据采集、分析处理、存储、展示,使用户能实时掌控数据中心的基础设施运行情况。监控系统主要功能包含:(1)数据采集功能监控系统通过对各种监控对象的协议进行解析,完成数据采集,然后将采集到的数据统一格式上传到数据处理层进行统一处理。数据中心环境错综复杂,电磁干扰在所难免,监控系统对于采集到的数据还会进行基本过滤,避免错误报警

39、。(2)数据传输功能监控系统可以将采集到的信息在网络中各个节点间流转,并支持多种传输策略和数据处理方式。监控数据流的传输可以兼容传统的轮询式采集传输方式,也支持更高效的主动上报传输方式。为保证信息系统安全性,对监控数据流,特别是对敏感数据,系统可以进行加密。(3)数据处理功能监控系统采集到信息后,还可以根据业务需要进行各种计算处理。从智能接口或者传感器采集到数据后,还需要进行数据处理,如通过区域内的多个温湿度传感器采集值,计算出区域实时平均温湿度,区域温湿度最大值,通过各个支路的能耗传感器数据,计算区域实时PUE等。监控管理系统可以自由定制数据计算规则、复杂事件处理规则,以满足各种处理要求。(

40、4)数据存储功能监控系统采集的数据需要进行存储,作为数据处理子系统和运行管理系统的信息输入源。数据处理子系统需要进行高速的实时运算,如针对实时事件进行在线的实时复杂事件分析过滤等,这要求存储系统具备很高的实时性。在监控系统中一般由实时数据库将这些实时数据存储到内存中,来保证实时性。运行管理系统需要对历史的采集数据进行统计分析,形成数据中心运营管理的相关报表,为数据中心的运营决策提供依据。在监控系统中一般由历史数据库将采集到的实时数据,按照时间序列,永久存储到磁盘介质中,供运行管理系统随时调用。(5)调节与控制功能监控系统可以远程对基础设施设备工作模式、状态进行远程控制,这种控制既可以是手动的也

41、可以是自动的。数据中心基础设施设备出于安全的考虑原则上只监不控,但对于非核心设备,为适应数据中心日常管理、节能、紧急事故预案的需要,可以根据采集到的设备状态按照预先定义的联动策略,进行联动控制。典型的联动控制例子有,用于数据中心节能的空调群控,非法闯入联动录像和报警,火灾联动录像和开门等。除了采用某种自动控制手段外,监控系统还可以通过远程终端,对监控设备进行远程浏览,手动控制。如远程电话或者短信开门,远程电话或者短信查询关键设备当前工作状态等。(6)系统告警功能监控系统根据采集到的信息,根据预先设置的告警规则,可以在条件达到之前、之后分别形成预警信息、告警信息,并通过交互层的各种告警终端如短信

42、、电话、邮件、声光等迅速告知用户。告警功能按照一条告警事件的生命周期可以分为以下几个功能:过滤、分析、预警、告警、恢复。为及时发现监控管理系统可能出现的宕机,还可以使用系统告警功能扩展出定时报平安功能,该功能通过定期给用户推送监控管理系统的健康状态和关键设备的状态信息,让用户能实时把握监控管理系统本身的运行情况和关键设备运行情况。(7)系统接口监控系统需提供向上集成接口,通过该接口与更高层级的系统进行数据交互(被集成)。为使各种异构系统能实现集成,系统一般提供了标准的接口协议,如OPC、SNMP、Webservice等。3.3.2 运行管理系统功能数据中心运行管理目标是用较少的运行成本实现数据

43、中心尽可能高的可用性。围绕这一目标,监控管理系统需要配置“运维管理”、“资产管理”、“容量管理”、“能耗管理”等基本管理功能模块构成“运行管理子系统”。运行管理子系统主要从监控子系统与总控中心子系统获得管理所需信息,实现管理功能与目标。(1)运维管理功能运维管理是对基础设施出现故障前后的运维工作的管理,是提高数据中心基础设施可用性的基本管理功能,主要包括定期维保与定时巡检管理、事件(故障)管理、服务台、知识管理、服务合同与供应商管理、SLM、值班管理、KPI等功能模块。通过有序的“事故预防”管理,实现防患于未然,可有效降低基础设施的故障率;通过流程化的事件管理,能使发生的故障在尽可能短的时间内

44、恢复等。(2)资产管理功能资产生命周期管理是数据中心IT管理者的日常的基础性管理工作之一。资产管理主要包括对IT资产的“入库/出库”、“入机房/出机房”、“领用/退回”、“维修”、“盘点”、“报废”等资产生命周期中关键节点上的规范化、流程化、信息化管理。采用电子标签技术,使每个物理独立的资产(设备、磁带等)都有唯一的电子标签,能实现资产定位并提高资产盘点的效率。(3)容量管理功能数据中心基础设施的容量主要是空间、电力、制冷容量(SPC)。通过采集机房空间、电力制冷数据与相关额定数据比较,数据中心管理人员能全面了解中心、大楼、楼层、物理机房、虚拟机房、列、机柜各层面的SPC容量;快捷知道如何部署

45、IT设备到合适位置而不影响系统安全余量(如冗余、热备份);清楚知道是否可利用现有的动力和冷却容量来部署高密度服务器,或是否需要分散部署刀片服务器;知道SPC容量预警信息,以便及时扩充容量;知道容量使用的历史信息,分析容量变化,作为容量计划的依据。(4)能耗管理功能通过能耗监控信息计算数据中心能源使用效率(PUE),准确了解机房能耗构成,能耗变化情况,实现数据中心能效指标的可视化监测;建立数据中心能效指标体系和对标库,构建数据中心各管理层面和主要耗能设备的能效指标分析、评价模型,提高对数据中心能效指标的汇总分析能力和能效统计模式的智能化水平;采用数据挖掘技术对数据中心能耗数据进行深入分析,获取数

46、据中心的耗能模式和耗能规律,并以此为依据为数据中心提出合理的节能建议。3.3.3 总控中心系统功能总控中心是运维管理驱动信息的重要入口,特别是为IT用户提供“一站式服务”的窗口。总控中心系统是总控中心必须配置的基础工具,包括服务台(含语音通信),大屏展示(监控管理信息可视化)、报表、告警告知等功能模块,与运维管理系统一起保证数据中心的可用性。(1)服务台功能总控中心值守人员通过服务台接收来自用户的系统异常信息,弥补监控系统覆盖不够所造成的异常运行信息遗漏的不足;通过监控信息的“可视化”展示系统获取异常信息,作为事件关联规则外的管理驱动信息。值守人员利用该功能进行部分“一线”服务(常见问题答复与

47、处理),服务请求登记、分发、服务过程与质量跟踪、回访等,保证运维工作按质量要求完成。(2)展示功能1)组态仿真显示监控系统采集处理需要的信息后,通过友好的人机仿真交互界面提供给用户进行浏览,以便实时掌握监控到的基础设施状态。监控系统提供界面组态功能,可以由用户自由地用各种图元,如曲线,流水线,柱状图,仪表,机柜等器件组合成仿真效果,并能在数据中心发生变更时进行相应的变更。通过仿真实际机房结构布局,让用户能更清晰、准确地定位故障点。2)大屏展示系统屏幕是监控管理系统人机交互的窗口,数据中心运行值守人员通过电子屏幕获取监控管理系统与监控管理对象的运行信息。对于大型、超大型数据中心,要监控的对象与内容较多,逻辑关系复杂,往往需要在多个屏幕上同时显示具有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com