机房类运维服务方案(可借鉴).pdf

上传人:深夜****等你... 文档编号:75950731 上传时间:2023-03-06 格式:PDF 页数:47 大小:2.28MB
返回 下载 相关 举报
机房类运维服务方案(可借鉴).pdf_第1页
第1页 / 共47页
机房类运维服务方案(可借鉴).pdf_第2页
第2页 / 共47页
点击查看更多>>
资源描述

《机房类运维服务方案(可借鉴).pdf》由会员分享,可在线阅读,更多相关《机房类运维服务方案(可借鉴).pdf(47页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、.1/47 十四、服务方案 一、机房与设备维护方案与计划 1、预防性检查 1.1 巡检时间 每个工作日上午 9 点 1.2、巡检地点 计算机机房、精密空调、UPS 1.3、巡检目的 进行机房检查,对机房设备与供电系统、UPS 系统、精密空调系统、录像系统等设备进行检查,与时发现设备隐患,排除故障.1.4、巡检要求 1.4.1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、精密空调异常、UPS 与配电系统异常等,应按照应急预案与操作流程进行处理.1电源、UPS:检查机房供电状况,UPS 工作情况、指示状态.检查 UPS 蓄电池使用状态,确保蓄电池无松动.并使用温度枪进行检测物理温

2、度.确保配电柜与 UPS、蓄电池无温度过高现象.2机房环境:检查机房卫生状况与物理环境.3机房温度:检查温湿度,将温湿度控制在一定 X 围内.温度:225,湿度 60%.4机房空调:空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等.5机房照明:机房照明系统是否正常,有无异常状况.6机房 PDU:PDU 市电或 UPS 是否正常,使用温度枪进行检测外部物理温度.7机房整体:检查机房其余设备运行状态,有无报警与指示灯异常状态.1.4.2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境动力、空调故障、关键的设备、网络、系统、服务如无法与时恢复时,应立即通知甲方相关领导,由相关领导协调资

3、源进行故障.2/47 处理.1.4.3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅.1.5、计算机机房现场管理要求 1.除工作人员外,其他工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备.2.机房的机柜、线缆、设备等的标签管理;3.机房环境清理.1.6 每日检查内容列表 项目 性能检查内容 脆弱性检查内容 空调系统 高压压力、低压压力风冷系统,冷冻水压力、温度,冷却水压力、温度水冷系统,风机运行情况,滤网、内机排水系统、灰尘情况等.机房热点情况、室内机漏水检查、室外风机运转情况、加湿罐阳极棒检查、过滤

4、网检查等.供配电系统 输入输出功率,输入输出电流、断路开关、接地电阻、零序电流、器件发热情况等.导线、器件发热情况,断路开关、防浪涌器件情况等.UPS 系统 负载功率情况、器件发热情况、电池情况外观、液位、接线柱等.器件、导线发热情况,电池放电时间等.安全系统 录像备份管理、出入机房登记、器件灵敏度、画面清晰度不同照度情况下、云台运行等.器件灵敏度、监控死角问题等.设备运行 机房环境 查看设备运行指示灯、机房照明运行情况、机房环境 设备运行是否有报警情况、照明是否正常、机房卫生是否整洁等.3/47 2、现场故障维修 每日巡检过程中,如有发现设备与环境系统有故障状态,需进行记录并恢复故障状态.如

5、不能立即恢复故障状态,则需进行应急预案处理.具体如下:2.1 环境故障:卫生、温湿度、照明.四级故障 2.2 交换机故障:交换机蜂鸣,交换机启动不正常,指示灯异常.三级故障 2.3 空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等.二级故障 2.4 UPS 故障:UPS 逆变故障、UPS 旁路、UPS 蓄电池温度、UPS 蓄电池外观鼓包现象、UPS 蜂鸣报警等一级故障 2.5 配电柜故障:配电柜内温度过高、配电柜打火现象等.一级故障 在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态.对于系统瘫痪,业务系统不能运转的故障级别,如果不能于

6、 30 分钟内解决故障,应立即提出应急方案,确保业务系统的运行.故障解决后 24 小时内,提交故障处理报告.说明故障种类、故障原因、故障解决中使用的方法与故障损失等情况.故障类型、级别与相应标准列表:故障级别 响应时间 故障解决时间 I 级:属于紧急问题;其具体现象为:机房出现电力事故等意外情况导致业务停止、UPS 系统崩溃导致业务停止、空调系统崩溃导致业务停止.立即响应,5 分钟内人员抵达现场,30 分钟内恢复业务使用,2 小时内提交故障处理方案.12 小时以内 II 级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作.立即响应,5 分钟内抵达现场

7、,1 小时内提交故障处理方案 24 小时以内 III 级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响.立即响应,5 分钟内抵达现场,2 小时内提交故障处理方案 48 小时以内.4/47 IV 级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询.立即响应,30 分钟内抵达现场,2 小时内提交故障处理方案 3 天内 3、后台故障维修 后台故障状态维修,需要在甲方允许的情况下,对设备进行维护与维修.3.1 质保期内的设备由我方查找故障原因并填写故障申请单,交由甲方进行协调处理,并协助甲方进行故障排除与维修.如需联系厂商,则由我方负责.3.2 三级与

8、四级故障状态,我方可自行进行维护和维修的设备,报由甲方同意后,我方自行进行设备维修,更换零配件部件等,并将维修记录保存文档交由甲方与我方双方管理.3.3 质保期外的设备出现故障,则由我方统一进行维修,费用由我方负责.并将维修记录报由甲方确认并存档.3.4 设备更换 对于无法修复的设备,在合同有效期内,经甲方审核,由乙方负责整体更换同型号或类似型号的产品,无法维修的设备交由甲方.更换单个备品备件费用大于等于 500 元时,报甲方审核同意,备品备件费用由甲方承担;更换单个备品备件小于 500 元时,备品备件费用由乙方承担,质保期内由供货商厂商进行更换的除外.4、资产管理 4.1 对硬件设备型号、数

9、量、版本等信息统计记录 4.2 对软件产品型号、版本和补丁等信息统计记录 4.3 对机房设施设备连接统计记录 4.4 对综合布线系统结构图的绘制 4.5 对机房更换设备连接统计记录 4.6 每月向甲方上报低值易耗品记录,包括仓库存储情况、耗材使用情况.4.7 机房更新与更换设备的统计.5/47 4.8 机房维护设备与备品备件的管理与记录 5、应急处理 随着网络信息化建设的不断深入,加强机房各类设备、系统以与信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务.为确保系统与机房安全与稳定,以保证正常运行为宗旨,按照预防为主,积极处置的原则,本着建立一个有效处置突发事件,建立统

10、一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案.本预案共分为应用系统故障应急流程和机房突发事件应急流程 系统故障应急流程 一、系统故障应急流程说明 1、故障发生 系统运维服务小组可从以下途径得知故障的发生:1.1、运维服务中心通过网管告警发现故障 1.2、维护站点通过维护巡检发现故障 1.3、用户发现故障,报给呼叫中心 1.4、驻场工程师发现故障 2、报障受理 监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况.3、信息研判 运维服务小组根据了解到的系统故障情况进

11、行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案.4、预案启动.6/47 如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理.5、资源确认 系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源主要是参与人员依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;相关厂家技术支持人员;我公司聘请的技术专家 6、预案执行 按照既定的预案进行突发故障抢修,如遇到问题与时向系统突发故障应急领导小组汇报.7、预案终止 预案的终止时间由故障现场技术人员根据现场

12、的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定.8、结果上报 预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案.然后集中上报至系统突发故障应急领导小组.二、系统故障应急处理流程图 机房突发事件应急流程 一、机房突发事件分类 1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏.2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏.7/47 3、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏.二、应急处理人员组织机构 三、应急机构人员岗位职责 1、

13、应急总指挥职责 1.1、保证在任何时间,与时协调应急行动所有涉与的岗位人员;1.2、提供必须的紧急响应设备;1.3、在紧急情况下全面负责紧急行动;1.4、在必要时向外界求救,例如:119、110、120 等.2、应急副总指挥职责 2.1、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;2.2、根据获得的应急信息下达命令.3、各相关设备负责人职责 3.1、负责尽快收集信息向应急总指挥汇报事故情况;3.2、负责现场临时设备抢救和对事态的控制;3.3、听从上级指挥人员的指挥.四、突发事件处理原则 1.预防为主.立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,

14、从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系.2.快速反应.突发事件发生时,按照快速反应机制,与时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响.8/47 3.分级负责.按照谁主管,谁负责的原则,建立和完善安全责任制与联动工作机制.根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责.4.以人为本.把保障人员以与公共利益的安全作为首要任务.5.常备不懈.加强技术储备,规 X 应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突

15、发公共事件应急处置的科学化、程序化与规 X 化.五、机房应急开关机具体措施 机房各设备关闭顺序如下:六、机房日常维护 1、建立健全机房管理制度 1.1 在正常工作日内,信息技术部人员负责对机房进行监控,主要职责是:巡视网络设备与系统的运行情况,发生异常情况与时处理,消除网络故障隐患.1.2 节假日期间技术人员轮流值班,负责处理有关异常情况.1.3 机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域.2、机房内严格采取防雷、防火、防尘、防静电等措施以与机房 24 小时监控等措施.3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况.4、对机房的主要网络设

16、备路由器、主干交换机等进行工作时间内全程监控,发现异常情况应与时进行处理,确保整个网络的正常运行.七、服务器与存储设备故障处理 1、排错流程 2、应急处置具体措施 2.1 机房漏水应急预案 .9/47 1 发生机房漏水时,第一目击者应立即通知运维服务小组,并与时报告监控系统突发故障应急领导小组.2若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,清除机房积水,并与时联系设备供应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温.3 若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,与时清除积水,维修墙体或门窗,消除渗漏水隐患.2.2 设备

17、发生被盗或人为损害事件应急预案 1发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场.2 系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录.3 事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报.4系统突发故障应急领导小组安排运维服务小组、事发单位与时恢复系统正常运行,并对事件进行调查.运维服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组.事态或后果严重的,应向相关领导汇报.2.3 机房长时间停

18、电应急预案 1 定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:2当机房发生市电供电突然停电或是电源异常时.首先应和后勤部门联系确认正常停电以与预计停电时间.检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应与时将空调等不在 UPS 电源供电 X 围内的设备与时断电,预防突然来电时瞬间电流过大导致设备损坏等现象.3当确定停电时间超出机房 UPS 承载 X 围后,首先确定停电的 X 围以与受影响的设备 X 围.并与时通知各部门做好停电应急准备.然后通知机房电源维护人和设备的负责人到达现场,做好各设.10/47 备的电源停电准备.在

19、UPS 供电电量仅剩 10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复.4 当确定停电原因是在本身供电系统 X 围内,立即汇报给负责领导,并与时联系相关维护人员达到现场检修.对于恢复时间无法预计的,要通知后勤部门做好柴油机发电与移动电源车供电准备 5 恢复供电后,严格按照操作程序逐步恢复机房设备和 UPS 的供电,以防瞬间电流过大造成设备损坏.2.4 通信网络故障应急预案 1发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应与时通知本单位信息系统管理员,经初步判断后与时上报运维服务小组和系统突发故障应急领导小组.2 运维服务小组接报告后,应与时查

20、清通信网络故障位置,隔离故障区域,并将事态与时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时与时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转.3 事态或后果严重的,应向应急指挥办公室和相关领导汇报.4 应急处置结束后,运维服务小组应将故障分析报告,在调查结束后一日内书面报告系统突发故障应急领导小组.2.5 不良信息和网络病毒事件应急预案 1 发现不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传播,并报告指挥调度中心运维服务小组和系统突发故障应急领导小组.2 运维服务小组应根据系统突发故障应急领导小组指

21、令,采取隔离网络等措施,与时杀毒或清除不良信息,并追查不良信息来源.3事态或后果严重的,应向监控中心办公室和相关领导汇报.4处置结束后,运维服务小组应将事发经过、造成影响、处置结果在调查工作结束后一日内书面报告系统突发故障应急领导小组.2.6 服务器软件系统故障应急预案 .11/47 1 发生服务器软件系统故障后,运维服务小组负责人应立即组织启动备份服务器系统,由备份服务器接管业务应用,并与时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据.2 运维服务小组应根据系统突发故障应急领导小组的指令,在确认安全的情况下,重新启

22、动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理.3事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报.4处置结束后,运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组.2.7 黑客攻击事件应急预案 1当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组.2 接报告后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器

23、或系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登陆#,阻断可疑用户进入网络的通道.3运维服务小组应与时清理系统,恢复数据、程序,恢复系统和网络正常;情况严重的,应向监控中心应急指挥办公室和相关领导汇报,并请求支援.4处置结束后,运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组.2.8 核心设备硬件故障应急预案 1 发生核心设备硬件故障后,运维服务小组应与时报告系统突发故障应急领导小组,并组织查找、确定故障设备与故障原因,进行先期处置.2若故障设备在短时间内无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作.

24、12/47 3运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查.4事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报.2.9 业务数据损坏应急预案 1 发生业务数据损坏 时,运维服务小组应与时报告系统突发故障应急领导小组,检查、备份业务系统当前数据.2 运维服务小组负责调用备份服务器备份数据,若备份数据损坏,则调用磁带机中历史备份数据,若磁带机数据仍不可用,则调用异地备份数据.3业务数据损坏事件超过 2 小时后,运维服务小组应与时报告系统突发故障应急领导小组,与时通知业务部门以手工方式开展业务.4 运维服务小组应待业务数

25、据系统恢复后,检查历史数据和当前数据的差别,由相关系统业务员补录数据;重新备份数据,并在工作结束后一日内报告系统突发故障应急领导小组.2.10 雷击事故应急预案 1 遇雷暴天气或接上级部门雷暴气象预警,运维服务小组应与时报告系统突发故障应急领导小组,经请示同意后关闭部分服务器,切断电源,暂停内部计算机部分网络工作.2 雷暴天气结束后,运维服务小组报经系统突发故障应急领导小组同意,与时开通服务器,恢复内部计算机网络工作,对设备和数据进行检查.3 因雷击造成损失的,运维服务小组应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告系统突发故障应急领导小组.必要时,应向监控中心应急指挥办公室

26、和相关领导汇报.2.11 空调设备故障应急预案 若机房专用空调损坏,应第一时间启用机房备用空调,并通知厂家上门进行维修,并与时报告信息部相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备.2.12 火灾事故应急预案.13/47 1 一旦机房发生火灾,应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般设备安全;2 人员疏散的程序是:机房工作人员立即按响火警警报,并通过 119 向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出;3人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,

27、从指定位置取出泡沫灭火器进行灭火.2.13 电源设备故障应急预案 机房目前使用 UPS 系统,在紧急情况发生时,应按如下步骤进行关机:1确认所有负载均已安全关机.2关闭 UPS 负载电源.3将 UPS 的系统启用开关切换到 off 的状态.4将电池连接断路器切换到 off 的位置.6、#管理要求 为科学、有效地管理机房,促进网络系统安全的应用、高效运行,特制定本规章制度,请遵照执行.一、机房管理 1、路由器、交换机和服务器以与通信设备是网络的关键设备,须放置计算机机房内,不得自行配置或更换,更不能挪作它用.2、计算机房要保持清洁、卫生,并由专人 724 负责管理和维护,无关人员未经管理人员批准

28、严禁进入机房.3、严禁易燃易爆和强磁物品与其它与机房工作无关的物品进入机房.4、建立机房登记制度,对本地局域网络、广域网的运行,建立档案.未发生故障或故障隐患时当班人员不可对中继、光纤、网线与各种设备进行任何调试,对所发生的故障、处理过程和结果等做好详细登记.14/47 5、做好操作系统的补丁修正工作.6、网管人员统一管理计算机与其相关设备,完整保存计算机与其相关设备的驱动程序、保修卡与重要随机文件.7、计算机与其相关设备的报废需经过管理部门或专职人员鉴定,确认不符合使用要求后方可申请报废.二、机房安全#制度 1.机房所有人员必须严格遵守公司各项安全#制度,高度重视信息系统的安全#工作,积极参

29、加各种形式的安全#工作的学习培训活动,接受安全检查.机房信息系统涉与全公司的管理、业务等企业核心信息,维护人员不得窥探、抄录、复制;不得转告与工作无关的人员;不得随意向外界透露.操作人员未经财务审批不得私自动用、开设、查看、变更营业软件.2.机房所有人员未经允许不得访问信息系统中用户信息、公文、报表、等属于授权访问数据信息或私人信息.3.机房所有人员未经授权,不得私自修改、查阅系统的有关信息.4.严格遵守#口令管理制度和安全操作条例,根据访问数据级别使用相应权限的口令进入系统;不得窃取、破译他人权限密码.5.机房所有人员未经允许不得擅自抄录、复制设备图纸、电路组织资料、内部文件、系统软件、技术

30、档案、用户资料,也不得擅自带离机房,使用后归还原处.6.各种涉与密级的图纸、资料、文件等应严格管理,认真履行使用登记手续.IP 地址与密码等涉密信息不得让无关人员轻易获取.7.机房内重要#文件、数据的销毁,应使用碎纸机进行销毁,不得任意丢弃.8.机房内部的废弃设备、测试数据由仓管部门统一保存和处理.9.机房所有人员严格遵守通信纪律,增强#意识和法制观念,不得随意监测用户通信.10.机房内部所有维护和管理人员,均应熟悉并严格执行安全#规定.15/47 7、人员管理要求 参照甲方的有关工作制度进行人员管理,如作息时间、着装、考勤等.人员派驻须经过甲方的审核,人员更换须在招标人进行备案.对维保人员的

31、管理员应按照甲方的要求和标准来进行执行.人员具体职责如下:一、硬件维护人员岗位职责:1与时高效地完成分配的硬件维修等各项任务,保证硬件的正常工作.2 维护人员要熟悉计算机原理和操作规程,熟悉仪器仪表使用方法.维护工作应遵循微机故障与维修的操作步骤、基本原则和维修方法进行.3经常检查供电系统是否正常,电器连接点是否牢固,用电器温度有无异常;检查机箱、显示器上的开关是否完好.对键盘、鼠标等易损件进行常规检查;对硬件系统进行外观和静态检查;对微机系统进行全面的动态检查,发现问题与时解决.4寒假、暑假或长期不用期间,要定时对其进行开机上电操作,以使机器内部保持干燥.5寒假、暑假或长期不用期间,要使用塑

32、料袋将主机、显示器与网线接头等严密包裹起来,避免受潮.6网络连接线路在使用过程中会出现各种故障,如某一工作站不能连接上网或一组工作站不能连接上网,这需要维护人员熟悉网络拓扑结构,通过检查网线、网络连接点、网卡、服务器以与集线器、交换器等网络设备,找出故障点给予排除.7当硬件发生故障时,与时排除故障,尽快恢复系统的运行.8定期进行硬件的例行维护,建立每台机器的维护档案.9每次维修必须进行登记,包括更换的设备和配件.10积极参加业务学习,不断提高业务水平.二、软件维护人员岗位职责:1与时高效完成软件维护等各项任务,保证计算机系统的正常运行.2日常维护保养时,开机关机一定要严格遵守操作规程,不可随意

33、进行,特别在微机运行过程中不能.16/47 随意冷启动机器.机器运行当中,软件维护人员应时刻观察有无异常情况,与时发现与时处理.3软件维护人员应备有各种工具软件、常用应用软件、操作系统软件和程序语言软件并留存实验中心一份.4软件维护人员平时要实时、定期对计算机病毒进行查杀.与时对杀毒软件进行升级,保证杀毒的有效性.要从预防病毒入手,对外来的软件或文件应事先查杀再使用.断绝病毒传播途径.5积极协调硬件维护人员排除硬件故障.6平时应根据实验内容和计算机技术发展水平与时调整和更新网络中的各种软件,以适应运用计算机进行教学的需要.7平时要做好系统保护与数据备份工作,系统出现问题后能够快速恢复.8认真参

34、与业务学习,不断提高自身的软件维护水平.9作好软件的安全#工作.8、定期检查方案与计划 8.1.定期维修 定期维修是按时间计算,应对机房和机房设备作定期检修.维修应包括以下内容:1 对机房内部和周围环境作一次彻底性的清理,把卫生搞好.2对机房内所有设备作一次清洗,除尘.3对空调设备、新风设备的过滤装置作一次清洗.4排除设备在使用时出现的故障和缺陷.5检查、测试机房电源系统工作的情况,并做好登记.6检查、测试机房空调设备工作的情况,并做好登记.7其它检查.8.2.换季维修.17/47 换季维修是在每年进入夏季之前和进入冬季之前为保障机房与 机房设备在盛夏和严冬能正常使用而进行的预防性检查.换季维

35、修 应包括以下内容:1 完成定期维修的内容.2对空调设备中的蒸发器、冷凝器进行一次大清洗、大检查.3检查并排除影响冷凝器散热效果的障碍.4检查空调设备加湿水的供应状况.5检查空调设备冷凝水的排泄管道是否畅通,有无异物堵塞.6检查加热装置的工作状况.7检查各种电缆、导线的固定,走向与通电后温升情况是否符 合要求.8检查各种安全设备、防火设备与报警设备的工作状况.9夏季到来之前,还应检查机房防水 浸入室内措 施落实的情况.10 其它检查.8.3.重大任务开始前检修 在重大任务开始前,为了保障机房与设备正常运行,为顺利完 成重大任务提供可靠的环境而进行的检修.主要应包括:1 完成季节性检查的维修内容

36、.2根据任务的要求,定向检查一些有关设备的情况.3为了保障重大任务约完成,临时增设一些设备的安装和调.18/47 试.4其它有关的检查维修.8.4.定期中修 计算机机房与其设备经过一段较长时间的连续使用,机件的磨损和自然老化,会使机房和设备存在一些问题,为了保障机房和设备进一步使用,必须认真地对机房和设备进行维修.设备连续使用 10000小时左右要进行中修,其主要内容有:1 机房的结构,外部环境的检修.机房建筑结构的变化.机房的严密性.从机房穿过的为楼内其它楼层使用的各种管线对机房的影响.机房与外部各种连接用管路的畅通、密封性检修.机房周围环境的变化情况对机房的影响.2机房内装修部分的检修.机

37、房吊顶部分要打开一些活动顶板.检查顶部各种电缆、信号线、管道的连接、固定.清除吊顶上的积尘.受损吊顶的更换、调整.对机房墙面装饰板进行全面的检查,清洁.机房内活动地板打开一部分进行检查.检查地板下电缆、导线、信号线各种设备使其附件的固定.清洁地板下部的积尘.对损坏、变色地板的更换和调整.检查机房内各种门、窗、隔断的固定,玻璃密封条的完整性.门和窗的关闭、开启的灵活性.关闭时的密闭性.对损坏灯具、门窗拉手、照明开关的修理、更换.19/47 3完成空调制冷系统中修的检查.检查压缩机、排除异常情况.清洗蒸发器、冷凝器、蒸发器,特别对室外机要重点清洗.对润滑系统清洗,更换润滑油.清洗、更换过滤网.检查

38、皮带松紧情况,调整到合适的程度.检查电器线路的完好和控制开关的灵活性,接触的可靠性.检查制冷剂是否泄漏,需要时予以补充.检查冷凝管道有无损伤、变形.检查上下水管道是否畅通,接口有无裂缝.测试各个部位的工作性能参数.对怀疑部位进行认真检查,消除疑点.4完成机房供配电系统的中修检查.检查市电的电压是否稳定.配电柜各接触点是否牢固,如有松动与时紧固.调整机房内三相电源使之均衡分配.检查电源线套管有无破损、各类开关、控制器是否灵敏,并加以解决.各类插座有无损坏并予以更换.整顿机房使用中用电的不规 X 行为.5完成 UPS 电源定期检测内容.检查并清理使用 UPS 的非计算机类设备.20/47 测量 U

39、PS 的输入输出电压是否正常并加以解决.对非免维护的 UPS 的电池进行一次放充电.清理蓄电池的灰尘并检查有无泄漏情况.6对机房接地系统进行一次全面的检查测试.计算机直流接地电阻小于一欧姆.计算机交流接地电阻小于四欧姆.计算机安全接地电阻小于四欧姆.若使用组合接地系统,则计算机组合接地电阻小于一欧姆.7对安全消防系统和自动报警系统的设备和线路进行一次全面 的检查、测试.设备的固定.线路和管路的固定和连接.探头技术性能要进行实测.消防系统有关附件的技术性能测试和联动试验.检查灭火气体设备间使之符合设计要求,钢瓶压力达到技术指标.非气体灭火的其它灭火设施,均应符合技术要求.更换手提灭火器材.8中修

40、后要对机房的状况和设备技术性能作一次全面的结论.在结论中应有以下内容:机房内环境的技术性能.机房外部影响的程度.机房设备主要技术性能参数与使用状况评估.21/47 需要更新的机房设备.对机房使用状况的评估.8.5.定期大修 机房与其设备连续使用 30000 小时左右时要对机房与其设备进 行大修.大修时除完成中修内容和排除机房内设备故障外还应增加 以下内容:1 机房的外部环境的影响 对影响机房的外部环境进行调查和测试,在调查的基础上制定 改造的方案.2机房本身建设结构的状况 对机房本身建筑的现状进行一次全面的检查评估,写出调查报 告,制定整修计划.3机房内部装修 要对机房内部装修情况进行一次全面

41、的整修.在整修前要对机 房各部位,各方面进行检查,制定整修计划.机房内吊顶、地板要 全部打开进行检查、清洁;对吊顶、地板的平整度进行调整;更换 裂缝、起鼓、脱皮、变色的微孔顶板和活动地板;补刷楼层顶板、地板的防尘漆;墙面饰板严重变形或损坏的要重新更换.4按大修内容完成空调制冷设备的检查,制冷系统大修就是要 对机房空调设备和新风设备进行全面的测试、调整.重点是:完成中修的内容.22/47 清洗压缩机外壳的油垢和灰尘.检查并校验温湿度探头和各类控制器的灵敏度、准确性,如 果有损坏或动作失调的应予更换.监测系统中的所有阀门并试压.检修保温管道与绝热材料,不合格的应重新作保温.清洗室外机、散热器,并清

42、理其周围的杂物,保证散热充分.清除辅助设备表面的特铁锈,吹出内部的油腻.做好大修后的试运行和测试工作.5完成供配电系统全面的大修检查.检查应符合国家和当地供电部门有关规定.检查后应有供电部 门的合格证方可重新使用.6对机房专用 UPS 电源进行全面的检查测试.在大修中要对机房专用 UPS 电源作以下性能检测:检查 UPS 电源内部的附件,各种电缆、信号线的固定.对 UPS 电源作一次全面的清洁.检查各接线端的可靠性,清洁各种开关、接触器的触点.检 查弹簧的强度和灵活性.检查各种集成电路板的固定和清洁应良好.检查蓄电池的性能 对蓄电池作放电试验.逐个测量每个蓄电池的终了电压.23/47 对蓄电池

43、作 24 个小时充电.不合格的蓄电池要摘除,摘除蓄电池的个数不能多于 UPS 电源对蓄电池组的最低限度.蓄电池组不能满足要求时要全部更新.对 UPS 电源性能作全面的评估.7对安全消防系统进行一次全面技术性能检查.报警系统的可靠性和准确性检验.灭火系统管路按规定作耐压试验.灭火剂瓶 做耐压试验.灭火药剂如果过期、压力不足应更换或补充.对照竣工图逐个检查烟感、温感探头的灵敏性.此项工作应由消防专业人员完成并由消防主管部门现场检查 指导.8对接地系统进行全面测试.如果是机房专用接地系统,在条件允许时,可抽查部分接地体 在地下的锈蚀状况,接地电阻若达不到要求时,可补做或增加 接地体.9机房大修后要进

44、行全面验收.机房大修应组织有机房专业装修资格的公司完成,大修完成后应按 机房标准和大修要求进行检查验收.二、机房维护服务方案.24/47 1、机房维护的必要性 机房内的设备对工作环境有着非同一般的要求.1.1、机房设备十分爱干净,对灰尘特别感冒.如果设备长期处于灰尘漫舞的环境中工作,很容易发生故障,因为灰尘会不知不觉地渗入设备的控制框中,并直接覆盖到它的电子线路中.时间一长,设备内部的工作电路就会散热不良,长此以往自然就容易出现故障.1.2、设备都害怕潮湿.设备内部有电子线路,如果电子线路中的各个元器件长期在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发火灾事故.1.3、

45、设备对环境温度十分敏感.高于 40的环境或低于 0的环境会降低设备的工作效率,使它的潜能得不到充分发挥,从而减少使用寿命.1.4、机房的硬件设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象.对于客户而言,往往因为专注于业务或者受成本所限,缺乏专业的机房维护人员以与充足的备件.如果说小故障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不与,或者无法找到症结所在,或者没有可更换的备件.此时,损失已经造成了.为了做好机房设备的维护工作,我公司维修中心配备相应

46、的人力、物力工具、通讯设备等,确保中心机房正常运作,通过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率.确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可与时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障.2、维护内容 2.1 机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备包含摄像头、硬盘录像机、监控主机;.25/47 2.2 机房空调与配电设备维护管理:精密空调机组、新风设备;UPS 与电池、主配电柜、UPS 配电柜;2.3 机房消防设

47、备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;2.4 机房供水水路、电路与照明线路的维护管理:水、电路管线与接口的检查维修.2.5 机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、吊顶、门窗与有关配套的维护管理 2.6 机房主机设备维护管理:计算机服务器包括 PC 服务器、存储服务器;网络设备路由与交换设备等;KVM 系统;2.7 机房运维管理体系建设:完善机房运维规 X,优化机房运维体系;3、维护具体需求 3.1 机房监控设备:1 每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,

48、之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行.同时检查监控机房通风、散热、净尘、供电等设施.室外温度应在20 60,相对湿度应在 10100;室内温度应控制在535,相对湿度应控制在 1080,留给机房监控设备一个良好的运行环境.2 根据监控系统各部份设备的使用说明,每月检测其各项技术参数与监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行.3对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应与时更换、维修,如视频头、采集模块等.4对易吸尘部份每

49、季度定期清理一次,如监视器、漏水检测主机、门禁主机等暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色与亮度.5 对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常.26/47 6 对监控系统与设备的运行情况进行监控,分析运行情况,与时发现并排除故障.如:网络设备、服务器系统、监控终端与各种终端外设.桌面系统的运行检查,网络与桌面系统的病毒防御.7每月定期对监控系统和设备进行优化:合理安排监控中心的监控网络需求,如带宽、IP 地址等限制.提供

50、每月一次的监控系统网络性能检测,包括网络的连通性、稳定性与带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量与入侵监控等.对异常情况,进行核查,并进行相关的处理.根据用户需要进行监控网络的规划、优化;协助处理服务器软硬件故障与进行相关硬件软件的拆装等.8提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表以电子文档的形式报送监控中心负责人.3.2、机房空调与配电设备 2.1 机房空调与新风维护 2.1.1 控制系统的维护 对空调系统的维护人员而言,在巡视时第一步就是看空调系统是否在正常运行,因此我们首先要做以下的一些工作.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com