粮库智能化升级改造项目运行维护系统建设方案.doc

上传人:阿宝 文档编号:95475870 上传时间:2023-08-23 格式:DOC 页数:22 大小:43KB
返回 下载 相关 举报
粮库智能化升级改造项目运行维护系统建设方案.doc_第1页
第1页 / 共22页
粮库智能化升级改造项目运行维护系统建设方案.doc_第2页
第2页 / 共22页
点击查看更多>>
资源描述

《粮库智能化升级改造项目运行维护系统建设方案.doc》由会员分享,可在线阅读,更多相关《粮库智能化升级改造项目运行维护系统建设方案.doc(22页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、粮库智能化升级改造项目运行维护系统建设方案在“运行维护”阶段中,已建成的系统一方面将不断发挥其效用,为粮食局、涉粮企业和市民公众提供服务;另一方面,它也会根据业务的变化而不断地得到完善、更新。而这一点也正是应用软件系统日常维护的重心。如果忽视了维护工作,将可能导致应用系统的缺陷无法得到及时修正、系统功能无法紧跟业务变化而得到及时更新等诸多问题的出现,最终将直接影响系统的效用。1.1.1 运维管理体系建设的目标提供对业务应用的全面监控,反映信息系统资源的健康状况和可用性,使所有应用运行处于良好的运行状态;及时掌握各种资源现状和运行信息,为信息分析、系统优化、决策提供支持,实现管理信息和经验的共享

2、;完善运维管控流程和制度,使得运维工作形成合力,提高整体运维水平,保障业务的稳定、高效、持续运行。1.1.2 建设的必要性通过建立科学合理的运维管理体系,可系统地将组织架构、管理流程、管控制度、绩效考核、运维成本核算以及技术平台贯穿融合,有效解决了目前大多数信息系统运维工作中所面临的沟通不畅、效率低下、服务质量无法保障、被动维护等问题,改变各自为政、分散运维的状况,增强为业务应用服务的意识,更好地实现建设服务型政府的目标。运维管理体系建立的意义在于:第一,提升信息化的效益。“三分建设,七分管理”,信息化80%的效益体现在运行维护阶段。IT运维管理体系的建设,将进一步规范运维管理工作,降低IT运

3、维成本,通过“用好信息系统”,更加有效地支持业务和提供公共服务,进一步推进业务工作公开、透明。第二,降低信息化的风险。通过开发与运维职责分离,对权限进行合理分配,避免“篡改数据、内外勾结”等风险发生,规避了系统性风险;通过规范化的操作,减少人为错误引发的风险;通过主动监控和趋势分析,预防事故的发生;通过对重大变更的审批和授权,减少了因变更不善导致的风险;通过制定应急预案,减少重大故障的影响。“IT运维”将不再是“黑箱”,将变得可管可控,降低了信息化带来的风险。第三,支持领导宏观决策。建设的IT运维管理系统,能够记录并分析运维过程中发生的各种故障及其解决方案,通过报表工具,展示全局视图,让领导了

4、解运维工作各方面情况,支持领导宏观决策。第四,提升信息化科学管理水平。面向业务,以业务需求和目标为出发点,制定IT运维管理的愿景、目标和策略,建立科学的IT运维管理机制和治理型组织结构,理顺组织机构和职责划分,规范IT运维管理过程中各个参与要素(人、流程、工具)的管理制度与工作流程,建立绩效考核评价体系,规范运维费用,实现精细化管理和提升信息化科学管理水平。第五,主动监控和预防故障发生。应用先进、实用、高效的IT运维管理工具,可以实时监控各系统的运行状态。当系统超过设定阀值自动报警时,通过系统间的关联分析,维护人员可以主动发现并解决故障;并通过趋势分析,寻找潜在故障,防患于未然,改变“被动维护

5、”的局面,更加有效地防范故障和提高工作效率,有效地支持业务工作的顺利开展。第六,提升专业维护队伍的专业化水平。实行建设与运维的专业分工,通过在中心层面的资源整合,不断积累知识库,加强业务部门间、维护人员间的沟通和协作,传承和共享成功经验,提升维护队伍的专业化水平,促进信息化工作向专业化方向发展。1.1.3 体系结构运行维护体系包括运行维护组织、运行维护内容、运行维护流程、运行维护技术支持平台、运行维护制度等几个方面的内容,它们既相互依存又相互制约,可以同步建设,也可以随着应用的开展而逐步完善。1.1.3.1 运行维护机构可靠的运维工作是系统实现建设目标、发挥效用的重要保障,为了避免“重建设、轻

6、应用”的弊端,加强运维体系的建设,成立由主要领导担任组长的信息化工作领导小组,下设领导小组办公室、日常工作办、网络安全组、计算存储组、应用管理组、终端维护组,具体如下文所述: (1)网络安全组网络安全组负责网络的维护工作,保障网络的畅通;负责信息化安全体系的管理维护、保障网络的安全。(2)计算存储组计算存储组负责服务器、存储等核心硬件设备的管理维护,保障设备正常运转,负责核心数据的存储、备份、管理。(3)应用管理组应用管理组负责应用系统、数据库、中间件的运行维护,保障系统的良好、稳定的运行。(4)终端维护组终端维护组负责对工作人员的IT技术支持,及时响应工作人员请求,保障每个终端用户正常使用网

7、络、PC、应用系统及视频会议系统。1.1.3.2 运行维护内容运行维护内容包括网络管理、系统(主机系统、数据库系统、中间件系统)和应用管理、安全管理、存储备份管理、故障管理、技术支持管理等。 (1)网络管理内容网络管理主要实现网络的配置管理、性能管理和可靠性管理。网络管理主要基于网络管理平台和设备管理软件实现。网络配置主要对网络拓扑结构和网络设备参数进行配置,网络性能管理主要通过对被管理设备的监控和轮询,获取有关网络运行的信息及统计数据,并在所收集的数据的基础上,提供网络的性能统计;网络可靠性管理主要对网络的运行状况进行监控和检查,及时察觉可能的故障,从而保证网络的正常运行。(2)系统和应用管

8、理内容系统管理主要实现对系统(主机系统、数据库系统、中间件系统)的配置管理、性能管理和可靠性管理。配置管理包括对系统资源的发现、提供、配置和控制;性能及可靠性管理主要对各系统的关键参数或重要资源进行监控和检查,了解系统运行情况,及时察觉系统可能的故障,从而保证系统的正常运行,提高系统可靠性。应用管理实现对各应用系统的性能管理、可靠性管理、版本管理和数据管理。性能管理包括对应用系统性能的监控和优化;可靠性管理包括及时监控应用系统运行情况,及时发现潜在的问题,保证正常运行;版本管理包括对应用系统的版本/补丁的管理、发布及升级,配合相关部门进行应用系统的相关测试、试运行和推广;数据管理包括按照有关规

9、定及工作流程对后台数据必要的修改。(3)安全管理内容安全管理对象包括网络安全、系统(主机系统、数据库系统、中间件系统)和应用安全、存储备份安全。管理内容可分为安全管理制度的制定和落实、安全设备的配置以及管理与监控、安全管理故障的处理等。(4)存储备份管理内容存储备份系统运行维护管理的主要内容是备份策略管理、备份软件管理、备份数据管理及存储硬件管理。备份策略的选择,要统筹考虑需备份的总数据量、线路带宽、数据吞吐量、时间窗口以及对恢复时间的要求等因素,根据不同业务对数据备份的时间窗口和灾难恢复的要求,选择不同的备份方式,亦可将几种备份方式组合应用,以得到最佳的备份效果。数据管理包括数据的备份、异地

10、转储、数据的归档和数据的识读等。存储硬件管理包括存储网络设备(如光纤交换机等)、存储设备及其相应的管理软件、备份设备及其备份软件的日常维护及故障处理、存储设备容量管理。(5)故障管理内容故障管理包括网络、系统和应用、安全、存储备份的故障发现、故障分类、故障转发、故障诊断、故障处理、故障及处理记录和统计等过程。(6)技术支持管理内容技术支持管理包括对运行维护技术支持平台中的技术支持手段和工具、技术支持人员等的管理。1.1.3.3 运行维护流程为保证运行维护体系的高效、协调运行,应依据管理环节、管理内容、管理要求制定统一的运行维护工作流程,实现运行维护工作的标准化、规范化。运行维护流程包含的环节有

11、:日常运行维护、用户的运维请求、故障处理、问题跟踪等。(1)日常运行维护运行维护人员根据岗位职责和运行管理制度,利用技术支持平台提供的技术手段和工具,进行网络、主机、数据库、中间件及各应用系统的日常维护、状态监控和安全管理,定期产生运行维护报告,若发现故障,及时将故障转入故障处理流程。(2)运维请求用户可以通过电话、电子邮件等多种方式将运维请求提交。技术人员负责解答相关的运维问题,不能解答的转入故障处理流程。(3)故障处理流程对电话讲解、邮件答复不能解决的问题会转入故障处理流程,由专业技术人员到现场进行故障处理。(4)问题跟踪该环节与故障处理流程环节同步,对故障处理环节中问题的处理过程进行记录

12、,技术人员记录故障情况以及对故障处理的详细内容,以供其他支持人员参考。1.1.3.4 运行维护制度为确保运行维护工作正常、有序、高质地进行,必须针对运行维护的管理流程和内容,制定相应的运行维护管理制度,实现各项工作的规范化管理。运行维护管理制度可分为:网络管理制度、系统和应用管理制度、安全管理制度、存储备份管理制度、故障管理制度、人员管理制度和质量考核制度等。(1)网络管理制度:包括网络的准入管理制度、网络的配置管理制度、网络的运行/监控管理制度等。(2)系统和应用管理制度包括对主机、数据库、中间件、应用系统的配置管理制度、运行/监控管理制度、数据管理制度等。(3)安全管理制度包括网络、主机、

13、数据库、中间件、应用软件、数据的安全管理制度及安全事故应急处理制度。(4)存储备份管理制度包括备份数据的管理制度和备份设备的管理制度。(5)故障管理制度包括对故障处理过程的管理制度、故障处理流程的变更管理制度、故障信息利用的管理制度及重大故障的应急管理制度等。(6)人员管理制度包括对运行维护人员的能级管理制度、奖惩制度、考核制度、外部人力资源使用的管理制度等。(7)质量考核制度制定相关制度,对以上各类制度的执行情况进行考核。1.1.3.5 数据运维内容系统要正常运转,必须对系统内的用户和数据库进行有效的管理,保持数据库的完整性、一致性和安全性,保证操作规则的修改与执行结果一致。系统数据运行维护

14、包括三方面的内容:(1)数据库管理包括数据质量检查、审计和报告数据库的使用和状态、查看、修改、删除、复制、分割和分发、数据库备份和恢复、存储管理、系统参数配置(如更新频度等)。(2)元数据库管理元数据提供了到信息系统资源的路标。对元数据库的管理,应当提供对元数据的单点控制,并确保元数据的变化反映它所描述的数据或操作规则的变化。包括管理和更新元数据、元数据库的备份和恢复等。(3)用户管理由于共享数据库中包括不同密级的信息和不同类型的操作,需要对用户进行分类,授予不同的访问权限。包括用户和分组管理、权限管理。用户需要与一期平台用户管理进行对接,由一期平台统一开发。1.1.4 运维管理设计为了确保系

15、统长期稳定运行,除了要求系统采用的软硬件产品稳定性外,对系统相关的运维管理制度和工作是必不可少的重要基础。1.1.4.1 监控管理本项目建设内容包括:(1)对通信线路、主机、网络设备和应用软件的运行状况、网络流量、用户行为等进行监测和报警,形成记录并妥善保存;(2)组织相关人员定期对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并采取必要的应对措施;(3)建立安全管理中心,对设备状态、恶意代码、补丁升级、安全审计等安全相关事项进行集中管理。1.1.4.2 网络安全管理本项目建设内容包括:(1))指定专人对网络进行管理,负责运行日志、网络监控记录的日常维护和报警信息分析和处理工作;(

16、2)建立网络安全管理制度,对网络安全配置、日志保存时间、安全策略、升级与打补丁、口令更新周期等方面作出规定;(3)根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的重要文件进行备份;(4)定期对网络系统进行漏洞扫描,对发现的网络系统安全漏洞进行及时的修补;(5)实现设备的最小服务配置,并对配置文件进行定期离线备份;(6)保证所有与外部系统的连接均得到授权和批准;(7)依据安全策略允许或者拒绝便携式和移动式设备的网络接入;(8)定期检查违反规定拨号上网或其他违反网络安全策略的行为。1.1.4.3 系统安全管理本项目建设内容包括:(1)根据业务需求和系统安全分析确定系统的访问控制策略

17、;(2)定期进行漏洞扫描,对发现的系统安全漏洞及时进行修补;(3)安装系统的最新补丁程序,在安装系统补丁前,首先在测试环境中测试通过,并对重要文件进行备份后,方可实施系统补丁程序的安装;(4)建立系统安全管理制度,对系统安全策略、安全配置、日志管理和日常操作流程等方面作出具体规定;(5)依据操作手册对系统进行维护,详细记录操作日志,包括重要的日常操作、运行维护记录、参数的设置和修改等内容,严禁进行未经授权的操作;(6)定期对运行日志和审计数据进行分析,以便及时发现异常行为。1.1.4.4 恶意代码防范管理本项目建设内容包括:(1)提高所有用户的防病毒意识,及时告知防病毒软件版本,在读取移动存储

18、设备上的数据以及网络上接收文件或邮件之前,先进行病毒检查,对外来计算机或存储设备接入网络系统之前也应进行病毒检查;(2)指定专人对网络和主机进行恶意代码检测并保存检测记录;(3)对防恶意代码软件的授权使用、恶意代码库升级、定期汇报等作出明确规定;(4)定期检查信息系统内各种产品的恶意代码库的升级情况并进行记录,对主机防病毒产品、防病毒网关和邮件防病毒网关上截获的危险病毒或恶意代码进行及时分析处理,并形成书面的报表和总结汇报。1.1.4.5 密码管理建立密码使用管理制度,使用符合国家密码管理规定的密码技术和产品。1.1.4.6 变更管理本项目建设内容包括:(1)确认系统中要发生的变更,并制定变更

19、方案;(2)建立变更管理制度,系统发生变更前,向主管领导申请,变更和变更方案经过评审、审批后方可实施变更,并在实施后将变更情况向相关人员通告;(3)建立变更控制的申报和审批文件化程序,对变更影响进行分析并文档化,记录变更实施过程,并妥善保存所有文档和记录;(4)建立中止变更并从失败变更中恢复的文件化程序,明确过程控制方法和人员职责,必要时对恢复过程进行演练。1.1.4.7 备份与恢复管理本项目建设内容包括:(1)识别需要定期备份的重要业务信息、系统数据及软件系统等;(2)建立备份与恢复管理相关的安全管理制度,对备份信息的备份方式、备份频度、存储介质和保存期等进行规范;(3)根据数据的重要性和数

20、据对系统运行的影响,制定数据的备份策略和恢复策略,备份策略须指明备份数据的放置场所、文件命名规则、介质替换频率和将数据离站运输的方法;(4)建立控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和记录应妥善保存;(5)定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢复程序规定的时间内完成备份的恢复。1.1.4.8 应急预案管理本项目建设内容包括:(1)在统一的应急预案框架下制定不同事件的应急预案,应急预案框架应包括启动应急预案的条件、应急处理流程、系统恢复流程、事后教育和培训等内容;(2)从人力、设备、技术和财务等方面确保应急预案的执行有足够的资源保障;(3)对系统相关的人员

21、进行应急预案培训,应急预案的培训应至少每年举办一次;(4)定期对应急预案进行演练,根据不同的应急恢复内容,确定演练的周期;(5)规定应急预案需要定期审查和根据实际情况更新的内容,并按照执行。1.1.5 应急保障方案应对应急处理情况,需要对故障的严重性划分应急处理的级别,按照不同的应急级别提出应急处理方案和措施。同时,根据不同的应急级别启动相应的应急处理流程。应急处理一般是在紧急情况下的一种服务手段,需要有合理可行的应急处理制度作保障,以制度化的形式指导、监督、管理应急处理机制的执行。1.1.5.1 组织机构与职责1、应急处理主要负责机构的主要职责是:l 承担本项目的应急工作;l 收集、分析工作

22、信息,及时上报重要信息;l 负责本项目网络与信息安全的监测预警和风险评估控制、隐患排查整改工作;l 负责本项目应急事件新闻报道相关工作;l 组织制订、修订与本机构职能相关的专项应急预案,指导其他单位制定、修订应急事件相关的应急预案;l 负责组织协调应急事件应急演练;l 负责本项目应对应急事件的宣传教育与培训。2、网络与信息安全专家顾问组的主要职责是:l 在应急事件预防与应急处置时,提供咨询与建议,必要时参与值班;l 在制定网络与信息安全应急有关规定、预案、制度和项目建设的过程中提供参考意见;l 及时反映网络与信息安全应急工作中存在的问题与不足,并提出改进建议;l 对应急事件发生和发展趋势、处置

23、措施、恢复方案等进行研究、评估,并提出相关建议;l 参与应急事件应急培训及相关教材编审等工作。l 后期处置恢复重建工作按照“谁主管谁负责,谁运行谁负责”的原则,由事发单位负责组织制定恢复、整改或重建方案,报相关主管部门审核实施。1.1.5.2 应急处理服务内容技术人员由于时间、精力和技术上的原因,对于系统的突发事件难以做到有效的处理,这样往往会对系统正常运转造成重大影响。在最短的时间内到达现场快速响应安全事件,解决安全问题,并根据出现的问题及时调整安全策略,在以后的维护中正确解决问题,应急响应的服务包括如下几个主要部分:1、帮助恢复系统正常工作;2、帮助检查入侵来源、时间、方法等;3、对网络进

24、行评估,找出其他网络安全风险;4、做出事故分析报告;5、跟踪系统运行情况。1.1.5.3 应急处理相应流程一、应急处理方式1、远程应急响应是指承建单位相关工程师在接到客户相关人员通过电话、Email、传真等方式的请求后,如果无法通过相同的方式为客户解决问题,经与客户相关人员确认后,客户方相关人员提供主机或设备的临时支持账号,由建设单位工程师远程登录主机进行检测和服务,问题解决后出具详细的应急响应服务报告。如远程系统无法登陆,或无法通过远程访问的方式替客户解决问题,客户确认后,转到本地紧急相应流程,同时此次远程响应无效,归于本地应急响应类型。2、本地应急响应是指承建单位委派相关工程在第一事件赶往

25、事发地点,在现场为客户查找事发原因并解决相应问题,并出具详细的应急响应服务报告。二、应急处理报告应急处理过程需要进行相关内容的报告,例如“故障发生之后”进行报告,描述引起故障的原因,以及采取措施。“引起故障的问题解决之后”进行报告,描述引起故障的问题的解决情况。1.1.5.4 应急处理制度应急处理制度是系统运维管理制度的一部分,针对突发事件的应急处理措施和机制是需要有一套合理可操作的应急处理制度作为指导。因此,为做好突发故障事件的各项准备工作,提高应急处理能力,结合本项目的实际情况,制定一套有针对性的应急处理制度。应急处理制度是一套指导性的工作框架,基于这个框架开展应急处理工作,以网络与安全事

26、件应急处理为例,说明应急处理制度的实际指导过程:一、应急事件分类应急事件分为有害程序事件、网络攻击事件、信息破坏事件、信息内容安全事件、设备设施故障和灾害性事件等。1、有害程序事件分为计算机病毒事件、蠕虫事件、特洛伊木马事件、僵尸网络事件、混合程序攻击事件、网页内嵌恶意代码事件和其他有害程序事件。2、网络攻击事件分为拒绝服务攻击事件、后门攻击事件、漏洞攻击事件、网络扫描窃听事件、网络钓鱼事件、干扰事件和其他网络攻击事件。3、信息破坏事件分为信息篡改事件、信息假冒事件、信息泄露事件、信息窃取事件、信息丢失事件和其他信息破坏事件。4、信息内容安全事件是指通过网络传播法律法规禁止信息,组织非法串联、

27、煽动集会游行或炒作敏感问题并危害国家安全、社会稳定和公众利益的事件。5、设备设施故障分为软硬件自身故障、外围保障设施故障、人为破坏事故和其他设备设施故障。6、灾害性事件是指由自然灾害等其他突发事件导致的网络与信息安全事件。二、应急事件分级网络与信息安全事件分为四级:特别重大(级)、重大(级)、较大(级)、一般(级)。1、符合下列情形之一的,为特别重大应急事件(级)l 信息系统中断运行2小时以上、影响特别大。l 信息系统中的数据丢失或被窃取、篡改、假冒,对用户业务造成灾难性破坏,对国家安全和社会稳定构成特别严重威胁,或导致具体经济损失。l 其他对国家安全、社会秩序、经济建设和公众利益构成特别严重

28、威胁、造成特别严重影响的网络与信息安全事件。2、符合下列情形之一且未达到特别重大应急事件(级)的,为重大应急事件(级)l 信息系统中断运行30分钟以上、影响很大。l 信息系统中的数据丢失或被窃取、篡改、假冒,对用户业务造成很大损害,对国家安全和社会稳定构成严重威胁,或导致很大经济损失。l 其他对国家安全、社会秩序、经济建设和公众利益构成严重威胁、造成严重影响的事件。3、符合下列情形之一且未达到重大应急事件(级)的,为较大应急事件(级):l 信息系统中断运行造成较严重影响的。l 信息系统中的数据丢失或被窃取、篡改、假冒,对用户业务产生较大损害破坏,对国家安全和社会稳定构成较严重威胁,或导致经济损

29、失。l 其他对国家安全、社会秩序、经济建设和公众利益构成较严重威胁、造成较严重影响的事件。4、除上述情形外,对国家安全、社会秩序、经济建设和公众利益构成一定威胁、造成一定影响的网络与信息安全事件,为一般应急事件(级)。三、应急处理机制网络安全的发展日新月异,谁也无法实现一劳永逸的安全服务,所以当紧急安全问题发生,一般技术人员又无法迅速解决的时候,及时发现问题、解决问题就必须依靠应急响应来实现。当客户的主机或网络正遭到攻击或发现入侵成功的痕迹,而又无法当时解决和追查来源时,承建单位要根据客户的要求,以最快的速度赶到现场,协助客户解决问题,查找后门,保存证据和追查来源。此项应急响应服务由承建单位的

30、技术支持与售后服务小组负责。可以与客户自己的网络安全中心以及反应体系配合协作,共同完成对客户网络安全事件的应急响应和处理。1.1.5.5 应急措施紧急情况的反应和处理是服务质量的重要方面。当严重的信息系统故障(如宕机)发生,或影响较大、故障较长时间不能得到有效处理时,就项目业主而言,该故障实际上就形成了紧急情况。1、紧急情况处理流程承建单位应有一套成熟高效的紧急情况管理体系,提供24小时开机的数据交换平台服务中心负责人的手机,任何时候客户都可以及时找到承建单位的服务工程师对紧急情况进行处理。2、重大情况的处理对于对客户业务造成较大影响,较为复杂的紧急情况,启动危急情况处理体系。由专职服务经理负责,成立危急情况处理小组,调集相关的资源。该小组需每天汇报处理进展,每小时更新紧急情况处理系统的相关记录。该小组具有高度权威,能快速调动相关资源,找到承建单位及厂商、合作伙伴中最具经验的专家,防止问题处理的任何环节出现延迟,以尽快解决问题。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 实施方案

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com