运维管理制度
系统运维管理制度( 试行 )
(2018年 8月版)
第一章总则
运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。
运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用
性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。
第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、
流程化、规范化,特制订本制度。
第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系
1
运维管理制度
统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持
续性的发展。
第三条运维管理制度的适用范围:运维全体人员。
第二章编制方法
第一条本实施细则包括运维服务全生命周期管理方法、管理标准 / 规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。
第二条本实施细则以 ITIL/ISO20000为基础,以信息化项目的运维为目标,以管
理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的
PDCA 循环为提升途径,体现了对运维服务全过程的体系化管理。
第三章运维部工作职责
第一条系统运维和技术支持
(1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换
策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。
(2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程
中出现问题的沟通和解决;
(3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术
参数,确保项目有效推进实施。
(4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监
督执行。
(5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。
(6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,
保障平台 24小时安全稳定运行。
(7)负责平台系统管理及设备保密口令的设置、更新、保存。
(8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软
件改版升级工作。
第二条 . 平台信息和技术安全
(1)执行国家有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理基础研发平台信息技术安全方面存在的问题,确保平台
安全、稳定、可靠运行。
(2)基础运营平台信息技术安全保密制度和工作流程的制定,落实信息技
术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到
人。
(3)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软
件,进行硬件和技术双保护,确保基础研发平台不受病毒和黑客攻击。
(4)负责基础运营平台信息技术安全应急处理预案制定和实施。
(5)建立多机备份基础平台信息服务系统机制,一旦主系统遇到故障或受到攻击导
致不能正常运行,可以在最短的时间内替换主系统提供服务。
(6)建立基础平台系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄
漏密码。
第四章运维服务管理体系
运维服务管理体系规定了运维工作涉及的各类实体,以及这些实体间的相互关系。相关的实体按照运维服务管理体系进行有机组织,并协调工作,按照服务
协议要求提供不同级别的IT运维服务。
第一条运维服务管理对象
运维服务管理对象包括基础设施、应用系统、用户、供应商、以及IT运维部门和人员,具体内容如下:
(1)基础设施包括网络、主机系统、存储 / 备份系统、终端系统、安全系统、以及机房动力环境等。
(2)应用系统包括 OA 办公信息系统、门户网站等应用系统等。
(3)用户包括使用如上应用系统的用户。
(4)供应商包括基础设施和应用系统的供应商以及 IT运维服务的供应商。
(5)运维部门和人员包括内部参与运维活动的相关部门和人员,以及提供运维服务
的企业和相关人员。
第二条运维系统功能框架
根据建设单位的系统结构和业务开展需要,运维项目组将项目的维护框架分
为9个具体组成部分,分别为:服务台、时间管理。工单管理、问题管理、变更
管理、配置管理、工程师考核、知识库管理、统计、系统管理等9个子项。而具
体运维流程将以此为依据开展工作。
运维管理制度
第二条运维管理组织结构
运维项目的运维管理结构位三层模式,具体如下图所示。由项目负责人与甲
方进行业务范围接洽,并将沟通结果向下传递。项目经理负责项目的整体运维工
作,包括各种制度的制定和实施。运维工程师则在项目经理的指导下开展维护工
作。
第三条项目负责人
职责:负责项目商务、整体协调事宜。
职位描述:
1、整体负责建设单位运维项目服务计划的制定,领导项目经理并安排项目
工作,指导项目经理完成具体维护工作,每周听取项目经理的工作汇报,负责考
运维管理制度
核项目经理工作完成情况。
2、协助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体
实施。
第四条项目经理
职责:规划、执行、完善信息化项目的运维工作,指导网络、数据库维护工
程师开展工作。
职位描述:
1、根据公司战略目标,指导下属工程师开展服务工作,确保运维工作能够
满足客业务的实际需要;
2、建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中出现的特殊问题;
3、规划并提升运维工程师专业服务能力,在整体上提高服务满意度;
4、制定和持续完善绩效考核体系;
5、制定整理运维项目的应急预案系统,并指导运维工程师实施;
6、提高自身专业技能,在业务方面给予网络管理员和数据库管理员指导。
第五条技术主管
职责:应用、数据库管理,数据库性能调优,实现应用负载均衡。
职位描述:
1.技术主管非项目常驻人员,根据项目需要进行专业方面指导;
2.负责数据库性能分析与调优,数据库运行状态监控,及时发现异常并快速处理。
3.熟练掌握数据库技术,能够实现部署及调优。
4.掌握中间件的工作原理,能够实现部署调优及故障解决。
5.熟练掌握 linux 操作系统,部署数据库。熟练掌数据库冗灾、数据保护、故障
恢复技术。
6.负责应用负载均衡的部署和调试。
7.负责指导数据库工程师管理员开展工作。
第六条服务台
职责:故障电话受理,文档管理。
职位描述
1.负责业务的救助电话的受理工作;
2.故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态;
3.进行维护故障统计、用户满意度统计、工作报表输出等工作;
4.协助项目经理,进行文档整理、归类、保存等工作。
第七条网络管理员
职责:维护建设单位网络系统正常,解决网络相关故障。
职位描述:
1、对现有服务器、局域网络及机房、配线间的日常管理维护;
2、对信息安全建设提出相关建议,确保网络的安全;
3、保证外网光纤线路正常,保证局域网运行正常;
4、对网络系统和网络设备的运行状态进行监控;
5、熟练掌握域策略设置、DHCP 、DNS、FTP服务器、 NTFS权限设置等;
6、编写网络部分的应用处理预案并实施。
7、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作
精神 .
第八条应用、数据库管理员
职责:维护建设单位业务系统运行正常,解决应用和数据库故障。
职位描述:
1、监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整;
2、规划不同数据的生命周期,制订备份、恢复、迁移和灾备策略,根据业
务的需要执行数据转换及迁移等操作;
3、保证应用和数据库系统的安全性、完整性和运行效率。
4、负责数据库平台的整体架构及解决方案的制定和实施;
5、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作
精神 .
第九条终端管理员
职责:维护建设单位桌面系统运行正常,解决终端、外设故障。
职位描述 :
1、各部门电脑、打印机、传真机的维护;
2、对各部门职员进行电脑相关的技术支持及培训工作;
3、精通中标 Linux 及金山 WPS办公软件的使用,能够熟练使用 MS Windows
XP ;MS Office 软件,能够制作相应教程对其他部门员工进行培训
第十条运维服务流程
IT运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程可能会逐步独立并规范。
第十一条项目运维服务工作流程图
第十二条服务台
服务台是支持运维服务的核心功能,与各个流程联系密切。所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员。
运维管理制度
在本系统中 ,服务台是接收各种来源服务请求和相关信息反馈的唯一入口和
出口,同时服务台还负责一般请求、通过知识库(历史事件)能够解决的请求;
他也是复杂问题二线处理的桥梁。
第十三条事件管理
事件管理流程的主要目标是尽快恢复服务提供并减少其对业务的不利影响,
尽可能保证最好的服务质量和可用性等级。事件管理流程通常涉及事件的侦测和
记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关
闭。
本系统把所有服务请求和报警归结为事件。事件管理是提供服务台和事件管
理者对于事件记录、处理、查询、审核、派发等功能。它也包括通过和第三方监
控系统对接,把其发送报警形成事件的功能。
第十四条工单管理
工单管理:工单是现场运维、二线支持的任务载体,运维工程依据所接收工
单进行运维工作。工单管理是对工单实现创建、变更、查询浏览、派发、监督等
功能的模块。
第十五条问题管理
问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,负责确保解
决方案的实施。问题管理还将维护有关问题、应急方案和解决方案的信息。
问题管理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本
运维管理制度
的不能彻底解决问题而考虑的模块。根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法。
第十六条变更管理
变更管理实现所有基础设施和应用系统的变更,变更管理应记录并对所有要
求的变更进行分类,应评估变更请求的风险、影响和业务收益。其主要目标是以
对服务最小的干扰实现有益的变更。
变更管理是要对重大资源的新增、变更、升级等运维活动进行审核的功能,以免这些活动对现有资源的可用性造成没有必要的影响和破坏;同时,他还要实
现在工单中产生的变化进行后审计的功能。
第十七条配置管理
配置管理流程负责核实基础设施和应用系统中实施的变更以及配置项之间
的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置
项的实际版本状态。
配置管理实际上是全部资源的统一管理的功能,包括资源整个生命周期的参
数或配置的变化记录的管理。管理信息主要涉及分类、型号、版本、位置,状态、
相关资料等基本信息还包括核心参数等
第十八条知识库管理
知识库管理:知识库是提供给运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册。在本系统中,知识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段。
第十九条统计及工作报告
运维管理系统提供一线解决率统计、客户满意度统计、按分类的事件汇总统计、工作报告生成的功能,按照一定格式根据事件数据、工单数据、问题数据、
配置数据、变更数据可以帮助运维管理者能把运维的所做的工作内容清晰的罗列
出来。
第四章运维服务内容
第一条服务目标
运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、
数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、
典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
第二条资产统计服务
服务内容包括:
硬件设备型号、数量、版本等信息统计记录
软件产品型号、版本和补丁等信息统计记录
网络结构、网络路由、网络IP 地址统计记录
综合布线系统结构图的绘制
其它附属设备的统计记录
第三条网络、安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的
运维管理。
设备基础性能检测: CPU、内存使用情况监测;
设备日志查看;
设备 SNMP 状态;
测试 Ping ,tracert 等工具的连通性;
网络安全策略应用是否正常;
Internet 带宽流量的实时监测;
网络拓扑链路状态监测;
异常网络数据包流量;
Dos 、 ddos 等网络攻击情况监测;
Internet 线路的误码率、丢包率监测;
第四条主机、存储系统运维服务
提供的主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
进行监控管理的内容包括:
CPU 性能管理;
内存使用情况管理;
硬盘利用情况管理;
系统进程管理;
主机性能管理;
实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主
机硬盘运行状态;
监控主机网卡、阵列卡等硬件状态;
监控主机 HA 运行状况;
主机系统文件系统管理;
监控存储交换机设备状态、端口状态、传输速度;
监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁
盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
对存储的性能(如高速缓存、光纤通道等)进行监控。
第五条数据库系统运维服务
提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
1、进行监控管理的内容包括:
数据库基本信息:文件系统、碎片、死锁、CPU 占用率较大或时间较长
的SQL 语句。
表空间使用信息监测;
数据库文件 I/0 读写情况;
Session 连接数量监控;
数据库监听运行状态监测;
查看每日数据备份、数据同步是否正常;
报警日志监测;
对表和索引进行 Analyze, 检查表空间碎片;
检测数据库后台进程;
数据库对象的空间扩展情况监测;
2、数据库维护是指当一个数据库被创建以后的工作都叫做数据库维护。包括备份系统数据、恢复数据库系统、产生用户信息表,并为信息表授权、监视系
统运行状况,及时处理系统错误、保证系统数据安全,周期更改用户口令。
(1)数据库维护流程图
运维管理制度
3、需求受理流程
(1)产品组提出业务需求。
(2)开发组对需求进行分析,并将需要更改的内容反馈给运维组。
运维管理制度
(3)运维组对需求进行分析,对需求分类,包括对数据库的变更,升级,
维护等方面的操作。
(4)DBA 将解决方案反馈给运维部门领导审批,并反馈风险评估结果。
(5)运维部门领导审批通过,提交方案到研发部分管领导审批,并反馈风险评价结果。
(6)研发部分管领导审批通过,DBA 实施变更方案。
(7)变更完成后,让开发组协助验证变更结果,同时测试组对测试功能验
证。
(8)开发组核对数据无误,测试组验证正常,DBA 对该需求归档。
第六条中间件运维服务
中间件管理是指对tomcat 、websphere 等中间件的日常维护管理和监控
工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。
中间件监控指标包括配置信息管理、故障监控、性能监控。
执行线程:监控中间件配置执行线程的空闲数量。
JVM 内存: JVM 内存曲线正常,能够及时的进行内存空间回收。 JDBC 连接池:
连接池的初始容量和最大容量应该设置为相等,并且至
少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消
耗。
检查中间件日志文件是否有异常报错
如果有中间件集群配置,需要检查集群的配置是否正常。
第七条终端、外设运维服务
负责对终端 PC 、笔记本以及工作站的操作系统、应用软件和硬件的维护,
解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设
运维管理制度
的故障处理工作。
第六章应急服务响应措施运维项目组制定了详尽的应急处理预案,整个流程严谨而有序。但在服务维护过程中,意外情况将难以完全避免。我们将对项目实施的突发风险进行详细分
析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。
第一条应急预案实施基本流程
发现故障
一般事件
初步判定
突发事件
已解决
扩大应急
启动应急预案,并通知领导
按事件流程处理
未解决
增援
汇报进度已解决
突发
联系技术支持处理
记录事件
未解决
应急
汇报进度联系开发人员或
组
厂家工程师现场处理
汇报
已解决
故障恢复
总结,修订应急预案
第二条突发事件应急策略
(1)值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、
运维管理制度
准确判定故障发生的数据域,负责跟踪该事件直至其结束。对于不在运维中心的
故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,
并做好登记工作上报领导。
(2)正常情况下,要求值班人员在10 分钟内进行事件确认。如果属于一
般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按
照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时
处理情况。
(3)在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部
门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理。
第七章服务管理制度规范
第一条服务时间
(1)在 5*8 小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记
录服务台事件处理结果。
(2)在非工作时间设置有专人 7*24 小时接听的移动电话热线,用于解决内部的技术问
题以及接听 7*24 小时机房监控人员的机房突发情况汇报。
(3)服务响应时间:
故障级别响应时间故障解决时间
10 分钟,30 分钟
I级:属于紧急问题;其具体现象为:
内提交故障处理 3 小时以内
系统崩溃导致业务停止、数据丢失。
方案
中医院 信息系统运行维护管理制度 第一条为规范全院信息系统的运行维护管理工作,确保信息系统的安全可靠运行,切实提高效率和服务质量,使信息系统更好地服务于运营和管理,特制定本管理办法。 第二条运行维护管理的基本任务: 1、进行信息系统的日常运行和维护管理,实时监控系统运行状态,保证系统各类运行指标符合相关规定; 2、迅速而准确地定位和排除各类故障,保证信息系统正常运行,确保所承载的各类应用和业务正常; 3、进行系统安全管理,保证信息系统的运行安全和信息的完整、准确; 4、在保证系统运行质量的情况下,提高维护效率,降低维护成本。 第三条网络中心负责全院范围内信息系统运行维护管理、监督检查和质量考核评定工作,掌握运行质量情况,制定质量指标,并对信息系统各级维护部门进行定期检查考核; 第四条负责全院范围内信息系统的计算机硬件平台、基础软件、应用软件、配套网络和的监控和日常维护工作,制定日常维护作业计划并认真执行,保证信息系统正常运行;对于系统的所有维护(包括日常作业计划、故障处理、系统改进、数据变更、数据的
备份与恢复、功能完善增加)都必须填写维护记录;负责所辖范围内信息系统数据的备份与恢复,负责落实系统安全运行措施;每年至少组织一次全行范围内的信息系统运维管理巡回检查,全面检查各维护作业计划管理、技术档案和资料管理、备份及日志管理、机房管理、安全保密管理等制度的落实情况。 第五条系统出现故障,信息系统维护部门或维护人员首先进行处理,同时判断系统类型和故障级别,根据系统类型和故障级别,故障处理应在要求的时限内完成,并同时向院部报告。对无法解决的故障,应立即向软硬件最终提供商、代理商或维保服务商(以下简称厂商)提出技术支持申请,督促厂商安排技术支持,必要时进行跟踪处理,与厂商一起到现场进行解决。 第六条厂商技术人员现场处理故障时,当地维护人员应全程陪同并积极协助,并在故障解决后进行书面确认。 第七条参与故障处理的各方必须如实、及时填写故障处理单,现场技术支持还须当地维护人员予以签字确认或维护部门盖章。 第八条建立重要紧急信息上报渠道,对于发生的重要紧急情况,应该立即逐级向院部主管领导报告,对业务影响较大的还应及时通知业务部门。 第九条信息系统维护管理部门负责技术档案和资料的管理,应建立健全必要的技术资料和原始记录等。 第十条软件资料管理应包含以下内容: 1、所有软件的介质、许可证、版本资料及补丁资料; 2、所有软件的安装手册、操作使用手册、应用开发手册等技
第一章运维管理服务保障制度 为完成运维任务必须建立相应的技术支持管理制度,使维护工作做到有章可循,有据可查。同时对制定的各个制度的执行情况进行质量考核,对运维团队的工作绩效进行评估,促进制度的更好落实,确保高质量地完成各项维护支持任务。 1.1 机房运维管理制度 1.1.1 数据中心环境安全管理 数据中心进出安全管理的重点在于对不同的访问区域制定不同的安全管控和出入原则。将数据中心划分3类不同类别的管控区域和安全区域。公共区域、办公区域、机房区域。 (1)公共区域:这些区域通常用于数据中心生活与展示的配套区域。该区域经授权并在遵守相关制度的前提下来访者可自由进出。 (2)办公区域:数据中心日常工作区域。这类区域的进入通常为数据中心内部员工及运维人员。需经授权访问。 (3)机房区域:机房区域是数据中心的核心区域。该区域应有严格的进出管控,外来人员进出需提前提出申请,来访者进出机房区域需经授权,进出需登记。 除了数据中心人员进出管理外,还应考虑设备和物品进出的流程。设备和物品的进出也应得到正式的审批,特别是对于机房区域的设备应重点管控。应通过机房人员/设备登记表详细记录。设备出门需开具出门凭据等。 1.1.2 机房安全管理制度 (1) 机房应防尘、防静电,保持清洁、整齐,设备无尘、排列正规、工具就位、资料齐全。 (2) 机房门内外、通道、设备前后和窗口附近,均不得堆放物品和杂物,做到无垃圾、无污水,以免妨碍通行和工作。
(3) 严格遵照《消防管理制度》规定,机房内严禁烟火,严禁存放和使用易燃易爆物品,严禁使用大功率电器、严禁从事危险性高的工作。如需施工,必须取得领导、消防、安保等相关部门的许可方可施工。 (4) 外来人员进入机房应严格遵照机房进出管理制度规定,填写人员进出机房登记表,在相关部门及领导核准后,在值班人员陪同下进出,机房进出应换穿拖鞋或鞋套。 (5) 进入机房人员服装必须整洁,保持机房设备和环境清洁。外来人员不得随意进行拍照,严禁将水及食物带入机房。 (6) 进入机房人员只能在授权区域与其工作内容相关的设备上工作,不得随意进入和触动未经授权以外的区域及设备。 (7) 任何设备出入机房,经办人必须填写设备出入机房登记表,经相关部门及领导批准后方可进入或搬出。 1.1.3 服务人员安全及保密管理制度 1、维护工程师必须熟悉并严格执行安全保密准则。 2、外部人员因公需进入机房,应经上级批准并指定专人带领方可入内。 3、有关通信设备、网络组织电路开放等资料不得任意抄录、复制,防止失密。需要监 听电路时,应按保密规则进行。 4、机房内消防器材应定期检查,每个维护人员应熟悉一般消防和安全操作方法。 5、机房内严禁吸烟和存放、使用易燃、易爆物品。 6、搞好安全保密教育,建立定期检查制度,加强节假日的安全保密工作。 7、未经有关领导批准,非机房管理人员严禁入机房。 8、机房内严禁烟火,不准存放易燃易爆物品。 9、注重电气安全,严禁违章使用电器设备,不准超负荷使用电器。 10、按规定配备消防器材,并定期更新。 11、定期检查接地设施、配电设备、避雷装置,防止雷击、触电事故发生。
XXXXXXXXXX 有限公司 信息化软件运维管理制度 文件编号: 编制部门: 版本版次: 生效日期:2018--1 页数:页 审核:XXX编制/修订:
文件使用单位:XXXXXXXXX有限公司各中心、各子公司签批形式:■ 0A工作流□纸质 三、编制/修订记录: 1. 目的 为规范XXXXXXXX有限公司(以下简称公司)信息化系统的运行维护管理工作,确保信息系统的安全可靠运行,切实提高业务效率和服务质量,使信息系统更好服务于业务运营和管理,特制订本管理办法。 2. 适用范围 本管理办法适用于公司及控股公司的信息系统,各控股公司可根据本办法制定相应的实施细则。 3. 术语与定义 3.1信息化软件的维护内容分为基础软件维护、应用软件、配套网络维护三部分:3.1.1基础软件指运行于计算机主机智商的操作系统、数据库软件、中间件等公共软件; 3.1.2应用软件指运用计算机系统之上,直接提供服务或业务的专用软件; 3.1.3配套网络指保证信息系统相互通信和正常运行的网络组织,包括联网 所需的交换机、路由器、防火墙等网络设备和局域网内连接网络设备的网线、传输。 3.2运行维护管理的基本任务: 3.2.1进行信息系统的日常运行和维护管理,实施监控系统运行状态,保证系统 各类运行指标符合相关规定; 3.2.2迅速而准确地定位和排除各种故障,保证信息系统正常运行,确保所承载的各类应用和业务正常。 3.2.3进行系统安全管理,保证信息系统的运行安全和信息的完整、准确; 3.2.4在保证系统运营质量的情况下,提高维护效率,降低维护成本。 4. 职责 4.1信息系统的运行维护管理遵循在统一的领导下,分级管理和维护的模式。作 为信息中心,牵头组织实施信息系统的维护管理工作。。 4.2 信息系统的维护管理分为两个层面:管理层面和操作层面。在管理层面,信息管理中心,负责公司信息系统的维护管理。在操作层面,各部门是操作软件的维护部
系统运维管理制度
运维管理制度 系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。
第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。
系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。
(2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。 (7)负责平台系统管理及设备保密口令的设置、更新、保存。 (8)负责系统信息协同管理及协同数据交换策略研究新程序、新系统和软件改版升级工作。 第二条.平台信息和技术安全 (1)执行国家有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理基础研发平台信息技术安全方面存在的问题,确保平台安全、稳定、可靠运行。 (2)基础运营平台信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。 (3)在服务器和计算机之间设置硬件防火墙,在服务器及工作站上均安装防病毒软件,进行硬件和技术双保护,确保基础研发平台不受病毒和黑客攻击。 (4)负责基础运营平台信息技术安全应急处理预案制定和实施。 (5)建立多机备份基础平台信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统提供服务。 (6)建立基础平台系统集中式权限管理,按照岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的访问权限,并设置密码。不同的操作人员设定不同的用户名,且定期更换,严禁操作人员泄漏密码。
企业网络安全管理制度文件编号:企业网络安全管理制度 版本历史 编制人: 审批人:
为加强公司网络系统的安全管理,防止因偶发性事件、网络病毒等造成系统故障,妨碍正常的工作秩序,特制定本管理办法。 一、网络系统的安全运行,是公司网络安全的一个重要内容,有司专人负责网络系统的安全运行工作。 二、网络系统的安全运行包括四个方面: 网络系统数据资源的安全保护、网络硬件设备及机房的安全运行、网络病毒的防治管理、上网信息的安全。 (一)数据资源的安全保护 1、办公室要做到数据必须每周一备份。 2、财务部要做到数据必须每日一备份。 3、一般用机部门要做到数据必须每周一备份。 4、系统软件和各种应用软件要采用光盘及时备份。 5、数据备份时必须登记以备检查,数据备份必须正确、可靠。 6、严格网络用户权限及用户名口令管理。 (二)硬件设备及机房的安全运行 1、硬件设备的供电电源必须保证电压及频率质量,一般应同时配有不间断供电电源,避免因市电不稳定造成硬件设备损坏。 2、安装有保护接地线,必须保证接地电阻符合技术要求(接地电阻≤2Ω,零地电压≤2V),避免因接地安装不良损坏设备。 3、设备的检修或维护、操作必须严格按要求办理,杜绝因人为因素破坏硬件设备。
4、网络机房必须有防盗及防火措施。 5、保证网络运行环境的清洁,避免因集灰影响设备正常运行。 (三)网络病毒的防治 1、各服务器必须安装防病毒软件,上网电脑必须保证每台电脑要安装防病毒软件。 2、定期对网络系统进行病毒检查及清理。 3、所有U盘须检查确认无病毒后,方能上机使用。 4、严格控制外来U盘的使用,各部门使用外来U盘须经检验认可,私自使用造成病毒侵害要追究当事人责任。 5、加强上网人员的职业道德教育,严禁在网上玩游戏,看于工作无关的网站,下载歌曲图片游戏等软件,一经发现将严肃处理。 (四)上网信息及安全 1、网络管理员必须定期对网信息检查,发现有关泄漏企业机密及不健康信息要及时删除,并记录,随时上报主管领导。 2、要严格执行国家相关法律法规,防止发生窃密、泄密事件。外来人员未经单位主管领导批准同意,任何人不得私自让外来人员使用我公司的网络系统作任何用途。 3、要加强对各网络安全的管理、检查、监督,一旦发现问题及时上报公司负责人。公司计算机安全负责人分析并指导有关部门作好善后处理,对造成事故的责任人要依据情节给予必要的经济及行政处理。 三、未经公司负责人批准,联结在公司网络上的所有用户,严禁在同过 其它入口上因太网或公司外单位网络.
信息化系统安全运行管理制度 第一章:总则 第一条为确保公司信息化系统的正常运行,有效地保护信息资源,最大程度地防范风险,保障公司经营管理信息安全。根据《国家计算机信息系统安全保护条例》等有关法律、法规,结合公司实际,制订本规定。 第二条本规定所称公司信息化系统,是指公司所使用的“集团管理软件”所覆盖的使用单位、使用人、以及计算机及其网络设备所构成的网络系统。具体有财务管理系统、物资供应管理系统、销售管理系统、地磅系统、资产管理系统、人力资源管理系统、OA办公自动化系统。第三条本规定适用于公司及所属单位所有使用信息系统的操作员和系统管理员。 第二章职责描述 第四条公司企管信息部 1、根据国家和行业的发展制定公司信息化工作的发展规划、年度计划和有关规章制度; 2、负责组织实施公司信息化建设; 3、负责公司信息系统的维护及软件管理; 4、负责对各单位信息系统工作的检查、指导和监督。 第五条公司信息化系统负责人 1、协调公司各种资源,及时处理对系统运行过程中的出现的各种异常
情况及突发事件; 2、负责督促检查本制度的执行; 第六条公司系统管理员 1、负责应用系统及相关数据的正常使用和安全保障; 2、负责解答各所属单位人员的问题咨询,处理日常问题; 第七条各单位系统管理员 1、熟悉掌握系统,能够处理系统应用中的问题; 2、要及时建立问题处理情况汇总表,并定期上报给公司系统管理员,由公司系统管理员汇编成册,定期下发给所有操作人员,以做到最大程度的知识共享; 3、负责本单位新进员工的信息系统技能培训;监督本单位操作人员进行规范操作; 第八条操作员 1、严格按照业务流程和系统运行规定进行操作、不越权操作、不做违规业务; 2、保证自己的密码不泄密,定期更换密码; 第三章内部支持体系管理 第九条为了确保操作人员能够熟练掌握信息系统的运行,问题的提交与处理必须按照逐级处理方式,具体如下: 1、各单位操作人员发现问题填写“日常操作问题记录单”先提交给各自所属单位的系统管理员归集与处理; 2、在各单位系统管理员不能处理的情况下再提交到公司系统管理员处理;
系统运维管理制度汇编1 运维管理制度 系统运维管理制度(试行) (2018年8月版) 第一章总则 运维以技术为基础,通过技术保障产品提供更高质量的服务。在软件产品的整个生命周期中运维组都需要适时参与并发挥不同得作用,因此运维组工作内容和方向非常多。 运维目标是在服务出现异常时尽可能快速恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因;推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障是可以高效止损。 第一条为保障信息系统软硬件设备的良好运行,使运维技术人员工作制度化、流程化、规范化,特制订本制度。 第二条运维管理工作总体目标:立足根本促发展,开拓运维新局面。在办公系统运行推广时期,通过网络、桌面、系统等的运维,促进信息系统能够稳定可持续性的发展。 第三条运维管理制度的适用范围:运维全体人员。 第二章编制方法 第一条本实施细则包括运维服务全生命周期管理方法、管理
标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 第二条本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 第三章运维部工作职责 第一条系统运维和技术支持 (1)根据公司业务的推进和发展目标,负责平台信息系统管理及数据交换策略的整体架构、对应用系统等技术开发方案的基础支撑,保障基础平台的稳定性和先进性。 (2)负责系统基础平台的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决; (3)会同项目实施,确认系统信息基础设备和软件数量、品牌规格、技术参数,确保项目有效推进实施。 (4)系统信息基础设备和软件操作规程、应用管理制度的制定,并负责监督执行。 (5)系统信息基础设备的软件安装、调试和验收,使用培训和维修保养。 (6)系统信息基础平台日常运行过程中信息安全和技术问题的协调解决,保障平台24小时安全稳定运行。
信息系统运维管理办法标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]
**信息系统运维管理办法 第一章总则 第一条为加强我行计算机系统的运行维护工作,保障系统安全稳定运行,进一步提高系统的维护质量和效率,制定本管理办法。 第二条本办法所称信息系统,是指我行日常经营和业务办理所使用的计算机软件、硬件及基础IT设施,包括各类业务软件系统、机房设施、网络设施、服务器设施、电脑终端设备等。 第三条本办法中出现的词条解释如下: (一)运行维护手册:针对运行维护人员编写的有关系统日常维护、监控、备份、一般性故障处理、软件安装、操作、配置方法及其他相关信息的文档。 (二)运行维护:由运行维护人员按照运行维护手册的要求,进行日常的运行监控、备份、安全管理、一般故障处理,受理用户维护申请,解答用户疑问的工作。 第四条信息系统运行维护工作的基本任务是:做好系统或设备上线投产、升级、日常监控、备份、安全管理,预防、处理各类系统故障,提高我行计算机系统的整体运行水平,保障我行业务连续性计划的顺利进行。 第二章岗位职责 第五条运营管理部系统运维岗位人员负责我行信息系统的运行维护工作。系统运维岗按运行维护手册的要求进行一级维护,如无法按时解决问题,需第一时间请求主发起行协助,并在主发起行运行维护人员进行技术指导下完成相关维护工作。
第六条系统运维岗应积极接受相关设备厂商或项目组组织的运行维护培训。培训内容应包括系统的体系架构、软硬件安装、配置、日常维护方法、备份和恢复策略、一般性故障的处理方法等。 第七条运营管理部运行维护人员的主要职责包括: (一)做好系统上线投产的环境准备工作,包括网络、不间断电源等。各项技术指标应满足系统软硬件的要求。 (二)在项目组的协助下,完成硬件和操作系统的安装和配置工作。 (三)利用培训和系统上线机会,掌握系统维护技术。 (四)制定系统日志、负载监控、系统备份和恢复策略。 第三章日常管理 第八条系统运维人员应按既定的策略和《运行维护手册》的要求,承担系统的日常运行维护工作。包括运行环境监控、软硬件运行状况监控、系统备份管理、安全管理、一般性故障处理、用户申请受理等。 第九条系统运维人员应做好硬件及网络的定期检测,发现问题及时处理或第一时间报告项目组和运行中心负责人。 第十条系统运维人员需详细记录日常运行维护情况,并定期向项目组提供运行情况汇总和统计数据。 第十一条系统运维人员需根据系统运行情况,及时提出软硬件升级或修改建议。
信息系统运行维护管理制度
第一章总则 第一条.为规范信息系统的运行维护管理工作,确保信息系统的 安全可靠运行,切实提高生产效率和服务质量,使信息系统更好地服务于 生产运营和管理,特制订本管理办法。 第二条.本管理办法适用于及其分支机构的信息系统,各分支机 构和各部室可根据本办法制定相应的实施细则。 第三条.信息系统的维护内容在生产操作层面又分为机房环境维 护、计算机硬件平台维护、配套网络维护、基础软件维护、应用软件维护 五部分: 1、计算机硬件平台指计算机主机硬件及存储设备; 2、配套网络指保证信息系统相互通信和正常运行的网络组织,包括联网所需的交换机、路由器、防火墙等网络设备和局域 网内连接网络设备的网线、传输、光纤线路等。 3、基础软件指运行于计算机主机之上的操作系统、数据库软件、中间件等公共软件; 4、应用软件指运行于计算机系统之上,直接提供服务或业务的专用软件; 5、机房环境指保证计算机系统正常稳定运行的基础设施,包含机房建筑、电力供应、空气调节、灰尘过滤、静电防护、消 防设施、网络布线、维护工具等子系统。 第四条.运行维护管理的基本任务: 1、进行信息系统的日常运行和维护管理,实时监控系统运行状态,保证系统各类运行指标符合相关规定;
2、迅速而准确地定位和排除各类故障,保证信息系统正常运行,确保所承载的各类应用和业务正常; 3、进行系统安全管理,保证信息系统的运行安全和信息的完整、准确; 4、在保证系统运行质量的情况下,提高维护效率,降低维护成本。 第五条.本办法的解释和修改权属于。
第二章运行维护组织架构 第一节运行维护组织 第六条.信息系统的运行维护管理遵循在统一的领导下,分级管理和维护的模式。作为信息系统维护管理部门,牵头组织分支机构实施信息系统的维护管理工作。原则上信息系统的维护工作应逐步集中。 第七条.信息系统的维护管理分两个层面:管理层面和生产操作层面。 1、在管理层面,为信息系统维护管理部门,负责全行范围内信息系统的维护管理和考核。 2、在生产操作层面,信息系统维护部门是运行中心和分支机构设置的实体或虚拟的维护部门(或维护人员)。信息系统维护部门直接对信息系统维护管理部门负责,并接受信息系统维护管理部门的业务指导和归口管理。 第八条.分支机构信息系统维护部门(或维护人员)可根据维护工作需要,向申请抽调技术人员和业务人员临时组成虚拟团队,参加分支机构设备巡检,制定技术规范、作业计划、应急预案,编制技术方案、培训教材等,各单位应积极配合。 第二节职责分工 第九条.信息系统维护管理部门职责 1.贯彻国家、行业及监管部门关于银行信息系统技术、设备及质量管理等方面 的方针、政策和规定,组织制定信息系统的维护规程、维护管理办法和维护责任制度;
某公司系统运维管理制度 第一章总则 第一条本制度的制定,为保证系统安全稳定运行,明确岗位责任,规范系统操作,提高系统可靠性和维护管理水平。 第二条本制度针对本公司系统运维人员设立、设备资源、系统用户、运行操作和系统日常维护的管理。 第二章运维管理范围 第三条系统运维的主要范围包括机房环境、设备资源、系统用户、运行操作和系统日常维护等的管理。 第三章运维管理职能 第四条系统运维人员具体承担“XX信息系统”的维护和管理工作。 第五条系统管理员负责系统服务器等硬件设备的巡检和维护,负责操作系统的巡查和维护,负责系统硬件和系统故障的及时处理,负责系统级配置用户和密码的管理,负责系统配置的优化,为系统的正常运行提供可靠的平台。 第六条系统应用管理员负责系统数据库和应用的维护工作,主要包括:数据库中用户及其权限的管理、数据备份和恢复的巡查工作、应用层软件的维护和管理、系统运行
状态的分析、应用层系统问题的应急响应。 第四章密码管理 第七条认真执行密码管理制度,强制保障密码强度,并定期更换。 第八条密码设置规则:密码位数不少于8位,密码结构由字母、数字混用组成。 第九条服务器系统密码由系统管理员管理、应用系统和数据库密码由应用管理员负责。 第十条所有密码需要在资料管理员处备份,并保障三个月更换一次。 第十一条负责密码管理的人员因故外出时,密码交由领导或由领导委任相关人员进行管理,密码管理回岗时应 及时将密码收回,并进行更换。 第五章系统定期巡检 第十二条系统管理人员负责相关设备的定期巡检工作,内容包括:操作系统和防病毒软件的升级,开放端口的控制,防病毒软件的记录、系统日志、操作记录等相关文档的审查。 第十三条应用系统管理人员负责应用系统和数据库的定期巡检工作,内容包括:每日检查数据库及其应用的可用性;每日检查自动备份是否成功及备份日志,发现问题及时手动备份;每周检查日志
系统运维管理制度 第一章总则 第一条为加强“XXX系统”的运维管理,有效保障该系统的安全稳定运行,特制定本制度。 第二条运维管理人员为XX工作人员,为“XXX系统”的用户提供技术服务。 第三条在项目终验完成后,提供X年的技术服务。 第二章运维管理职能 第四条运维管理人员具体承担“XX系统”的维护和管理工作。 第五条运维管理人员的主要职能有: (一)定期跟踪分析系统运行状态,排除潜在的故障隐 患,提出系统改进意见。 (二)负责服务器数据库的备份管理。 (三)积极响应“XXX系统”用户发现的问题并解答。 第三章运维管理制度要求 第六条服务解答方式主要有: (一)电话咨询:提供技术支持电话,解答在系统使用 中遇到的问题,及时提出解决问题的建议和操作方 法。 (二)邮件咨询:通过Email将问题的解决方法及相关
文档等发送到用户的邮箱里。 (三)现场服务:对于提出的软件技术或使用问题,一 般问题保证在当日内予以解决。 第七条服务响应: (一)自收到服务请求,2小时内给予答复。 (二)电话咨询服务不能解决问题,即刻指派运维管理 人员赶赴现场进行故障处理。 (三)遇到重大技术问题,及时组织有关技术专家进行 会诊,并在4小时内采取相应措施以确保系统的正 常运行。 (四)如果在接到通知后的两个工作日未做出响应,必 须对由于故障所造成的损失负责。 第八条运维管理系统的定期巡检 (一)运维管理人员负责系统的定期巡检。 (二)定期巡检内容包括:检查并确认数据库及应用是 否可用;检查日志文件中最近日期的警告日志,发 现问题及时解决; 第九条运维管理系统的数据备份 (一)运维管理人员负责系统的数据备份。 (二)数据备份内容包括:定期检查并确认数据备份存 放路径,检查备份文件是否可用。 (三)必要时进行数据还原操作。
云计算中心运维管理制度 现代信息中心已成为人们日常生活中不可缺少的部分,因此信息中心机房设备的运行正常与否就非常关键。在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。加强对云计算运维管理的要点以及相应改进方面措施的研究与探讨,以此不断提高IT运维质量,实现高效的运维管理。这就给运维是否到位提出了严格要求。 1 运维在机房中的地位 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理是,为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统地计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维管理主要肩负合规性、可用性、经济性、服务性等四大目标。 在信息中心机房配备有运维人员,但大都是“全才”的,即什么都管,尤其是对供电系统大都是由主机运维的人员代管。当电源系统出故障时,此代管人员一问三不知,甚至连配电柜门都没开过。这实际上就是把机房的运维放在了一个次要的地位。 当然也有的地方有所分工,看似重视,实际上也没得到真正地重视。比如说机房设备长时间一直运行正常,这时如果运维人员提出要增添运维方面的测量设备,有的领导就认为多余,很难得到批准。但他不知道机房设备所以长时间一直运行正常,正是由于这些运维人员的细心维护和努力保养所获得的。并不是这些人员每天闲着无事可干,他们的这些工作一般是领导看不见的。比如同样多款的UPS在同样的环境条件下,在某卫星地面站就极少出故障,而在同系统别的地方机房同一家同规格的机器就故障连连。原来是前者的运维人员每天都在细心观察和分析机器面板LCD上显示的数据,一旦发现异常苗头及时采取措施;而后者只限于每天抄写这些数据就算完成任务,使异常苗头不断积累,以致于导致故障。比如断路器在额定闭合状态发现触点处温度高了,就要检查是不是电流过大到超过额定值,如果不是就要检查触点接触是否牢靠,是否需要再紧固一下。这样一来,故障隐患就排除了。如果一直不管不问久而久之就会导致跳闸而使系统崩溃。这都是一些小的动作,都是在巡查中顺便做的事情。所以同是运维人员在巡查,但前者在做事而后者只是走马观花。这就是数据中心可靠与不可靠的区别。 运维人员就像幼儿园的保育员和老师。孩子交到幼儿园后,起主要作用的就是保育员和老师,这时保育员和老师就是主体。机器就好比是幼儿园的孩子,孩子是否健康成长,机器是否正常运行,除去本身的健康(可靠性质量)状况外,那就是运维人员的责任了。由于云计算的要求弹性、灵活快速扩展、降低运维成本、自动化资源监控、多租户环境等特性,除基于ITIL(IT基础设施库)的常规数据中心运维管理理念之外,以下运维管理方面的内容,需要我们加以重点关注。 2 云计算数据中心运维管理的要点 (1)理清云计算数据中心的运维对象 数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。云计算数据中心运维对象一般可分成5大类: ①机房环境基础设施 这里主要指的是为保障数据中心所管理的设备正常运行所必需的网络通信、供配电系统、环境系统、消防系统和安保系统等。这部分设备对于用户来说几乎是透明的,比如大多数用户都不会忽略数据中心的供电和制冷。因为这类设备如果发生意外,对依托于该基础设施的应用来说是致命的。 ②数据中心所应用的各种设备 这些设备包括存储、服务器、网络设备和安全设备等硬件资源。这类设备在向用户提供IT 服务过程中提供了计算、存传输和通信等功能,是IT服务最核心的部分。 ③系统与数据 这部分包括操作系统、数据库、中间环节和应用程序等软件资源,还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样“看得见,摸得着”,但却是IT服务的逻辑载体。 ④管理工具 这部分包括基础设施监控软件、IT监控软件、工作流管理平台、报表平台和短信平台等。 这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象的工作情况,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证数据中心如何管理好与其直接相关的资源,从而间接地提升了可用性与可靠性。 ⑤人员管理 人员管理包括数据中心在内的技术人员、运维人员、管理人员以及提供服务的厂商人员的管理。 人员一方面作为管理的主体负责管理数据中心的运维对象,另一方面也作为管理的对象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。 (2)定义各运维对象的运维内容 云计算数据中心资源管理所涵盖的范围很广,包括环境管理、网络管理、设备管理、软件管理、存储介质管理、防病毒管理、应用管理、日常操作管理、用户密码管理和员工管理等。这就需要对每一个管理对象的日常维护工作内容有一个明确的定义,定义操作内容、维护频度、对应的责任人,要做到有章可循,责任人可追踪。实现对整个系统全生命周期地追踪管理。 (3)建立信息化的运维管理平台系统和IT服务管理系统 云计算数据中心的运维管理应从数据中心的日常监控入手,事件管理、变更管理、应急预案管理和日常维护管理等方面全方位地进行数据中心的日常监控。实现提前发现问题、消除隐患,首先要有完整的、全方位实时有效的监控系统,并着重监控数据的记录和技术分析。 数据中心的业务可以概括为:通过运行系统来向客户提供服务。没有信息系统的支撑来运行
荷马有限公司系统运维管理办法 第一章总则 第一条为保障信息系统(包括基础设施、网络系统、应用系统、信息资源、机房环境等)的安全、稳定、高效运行,积极预防风险,完善控制措施,制定本制度。 第二条本办法适用于公司信息系统运维管理工作。第二章主要 内容及工作职责 第三条运维管理的主要工作内容包括网络系统运行维护、主机系统运行维护、业务系统运行维护、机房基础设施运行维护和运维流程管理。 第四条IT 中心工作职责 1、负责集团信息系统运维归口管理。 2、负责集团运维管理制度的制订与落实。 3、负责集团统一建设的信息系统、本部机房和其它基础设施等的运行维护。; 4、负责指导公司各职能部门、分公司运行维护工作,并提供技术支持。 第五条各职能部门、分公司工作职责 1、负责公司运维管理制度的贯彻落实。 2、负责专属信息系统和管辖范围内机房及其它基础设施等的运行维护。 3、协助公司IT 中心做好公司统一建设的信息系统的运
行维护。 第三章网络系统运行维护 第六条网络系统的运行监控:根据网络设备等级按每天、每周、每月进行定期检查,填报检查日志表,利用相关监控系统,协助监控各种网络设备运行状态。 第七条网络系统故障处理:当网络设备发生故障导致网络异常时,系统管理员要按照事件管理流程及时进行故障分析、诊断和修复,并做好记录。 第八条系统管理员负责根据网络运行情况和业务需要提出优化整改方案,对网络系统进行调整与优化,但调整与优化涉及的变更工作要按照变更管理流程进行。 第四章主机系统运行维护 第九条主机系统的运行监控:系统管理员通过查看主机设备日志或主机管理工具对主机设备运行状态和主机网络连通性进行实时监控,包括小型机、PC服务器、操作系统、 数据库系统、中间件等,确保核心主机系统稳定运行。 第十条主机系统故障处理:当主机设备(小型机、PC服 务器、操作系统、数据库系统、中间件等)发生故障时,系统管理员要按照事件管理流程及时进行故障分析、诊断和修复,并做好记录。 第十一条系统管理员负责根据系统运行情况和业务需要对主机系 统进行调整与优化,但调整与优化涉及的变更工 作要按照变更管理流程进行。 - 2
运行维护管理制度 为规范信息系统的运行维护管理工作,确保信息系统的安全可靠运行,切实提高生产效率和服务质量,使信息系统更好地服务于生产运营和管理,特制订本管理办法。 一、信息系统的维护内容在生产操作层面又分为机房环境维护、计算 机硬件平台维护、配套网络维护、基础软件维护、应用软件维护五部分: 1、计算机硬件平台指计算机主机硬件及存储设备; 2、配套网络指保证信息系统相互通信和正常运行的网络组织,包括联网所需的交换机、路由器、防火墙等网络设备和局域网内连接网络设备的网线、传输、光纤线路等; 3、基础软件指运行于计算机主机之上的操作系统、数据库软件、中间件等公共软件; 4、应用软件指运行于计算机系统之上,直接提供服务或业务的专用软件; 5、机房环境指保证计算机系统正常稳定运行的基础设施,包含机房建筑、电力供应、空气调节、灰尘过滤、静电防护、消防设施、网络布线、维护工具等子系统。 二、运行维护管理的基本任务: 1、进行信息系统的日常运行和维护管理,实时监控系统运行状态,保证系统各类运行指标符合相关规定; 2、迅速而准确地定位和排除各类故障,保证信息系统正常运 行,确保所承载的各类应用和业务正常;
3、进行系统安全管理,保证信息系统的运行安全和信息的完整、准确; 4、在保证系统运行质量的情况下,提高维护效率,降低维护成本。 三、信息系统维护部门职责 1.负责全行范围内信息系统的计算机硬件平台、基础软件、应用软件、配套网络和的监控和日常维护工作,制定日常维护作业计划并认真执行,保证信息系统正常运行; 2.对于系统的所有维护(包括日常作业计划、故障处理、系统改进、数据变更、数据的备份与恢复、功能完善增加)都必须填写维护记录,每月向信息系统维护管理部门上报所辖范围内的信息系统运行情况和所有的维护记录; 3.负责所辖范围内信息系统数据的备份与恢复,负责落实系统安全运行措施; 4.负责所辖范围内信息系统档案资料的维护,及时更新有关资料; 5.严格按照信息系统故障管理、问题管理、变更管理、版本管理和配置管理等相关制度、流程和规程。
项城市中医院 信息系统运行维护制度 一、计算机网络系统管理规则 (一)总则 1.为了加强医院计算机网络系统的领导与管理,促进医院信息系统的应用与发展,保障系统有序运行,制定本规则。 2.本规则所称的计算机网络系统,就是由计算机及其相关配套的设备、设施构成,按照系统应用目标与规则对医院信息进行采集、加工、存储、传输、检索等处理的人机系统。 3.医院计算机网络系统管理就是为了保障系统建设与应用,保障系统功能的正常发挥,保障运行环境与信息的安全,满足各工作站操作与维护的全部活动的正常进行。 4.本规则适用于全院应用医院信息系统的所有单位与个人。 (二)组织管理 1.医院计算机网络系统的组织管理机制就是医院信息系统领导小组 (简称领导小组)。 2.领导小组由下列人员组成: 组长:李军民 副组长:邹坤明胡军政夏辉曹胜雁靳华靳国辉 成员:李玉会张凤云冯先霞韩新山龚向东 3.领导小组的主要职能与任务: (1)制定医院信息系统建设与应用总体规划及阶段实施计划,审查与制定系统应用中工作流程、技术规范、性能指标、有关人员职责与规章制度。 (2)协调解决工程实施与系统应用中的重大问题。 (3)组织安排系统建设与应用中的重要活动,如规则制定,网络管理、系统配置,人员培训等。 4.医务科领导在系统建设与系统应用过程中负责日常组织及协调管理工作。
5.计算机室就是系统建设、应用组织的骨干,就是系统运行的保障者,应对所属人员实行分工负责。 6.计算机工程技术人员全面负责系统规则、计划、系统配置的起草,负责系统调试、系统维护、安全管理、人员培训等技术管理工作。 (三)网络的技术管理 1.计算机工程技术人员就是网络系统技术管理的直接责任者,应以实现系统功能为目的,以满足用户需求为宗旨,对网络系统的操作与维护进行管理。 2.网络内各类设备的配置,由系统负责人提出配置规划与计划,报有关领导审批后实施。 3.每一子系统或挂接的可执行程序在上网运行前,计算机工程技术人员必须严格按照功能要求在备用服务器上进行全面调试,达到功能要求且排除一切可能的数据冲突后交用户实际上网使用。 4.计算机工程技术人员实行分工负责制。网络中心各种设备由计算机室负责人管理或指定专人负责。 5、系统管理员或机房值班人员负责网络服务器的数据备份与日结工作。 6.网络系统负责人负责各工作站模块登录口令密码的设置并做好记录。工作站操作人员更换时,要立即做好口令的更改。 7.根据系统功能要求,系统负责人提出各子系统与模块的使用权限与使用分配方案,报请领导小组核准实施。 8.系统负责人管理全面技术工作与运行管理工作,出现技术问题或故障时,应遵循《网络服务器故障应急处理规程》处理。 (四)网络系统安全管理 1.网络系统的安全管理包括:数据库安全管理与网络设备设施安全管理。 2.系统负责人与计算机工程技术人员必须采取有效的方法与技术,防止网络系统数据或信息的丢失、破坏或失密。 3.利用用户管理模块或其她技术手段对系统用户访问权限进行管理,用户的访问权限由系统负责人提出,领导小组核准。 4.系统管理人员应熟悉并严格监督数据库使用权限、用户密码使用情况,定期更换用户口令密码。
运维管理办法 目录 1.总则......................................................... 2.系统运维管理办法 ............................................. 3.数据库运维管理办法 ........................................... 4.备份运维管理办法 ............................................. 5.巡检管理办法 ................................................. 6.请示报告制度 ................................................. 1.总则 第1条为了加强运行维护管理保障业务系统稳定可靠地运行,制定本运行维护基本管理办法。 第2条实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。 第3条完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。 2.系统运维管理办法 1.指定专人作为系统管理员,对系统的运行、管理、维护和安全负责,并按照规定负责系统 和数据的备份与恢复。 2.定时对系统进行监控和健康性检查,分析系统运行和资源使用情况,进行必要的优化、调 整和修正,及时消除隐患。 3.及时处理系统运行过程中出现的异常问题和软硬件故障,并采取必要措施,最大限度的保 护好系统数据。 4.具有系统权限人员调离工作岗位或离职,应立即修改其保管的用户密码,或删除该用户。