搜档网
当前位置:搜档网 › 故障处理流程

故障处理流程

故障处理流程
故障处理流程

故障处理流程

省应急平台系统网管故障管理流程包括如下步骤,形成故障处理的闭环操作:●故障发现:包括设备故障上报、网管定时轮询、网管性能监视、网管配

置文件定期检查等;

●故障接收:根据告警脚本中的事件定义,接收并解析发现的故障;

●故障分析:对接收到的故障进行分析,屏蔽重复告警,支持告警手动确

认和自动确认功能,对于部分次要告警,维护人员可将其设置为自动确认,告警一产生就自动转为已确认状态;对于重要告警,必须经维护人员手工确认。

●故障报告:告警灯、告警音、告警转发(E-mail,短信,其它网管);

●故障修复:告警定位,告警确认,系统预安装修复建议;故障修复后,

系统可自动或手工确认告警,如果该告警已确认,该告警从当前告警列表中转入历史告警表,同时清除拓扑图的相应告警提示。

●故障诊断经验共享:可以保存有价值的维护经验,供后续管理提供参考。

省应急平台系统网管提供告警知识库。告警知识是用户在维护过程中的经验总结,将这些经验输入系统,下次再出现同样的故障时,可以作为参考。用户选中一条告警记录,系统根据用户选中的告警记录,从告警知识库中查询出该条告警记录的维护经验,供用户进行告警处理进行参考。管理员将自己的日常处理经验以及业务信息及时写入数据库、更新告警处理知识对以后的故障诊断与排除非常有益。

故障经验分析

故障管理故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月 目录 第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。 第二章工程运维中心在95013业务维护管理中的职责

a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则: 先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障等级进行处理。 第五章故障处理时限要求。 1. 重大故障,故障处理时限≤2小时。

故障管理及故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月 目录 第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。

第二章工程运维中心在95013业务维护管理中的职责 a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则:

基站故障处理流程规范报告

基站故障处理流程规范 1.概述 1.1 编制背景 为进一步规范移动基站处理流程,及时处理基站发生的故障,保证基站故障设备能够在最短时间得以恢复及对网络指标的影响降到最低,特制定基站故障抢修指导手册,以便基站维护人员发现、处理、分析故障问题提供参考。 1.2 编制单位 中国移动通信集团江西有限公司鹰潭分公司网络部 1.3 指标要求 按照基站维护服务技术规范书的要求,基站维护人员在接到设备障碍通知后,应及时到现场处理。 1.4 处理原则 1.维护人员应按“先室内,后室外,先软件,后硬件”的原则进行故障处理 工作,即在排除电力、光缆中断的因素后,再进入基站处理故障,在排除 软件吊死、数据丢失等软件原因后,再对调、更换硬件。 2.在充分了解故障信息的情况下,尽量缩短故障处理时长,更换需更换且 仅需更换的板件。因此,接到故障通知后,应根据通知内容对故障进行 预判断,以便采取针对性的处理措施,定位真正的故障点,避免错误信 息误导,延长故障恢复时间。 3.维护人员在故障处理过程中,需协调其它部门或单位解决问题时,应立 即展开协调并向上级报告相关进展情况。 4. 对载频,主控板,传输板等故障处理应禁止在网络指标考核 (8:00-11:00,18:00-20:00)时段进行处理

2. 故障处理流程

3. 基站故障分类及参考处理步骤 3.1基站载频退服 步骤1:先要求机房查看载频信令是否激活,即是否处于WO状态。如果载频信令没办法激活或已激活,整个BCF也已重启,但载频依然退服,则带上对应型号的载频。 步骤2:到站后,若扇区没开跳频,则闭掉一块正常工作的载频,将故障板件和它对调。若扇区开了跳频,则先叫机房闭站。 步骤3:对调后,重新集成,观察载频是否能正常工作,如果故障随着载频走,则用新板更换故障载频;如果故障依然存在原位置,则可能与载频硬件无关,需重新定位故障点。 步骤4:故障恢复后,处理板卡标签和固定资产变动,签好出入登记本以及故障处理记录,离开基站。 3.2基站因停电退服 步骤1:维护人员接到停电通知后,首先需询问当地电力公司,看该基站附近是否在做电力抢修,如果电力公司确定是在做电力抢修,详细了解将停电时长及恢复供电时间。 步骤2:在得到确切的时间后,根据基站固定资源调查表,或平时巡检表的信息,判断电池组的持续供电时间,如果电业局确定能恢复供电的时间很短,远小于电池组的安全供电时间,则不必带油机前往基站发电,但需每隔1小时跟踪一次供电恢复情况。如果电池组不能或勉强能撑到交流供电恢复时间,则需立即带上小油机去站上发电。 步骤3:根据基站的配置选定功率匹配并已经过检测完好的油机和电缆线,备足燃油和工具(万用表、钳形表、电笔、绝缘胶布以及其他常用工具)及时到达市电故障的基站。 具体油机选定方法举例如下:某基站通信设备直流负荷为45A(空调、照明除外),配置 GFM400Ah/48V蓄电池2组,开关电源为48V电源,基站由三相交

问题与故障处理流程图

NGBOSS3.0系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义 标准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障 管理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通 知故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到 标准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级 至故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。

●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤, 监督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员 现场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过 程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相 关领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。 ●记录问题处理过程,登记故障问题管理列表中的相关处理信息。 ●负责故障处理完成后,整理并填写故障分析报告,并按时提交。 ●总结及优化类似故障的处理步骤,为后续故障处理提供依据。 ●根据故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分 析。

监控系统故障应急处置措施

监控系统故障应急处置措施 一、监测监控故障应急处理措施 故障处置负责人:张谦具体处置人员:刘海龙张雷 故障处置程序: 1、监控值班员发现传感器断线,或接到现场施工人员汇报传感器断线后,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断。 3、联系施工现场班组长或电工,检查传感器航空插头线,并重接。如恢复故障处置完毕。 4、上述过程不能恢复,监控维修值班员要带好备件及抢修工具及时赶赴现场,到达现场后,监控维修值班员由施工队组电工配合,从分站到传感器各接点一一排查,直至更换传感器或更换分站接口。 4、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (二)、分站断线不能上传数据。 故障处置程序: 1、监控值班员发现一分站所有传感器断线不能上传数据时,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断,监控主机与该分站的网络通讯是否正常。a、如该分站的网络节点与监控主机通讯不正常,到环网交换机处更换分站网络

节点,由监控值班员重新设置。b、如该分站的网络节点与监控主机通讯正常,立即下井检查,分站电源供电是否正常、环网交换机与分站的连接线是否短路或断路,直至故障处置完毕。 3、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (三)、环网交换机断线不能上传数据。 故障处置程序: 1、监控值班员发现若干分站所有传感器断线不能上传数据时,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断,断线分站是否同属一台环网交换机,如不同属一台环网交换机,按分站断线处置。如同属一台环网交换机,立即检查监控主机与该环网交换机的所有网络节点的通讯是否正常。a、如该环网交换机的所有网络节点与监控主机通讯不正常,要及时赶赴现场检查环网交换机电源是否供电正常或现场更换环网交换机,由监控值班员重新设置。b、如该环网交换机的部分网络节点与监控主机通讯正常,立即更换故障分站的网络节点,由监控值班员重新设置。 3、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (四)、监控主机故障,不能实时监控。 故障处置程序: 1、监控值班员发现监控主机不能运行时,要立即向值班领导汇

问题及故障处理流程

系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义标 准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障管 理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账 务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通知 故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到标 准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级至 故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。 ●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤,监 督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员现 场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相关 领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。

设备故障处置过程中的九大错误与解决办法

设备故障 处置过程中的九大错误与解决办法设备故障处理是设备管理和维修人员经常会面对的问题之 O 维修人员在日常的设备故障检查处理过程中,外部受时间、环境、人员等方面的压力,内部受维修人员本身的技术水平、经验、设备熟悉程度、人员身体精神状态等的影响,这些因素,会对故障快速、准确的处置造成一定的影响。 维修人员对设备故障的排查和处置不当,会导致故障处置时间、人力、成本等的增加,或为下次故障留下隐患。 问题一.不能正确判断分析故障,盲目大拆大卸 1、现象: —些维修人员由于对机械结构、原理不清楚,未认真分析清楚故障原因,不能准确判断故障部位,凭着〃大概、差不多〃的思想盲目对机械大拆大卸,结果不但原故障未排除,而且由于维修技能和工艺较差,又出现新的问题。 2、解决办法: 当机械出现故障后,要通过检测设备进行检测,如无检测设备,可通过"问、看、查、试〃等传统的故障判断方法和手段,结合工程机

械的结构和工作原理,确定最可能发生故障的部位。在判定工程机械故障时,一般常用〃排除法〃和〃比较法",按照从简单到复杂、先外表后内部、先总成再部件的顺序进行,切忌"不问青红皂白,盲目大拆大卸"。 问题二■盲目更换零部件,一味"换件修理" 1、现象: 有些维修人员一贯采用换件试验的方法,不论大件小件,只要认为可能是导致故障的零部件,一个一个更换试验,结果非但故障没排除,且把不该更换的零部件随意更换了,增加了消费者的开支。还有些故障零部件完全可以通过修理恢复其技术性能,不需要复杂修理工艺即可修复,但维修人员却要求用户更换新件,一味采取〃换件修理"的方法,造成严重的浪费。 2、解决办法: 在维修时,应根据故障现象认真分析判断故障原因及部位,对能修复的零部件要采取修理的方法恢复技术性能,杜绝盲目更换零部件的做法。 问题三、不检查新件质量,装配后出现故障 1、现象: 在更换配件前,有些维修人员对新配件不做技术检查,皇来后直接安装到设备上,这种做法是不科学的。目前市场上出售的零配件质量良

矿井安全监控系统断电故障处理程序示范文本

矿井安全监控系统断电故障处理程序示范文本 In The Actual Work Production Management, In Order To Ensure The Smooth Progress Of The Process, And Consider The Relationship Between Each Link, The Specific Requirements Of Each Link To Achieve Risk Control And Planning 某某管理中心 XX年XX月

矿井安全监控系统断电故障处理程序示 范文本 使用指引:此管理制度资料应用在实际工作生产管理中为了保障过程顺利推进,同时考虑各个环节之间的关系,每个环节实现的具体要求而进行的风险控制与规划,并将危害降低到最小,文档经过下载可进行自定义修改,请根据实际需求进行调整与使用。 1、中心站值班人员一旦发现矿井安全监控系统出现断 电故障,及时汇报监控系统责任人,之后根据故障状况, 若必要,尽快通知断电故障区域的瓦检员查看故障情况(包 括安全监控系统的故障闭锁情况),并及时汇报分管领导。 2、各类人员发现矿井安全监控系统出现断电故障时, 要及时向矿调度室汇报。矿调度室接到汇报后及时通知矿 值班领导。调度员接听汇报时要详细询间与记录断电故障 部位、故障状况、故障发生时间及汇报人情况。 3、值班监测电钳工与中心站位班员及时综合分析井 上、下反馈的断电故障状况,查找断电故障原因,确定合 理的故障处理方法与安全措施,尽快消除断电故障,并及

时将断电故障原因、处理结果向调度室汇报。 4、矿井安全监控系统出现断电故障时,值班监测电钳下、中心站值班员等人员不能排除断电故障或不能查清断电故障原因时,及时向分管矿领导汇报。 5、安全监控设备出现断电故障时,矿调度室接到关于受断电故障影响区域的汇报后,及时对故障所影响区域内的作业人员下达停止作业指令,并切断通往断电故障影响区域的所有非木质安全型电气设备的供电。 6、排除矿井安全监控系统断电故障的作业中,作业人员必须按操作规范进行验电、放电,严禁带电作业;验电、放电时要1人操作1人监护。 7、排除矿井安全监控系统断电故障中需用普通型测量仪表时,必须在风流中瓦斯小于1 %且附近20米内无瓦斯积聚的地点使用,并用甲烷检测报警仪实时监测作业地点的瓦斯状况,一旦风流中瓦斯达到1%或附近20米内出现

研发体系问题单处理流程

研发体系问题单处理流程

A:当前责任人要做的事情 S:问题单的状态 线上的文字,中文:判断结果;英文:在TRAC上对问题单的操作 1. 问题定位确认 测试人员发现问题后,如果是必现、确定的问题,直接提单;如果是无规律重现问题,或者不确定是否是问题,可以找相关开发人员进行测试现场定位分析,排除误操作等原因,确定问题现象及初步分析结论,由测试人员提单给定位责任人进一步跟踪; 2. 问题单提交 问题单严重程度有四个等级:致命、严重、一般、提示; 问题严重程度级别判定原则:问题级别判定应该就重不就轻,当问题现象可能符合多个问题级别定义的描述时,应该选择级别最严重的作为最终的问题级别。 致命

定义:产品的关键功能和性能不能符合用户要求,或由于产品质量原因造成业务中断、频繁瞬断或服务质量严重下降等可能给用户收益或声誉造成较大损失的问题。 举例:(包括但不限于下列情况) (1)整机或关键部件异常重新启动或瘫机; (2)由于产品质量原因造成的基本业务失效、部分失效及不能稳定提供; (3)可能影响用户收益或声誉的; (4)重要操作维护功能完全失效,例如用户无法对系统进行操作维护或操作维护经常被打断,无法对系统进行维护,告警功能完全丧失等; (5)系统性能基于上一个版本下降10%以上并可能影响用户收益或声誉的; (6)按照版本升级指导书操作导致系统升级失败; (7)其他可能造成业务中断、频繁瞬断或服务质量严重下降等可能给用户收益或声誉造成较大损失的问题,例如资源大量吊死、大量消息丢失、时钟丢失无法恢复等。 (8)产品不符合行业规范或目标客户群所在地区的相关标准,如果不解决将导致无法在该地区销售; (9)不符合安全规范,在遵守安全规程进行操作维护的情况下可能造成重大人身伤亡的问题; 严重 定义:在产品规格书或行业标准规定的条件范围内,系统的主要功能和业务性能不符合用户要求,或不能稳定运行,但仍然可以向用户提供基本的业务。 举例:(包括但不限于下列情况) (1)非基本业务功能失效或部分失效; (2)基本业务功能在特定的不常见的条件下的失效,例如在某异常情况下的处理不符合协议; (3)非关键性部件故障,这些部件的故障不会影响用户使用基本业务; (4)系统数据丢失或出现不一致但不会给用户带来损失; (5)系统未达到要求或设计的性能指标、系统或模块性能下降但不影响基本业务; (6)用户资料存在严重的技术错误或缺少重要技术内容; (7)其他各种可能对客户造成影响但尚未影响基本业务的问题; (8)部分主要功能操作很不方便,多数用户会认为这些操作方式显著影响工作效率;

宽带常见故障处理流程与方法

宽带常见故障处理流程与方法 1 FTTH故障处理步骤 第一步:查瞧ONT(光猫)“Power”电源灯得状态。 (1)不亮,表示供电异常,需要检查电源连接与电源适配器就是否工作正常 (2)长亮,表示供电正常转第二步。 第二步:查瞧ONT(光猫) “LOS”灯得状态。 (1)熄灭,表示信号正常转第三步。 (2)闪亮,表示光猫接收不到信号或低于灵敏度,转第五步。 第三步:查瞧ONT(光猫)“PON”或“LINK”灯得状态。 (1)常亮,表示ONT(光猫)接收到OLT得信号,转第四步。 (2)闪亮,表示ONT(光猫)接收光功率低于或者高于光接收灵敏 度,ONT(光猫)注册不上,转第五步。 (3)灭,表示ONT(光猫)接收不到OLT得信号,转第五步。 第四步:查瞧ONT(光猫)“LAN”灯得状态。 (1)灯闪亮,表示光猫与电脑或用户路由器连接正常,转第六步。 (2)熄灭,表示光猫与电脑或用户路由器、交换机连接异常,检查步骤①用户网卡就是否禁用,②用网线测试仪检查网线就是否正常,③更换光猫LAN口或路由器、交换机其她端口测试就是否正常。最终判断就是光猫、路由器、交换机、用户电脑得问题。 第五步:检查光衰。

(1)查瞧光猫接收光功率情况。两种方法:①可以登录到光猫里面查瞧; ②通过PON光功率计查瞧,拨出ONT(光猫) “PON”尾纤接入光功率计(选择波长1490nm),测试光功率就是否在标准值-8~-28dB内(-28已经处于边缘值,建议在-25以内)。 (2)收光功率过小,光衰过大,查瞧用户家到分光箱得皮线光缆就是否有弯曲程度小于90度或损坏。 (3)用户楼道光接箱测试分光器端口收光功率就是否正常,正常则用红光笔测试皮线就是否通,通则重做两端皮线光缆头,不通则重新拉皮线光缆;收光功率不正常则测试另一个分光器端口确认就是否分光器端口故障,测试另一个分光器端口正常则更换分光器端口,不正常则测试分光器总上行口。 (4)二级分光器上行光衰过大时需从二级光交箱、一级光交箱、OLT 得PON口输出逐级排查,确定光衰异常得故障点,排查工作需要两个维护人员配合完成。 第六步:拨测用户账号。 (1)断开用户路由器,直接连接笔记本电脑进行拨号

故障处理流程

故障处理流程 本章描述故障处理的流程和处理步骤。 ? 2.1 故障处理总流程 本节描述故障处理的基本流程。 ? 2.2 收集故障信息 本节描述收集故障信息的注意事项及途径、故障信息的种类。 ? 2.3 判定故障 收集故障信息后,需要对故障现象作出判断,并确定故障的范围和分类。 ? 2.4 定位故障原因 定位故障原因是通过一定的方法或手段分析、比较各种可能的故障原因,不断排除非可能因素,最终确定引发故障的具体原因。 ? 2.5 排除故障 本节描述故障排除的方法和后续处理。 2.1 故障处理总流程 本节描述故障处理的基本流程。 故障处理总流程如图2-1所示。

图2-1 故障处理总流程图 2.2 收集故障信息 本节描述收集故障信息的注意事项及途径、故障信息的种类。 收集故障信息的途径 处理故障前,需要通过相关途径收集以下故障信息: ?故障的现象。 ?故障发生的时间、地点、频率。 ?故障的范围、影响。 ?故障发生前设备运行状况。 ?故障发生前对设备进行了哪些操作、操作的结果是什么。 ?故障发生时设备是否有告警、告警的相关/伴随告警是什么。 ?故障发生时是否有单板指示灯异常。

?故障发生后采取了什么措施、结果是什么。 收集故障信息可以通过以下途径: ?询问申告故障的用户/客户中心工作人员,了解具体的故障现象、故障发生时间、地点、频率。 ?询问设备操作维护人员了解设备日常运行状况、故障现象、故障发生前的操作、故障发生后采取的措施及效果。 ?观察单板指示灯,观察LMT上的告警管理系统以了解设备软、硬件运行状况。 ?通过业务演示、性能测量、接口信令跟踪等方式了解故障发生的范围和影响。 说明: 应具有收集相关信息的强烈意识,在遇到故障特别是重大故障时,一定要先了解清楚相关情况后再决定下一步的工作,切忌盲目处理。 故障信息的种类 ?告警信息 告警信息是指BSS告警系统输出的信息,通常以声音、灯光、LED(Light EmittingDiode)显示、屏幕输出等形式提供给维护人员,具有简单明了 的特点。查看告警信息是故障分析的主要手段之一。 告警信息主要包括故障或异常现象的具体描述、故障发生的原因、故障修复建议等。告警信息涉及硬件、链路、中继、CPU负荷等BSS的各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。 告警信息主要用于查找故障的具体部位或原因。由于BSS告警系统输出的告警信息丰富、全面,因此经常可以用来直接定位故障的原因,或配合其他方法共同定位故障。 说明: 告警系统的使用说明请参见《BSC6900 GSM LMT用户指南》,每条告警处理的详细操作说明请参见《BSC6900 GSM告警参考》。 ?指示灯状态 指示灯反映相应单板的工作状况以及电路、链路、光路、节点等的工作状态,是进行故障分析和定位的重要依据之一。

故障管理及故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二??八年八月 目录

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章95013 业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013 业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证95013 业务安全稳定的运行,特制定本规定。

第二章工程运维中心在95013 业务维护管理中的职责 a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章95013 业务故障分类 95013 业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: —种以上业务全部中断》60分钟 一省以上业务全部中断》60分钟 用户注册、业务受理全部中断》4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则: 先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障 等级进行处理。 第五章故障处理时限要求。 1.重大故障,故障处理时限w 2小时

系统故障处理流程

节假日,非正常上班时间具体流程: 1.客服填写好系统故障描述.xls并以邮件的形式发出,若是节假日,非正常上班时间,客 服打电话通知第一联系人,第一联系人是**,第二联系人是** 2.第一联系人接到电话,并收到邮件后,网络硬件问题,5分钟内提交给**,若是软件问 题,下一步 3.在5分钟内将邮件提交给技术部值班人员,若在此时,第一联系人当时不能上网,联系 第二联系人查看邮件,第二联系人在5分钟内将邮件提交给技术部值班人员,若此时第一联系人或第二联系人不将邮件发出,则电话通知给技术部值班人,若第一联系人或第二联系人不通知给技术部值班人,则按公司系统维护奖惩制度处理。 4.技术部值班人员收到邮件后,在15分钟内a、将淘宝充值中的订单批量改成成功,b 、 根据故障描述.xls给出解决方案,并填写好技术解决方案记录单.xls,邮件发出。c、解决问题否,电话通知到第一联系人。此时若技术部值班人员当时不能上网,在15分钟后未给出任何解决方案,而且没有通知到第一联系人,则按公司系统维护奖惩制度处理。 5.第一联系人收到邮件或接到电话,在5分钟内将解决方案电话通知给客服。若没有在规 定时间通知客服,则按公司系统维护奖惩制度处理。

正常上班时间具体流程: 1.客服填写好系统故障描述.xls并以邮件的形式发出,并QQ通知 2.第一联系人并收到邮件后,网络问题,5分钟内提交给**,若是软件问题,下一步 3.在5分钟内将邮件提交给技术部**,若此时第一联系人或第二联系人不将邮件发出,则 按公司系统维护奖惩制度处理。 4.技术部**收到邮件后,在15分钟内a、将淘宝充值中的订单批量改成成功,b 、根据故 障描述.xls给出解决方案,并填写好技术解决方案记录单.xls,邮件发出。c、解决问题否,邮件并QQ通知到第一联系人。若此时若技术部在15分钟后未给出任何解决方案,一直查找原因,超过时间,没有邮件或QQ通知到第一联系人,则按公司系统维护奖惩制度处理。因为若淘宝业务超过40分钟,未给出交易订单状态,若订单成功,也不付款。 5.第一联系人收到邮件或接到电话,在5分钟内将解决方案邮件通知给客服,若没有在规 定时间通知客服,则按公司系统维护奖惩制度处理。

故障处理流程

1 概述 随着PTN产品在全球的广泛应用,用户对产品的稳定运行要求也越来越高,相应对我们的维护工程师技能提出更高的要求。 《ZXCTN产品故障排查指导手册》是面向有一定PTN维护基础的中兴售后工程师, 通过对该手册的学习和应用,提高售后工程师的实际故障处 理能力,争取使售后工程师水平在较短时间内有明显提升。 本文分为故障处理流程、故障处理的常见方法、故障处理的常用命令和工具、故障反馈的方式和信息说明,以及常见故障排查和典型案例几个部分 进行描述。

2 故障处理流程2.1 故障处理总流程 图2-1 故障处理总流程图

2.2 紧急故障处理流程 紧急故障处理流程如图2-2所示。 图2-2 ZXCTN产品紧急故障处理流程图 流程说明: 1. 尽快恢复业务 出现紧急故障,承载的业务中断,如果有备用路由,请把业务割接到备用路由上。 2. PTN故障分类说明 除业务类故障外,还有其他OAM类故障,监控类故障等,可以根据其他的故障处理流程进行处理。 3. 设备告警、配置等情况检查 PTN产品配置比较复杂,现场若出现配置问题时,需要仔细排查网管、设备侧配置及运行状态是否正常,然后再转入设备类故障处理。

2.3 故障处理原则 在处理设备故障时,设备维护人员应该遵循一“查看”、二“询问”、三“思考”、四“动手”的基本原则。 1. 查看 维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、危害程度。只有全面了解设备的故障现象, 才能透过现象看本质。 2. 询问 观察完故障现象后,应询问现场操作人员,有没有直接原因造成此故障,比如:修改数据,删除文件,更换电路板,停电,雷击。 3. 思考 根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障点和故障原因。 4. 动手 在通过前面三个步骤找出故障点后,维护人员可以采取适当的操作来排除故障,如:修改配置数据、更换板件。 2.4 故障定位的基本思路 2.4.1 故障原因 1. 工程问题 工程问题是指由于工程施工不规范、工程质量差等原因造成的设备故障。此类问题有的在工程施工期间就能暴露出来,有的可能在设备运行一段时 间或某些外因作用下,才暴露出来,为设备的稳定运行埋下隐患。 产品的工程施工规范是根据产品的自身特点并在一些经验教训的基础上总结出来的规范性说明文件,因此,严格按工程规范施工安装,认真细致的 按规范要求进行单点和全网的调试和测试,是防止此类问题出现的有效手段。 2. 外部原因 外部原因是指除传输设备以外导致设备故障的环境、设备因素,包括:(1)供电电源故障,如设备掉电,供电电压过低。

问题及故障处理流程

问题及故障处理流程-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

NGBOSS3.0系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义标 准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障管 理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、 账务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通 知故障分派员。 对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到 标准的通知主管,由主管酌情升级。 对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级 至故障分派员。 对于发生的故障,统一按业务运营中心内部要求进行登记。 故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。 ●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤, 监督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员 现场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过 程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相 关领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进 展,直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。

软件故障的常见原因分析和处理方法

软件故障原因分析 1 软件不兼容 有些软件在运行时与其他软件有冲突,相互不能兼容。如果这两个不能兼容的软件同时运行,可能会中止程序的运行,严重的将会使系统崩溃。比较典型的例子是杀毒软件,如果系统中存在多个杀毒软件,很容易造成系统运行不稳定。 2 非法操作 非法操作是由于人为操作不当造成的。如卸载程序时不使用程序自带的卸载程序,而直接将程序所在的文件夹删除,这样一般不能完全卸载该程序,反而会给系统留下大量的垃圾文件,成为系统故障隐患。 3 误操作 误操作是指用户在使用计算机时,误将有用的系统文件删除或者执行了格式化命令,这样会使硬盘中重要的数据丢失。 病毒的破坏。计算机病毒会给系统带来难以预料的破坏,有的病毒会感染硬盘中的可执行文件,使其不能正常运行;有的病毒会破坏系统文件,造成系统不能正常启动;还有的病毒会破坏计算机的硬件,使用户蒙受更大的损失。 4 软件的参数设置不合理。 一个软件特别是应用软件总是在一个具体用户环境下使用的,如果用户设置的环境参数不能满足用户使用的环境要求,那么用户在使用时往往会感觉软件有某些缺陷或者故障。文档在编辑过程中都可以正常显示.但是打印出来总是一张白纸。经过检查,发现故障计算机的Word系统设置了蓝底白字功能。在编辑时无法发现任何异常(因为是蓝色背景).但是在打印时.白纸上面是无法显示白字的.因此也就导致了故障现象的发生。

软件故障排除方法 1 安全模式法 安全模式法主要用来诊断由于注册表损坏或一些软件不兼容导致的操作系统无法启动的故障。安全模式法的诊断步骤为,首先用安全模式启动电脑,如果存在不兼容的软件,在系统启动后将它卸载,然后正常退出;接着再重新启动电脑,启动后安装新的软件即可,如果还是不能正常启动,则需要使用其他方法排除故障。这也是最常用的方法。 2 软件最小系统法 软件最小系统法是指从维修判断的角度能使电脑开机运行的最基本的软件环境,即只有一个基本的操作系统环境,不安装任何应用软件,可以卸载所有的应用软件或者重新安装操作系统即可。然后根据故障分析判断的需要,安装需要的应用软件。使用一个干净的操作系统环境,可以判断故障是属于系统问题、软件冲突问题,还是软、硬件间的冲突问题。该方法适合于系统安装的软件较少的时候使用。 3 程序诊断法 针对运行环境不稳定等故障,可以用专用的软件来对计算机的软、硬件进行测试,如3DMark、WinBench等,根据这些软件的反复测试而生成的报告文件,我们就可以比较轻松地找到一些由于系统运行不稳定而引起的故障。该方法相对比较专业,一般使用者无法顺利进行操作。 4 逐步添加/去除软件法 逐步添加软件法,以最小系统为基础,每次只向系统添加一个软件,来检查故障现象是否发生变化,以此来判断故障软件。逐步去除软件法,正好与逐步添加软件法的操作相反。该方法也是较常用的方法之一。

相关主题