搜档网
当前位置:搜档网 › 智能告警及故障分析系统介绍

智能告警及故障分析系统介绍

E1电路告警分析及其故障处理

E1电路告警分析及其故障处理 1 概述 目前,在电信公网中或在其他专用通信网络中,e1数字电路是主要的业务类型。尤其是在电力通信专网内,80%以上的通信业务类型是e1的数字电路。e1电路故障是通信传输专业和交换专业最常遇见的障碍之一,要及时准确地处理这类故障,除了必须要对2m 原理有清楚的认识外,还必须能将2m原理准确地运用到故障处理中。 2 e1电路简介 e1数字电路是指为用户提供传输速率为2.048mbits/s的链路(简称2m),它是承载于传输网,由数字方式进行传送信息的全透明电路通道,由传输设备和传送介质两部分组成,它的国际标准电接口为g.703。2m是数字通信的一个基本速率。 在实际线路开通初期以及线路后期维护过程中,都会遇到不同程度的故障,导致专线不能正常连接或者数据收发不正常。这些故障中有些仅仅是因为某一台传输设备设置错误,也有可能是线路的某个接口处出现了连接故障。收线上最常见到的故障情况有los、ais、lfa、lmf等,其产生的原理和可能的原因如下: 3.1 los los,又叫断线告警,一般是指不能从收线上收到有效的电平信号或者不能收到任何信号。产生的段落在离本端收线最近的一段同轴电缆上,一般是由于线断、接头焊接工艺不良等造成的。但要注意

的是,当两端设备配合较好的情况下,同轴电缆的屏蔽线断开不会产生los告警。 3.2 ais ais,又叫全1码告警,俗称上游告警。一般是指本端能正常收到信号电平,而信号流中没有包含任何有用信息。该告警指示的段落在直接连通设备的上游方向,可能的原因有对端设备没有进入正常工作状态、对端设备停电、对端光端机工作不正常、光缆中断、本端光端机工作不正常、sdh电路没有开放等。 3.3 lof lof,又叫帧失步告警,是指0时隙中的帧失步信号连续3次以上丢失,该告警信号的消失条件是连续收到3次以上的帧失步信号。该告警的原因一般是对端设备的问题。可能的原因是对端时钟不同步或者设备故障。 3.4 lmf lmf,又叫复帧失步告警,是指用于一号信令的16时隙上的复帧信号丢失。如果所开放的电路是七号信令或者其他非一号信令的业务,那么本端是不应该出现该种类告警的。如果开放的是一号信令,则该故障的出现是对端设备的问题。 由于设备本身只能通过收线上接收的信号来判断故障,因此,在收线上发现故障以后,必须要从发线上通知对端设备自身收告警,即rdi,又叫对端告警或者对告,该告警通过传输直接向对端传送,对端设备收到rdi告警以后也将停止业务的处理。值得注意的是,

安全监控运维管理平台系统

点击文章中飘蓝词可直接进入官网查看 安全监控运维管理平台系统 传统的运维管理系统已经不能满足企业对安全监控运维的需求,对于目前日益严重的网络安全问题,一套比较靠谱的安全监控运维管理平台系统非常重要。可以更好的实现对网络、应用服务器、业务系统、各类主机资源和安全设备等的全面监控,安全监控运维管理平台系统,哪家比较靠谱? 南京风城云码软件技术有限公司是获得国家工信部认定的“双软”企业,具有专业的软件开发与生产资质。多年来专业从事IT运维监控产品及大数据平台下网络安全审计产品研发。开发团队主要由留学归国软件开发人员及管理专家领衔组成,聚集了一批软件专家、技术专家和行业专家,依托海外技术优势,使开发的软件产品在技术创新及应用领域始终保持在领域上向前发展。 目前公司软件研发部门绝大部分为大学本科及以上学历;团队中拥有系统架构师、高级软件工程师、中级软件工程师、专业测试人员;服务项目覆盖用户需求分析、系统设计、代码开发、测试、系统实施、人员培训、运维整个信息化过程,并具有多个项目并行开发的能力。 安全监控运维管理平台系统功能主要表现以下方面: 服务器硬件状态监控:通过服务器主板IPMI协议,可以监控服务器风扇转速、机箱内部和CPU温度、电源电压、电源状态、CMOS电池容量、CPU、磁盘、内存、RAID卡等硬件状态。 监控操作系统运行状态:包括 linux、windows、Vmware等操作系统运行状态的监控,以及所运行的进程和服务等。 数据库和应用监控:包括MSSQL、ORACLE、MYSQL等数据库监控,WEB服务器,URL页面等状态监控。 线路监控:包括内部专网、互联网等线路的通断和质量、流量的监控。

华为LTE告警原因与处理建议

华为LTE常见告警处理建议 2017-8-15 华为LTE常见告警目 录 1射频单元业务不可用告警3 2小区不可用告警4 3射频单元维护链路异常告警4 4BBU IR接口异常告警5 5网元断连6 6传输光接口异常告警6 7S1接口故障告警6 8射频单元IR接口异常告警7 9License试运行告警7 10以太网链路故障告警8 11用户面故障告警8 12射频单元时钟异常告警9 13基站S1控制面传输中断告警9 14射频单元交流掉电告警9 15BBU IR光模块收发异常告警10 16射频单元驻波告警10 17远程维护通道故障告警11 18小区服务能力下降告警11 19射频单元光模块收发异常告警11

20射频单元光接口性能恶化告警12 21交流掉电告警12 22时钟参考源异常告警13 23射频单元硬件故障告警13 24射频单元输入电源能力不足告警14 25配置数据超出License限制告警14 26射频单元ALD电流异常告警14 27RRU组网级数与配置不一致告警15 28射频单元发射通道增益异常告警15 29星卡锁星不足告警15 30星卡天线故障告警15 31BBU IR光模块/电接口不在位告警16 32天线设备维护链路异常告警16 33制式间通信异常告警16 34配置数据不一致告警17 35系统时钟不可用告警17 36时间同步失败告警18 37射频单元软件运行异常告警18 38BBU直流输出异常告警18 39单板温度异常告警19 40射频单元光模块/电接口不在位告警19 41射频单元接收通道RTWP/RSSI过低告警19 42BBU单板维护链路异常告警20 43BBU光模块收发异常告警20 44RRU组网拓扑类型与配置不一致告警21 45证书失效告警21 46远程维护通道配置与运行数据不一致告警22 47系统无License运行告警22 48单板不在位告警22 49未配置时钟参考源告警23 50MAC错帧超限告警23

it运维监控管理系统

点击文章中飘蓝词可直接进入官网查看 it运维监控管理系统 现在企业对IT系统的应用越来越广泛,IT已经成为很多企业业务流程的核心部分,甚至是某些业务赖以运行的基础。在国内众多的监控软件中,it运维监控管理系统已经成为当今的主流趋势,it运维监控管理系统哪家好?风城云码以其面向业务和服务层次的一站式综合监控深受好评。 南京风城云码软件技术有限公司是获得国家工信部认定的“双软”企业,具有专业的软件开发与生产资质。多年来专业从事IT运维监控产品及大数据平台下网络安全审计产品研发。开发团队主要由留学归国软件开发人员及管理专家领衔组成,聚集了一批软件专家、技术专家和行业专家,依托海外技术优势,使开发的软件产品在技术创新及应用领域始终保持在领域上向前发展。 目前公司软件研发部门绝大部分为大学本科及以上学历;团队中拥有系统架构师、软件工程师、中级软件工程师、专业测试人员;服务项目覆盖用户需求分析、系统设计、代码开发、测试、系统实施、人员培训、运维整个信息化过程,并具有多个项目并行开发的能力。 自公司成立已来,本团队一直从事IT系统运维管理以及网络信息安全审计产品的开发,同时在电力、制造行业及政府部门的信息化、智能化系统的开发及信息安全系统的开发中有所建树;在企事业协同办公管理、各类异构系统的数据交换与集成(企业总线ESB)、电力行业软件系统架构设计、电网大数据量采集和数据分析、电能质量PQDF算法解析等应用方面拥有丰富开发的经验。特别在网络信息安全、IT应用系统的智能化安全监控领域具有独特的技术优势和深厚的技术储备。近年来随着企业的不断发展和技术的不断更新,公司的开发团队正在拓展更多业务范围和更新的技术应用。 针对国内IT运维的现状,风城云码it运维监控管理系统在导入ITIL流程的同时,也结合了国内企业的服务支持模式和习惯,推出了专门面向IT运维服务管理的解决方案。企业IT部门可以应用风城云码it运维监控管理系统,建立集中的服务台,结合ITIL流程、ITSM服务管理理念,向所有终端和用户提供统一的在线技术支持,降低对分支IT人员的要求与依赖。

LTE常见告警故障分析

LTE常见告警故障分析 1.1光口接收链路故障 原因分析: ?光纤有损坏 ?光模块问题 ?ODF架处法兰盘有光损 ?近端、远端之间的线路故障 处理方法: ?根据所出的光口接收链路故障的位置(基带处理板光口或RRU光口)更换相应的光纤 ?同上,更换相应的光模块 ?排除以上2种原因外,可试更换光纤连接处的法兰盘 ?可通过在远近端处互相发光、收光,以此判断线路是否存在故障 1.2RRU链路断 原因分析: ?RRU掉电 ?光路故障 ?光模块损坏 ?基带板故障引起RRU链路断 处理方法: ?检查RRU是否上电 ?如果RRU正常上电,排除光模块或光路是否有光损

?观察基带板指示灯闪烁状态是否正常,如异常,则先插拔基带板使其复位;如果以上因素全都排除,则更好RRU 1.3天馈驻波比异常 原因分析: ?RRU通道接口与天线端口之间连接的跳线未连接好 ?设备接口渗进雨水 ? RRU与天线端口之间连接的跳线有损坏 ?RRU内部出现故障 处理方法: ?检查RRU通道接口与天线端口之间连接的跳线是否连接好,重新连接 ?检查RRU故障通道口内是否有渗进雨水,如有,需清理干净;另外设备被雨水浸泡后会有所腐蚀生锈,可用砂纸打磨后重新连接 ?如无以上情况,请尝试更换跳线,之后重启RRU,查看是否还会出现驻波比告警 ?通过以上操作后再出现,直接更换RRU 1.4天线校正失败 原因分析: ?LTE天线校正序列发射电平上下行为同一个DV参数,经过研发部门分析600版本中默认的下行校正序列发射电平过大,有可能会导致部分RRU校正序列接收电平饱和,导致校正失败。 处理方法: ?修改DV参数降低校正序列发射电平后,可以规避由此造成的天线校正失败问

it安全运维监控系统

点击文章中飘蓝词可直接进入官网查看 it安全运维监控系统 随着大数据技术的不断发展,it安全运维监控系统越来越重要。it安全运维监控系统能够提供有效的安全预警,减少IT资源故障和安全破坏的发生,降低事故所造成的损失。建议选择一家比较靠谱的运维监控公司,it安全运维监控系统哪家比较好? 南京风城云码软件技术有限公司是获得国家工信部认定的“双软”企业,具有专业的软件开发与生产资质。多年来专业从事IT运维监控产品及大数据平台下网络安全审计产品研发。开发团队主要由留学归国软件开发人员及管理专家领衔组成,聚集了一批软件专家、技术专家和行业专家,依托海外技术优势,使开发的软件产品在技术创新及应用领域始终保持在领域上向前发展。 目前公司软件研发部门绝大部分为大学本科及以上学历;团队中拥有系统架构师、软件工程师、中级软件工程师、专业测试人员;服务项目覆盖用户需求分析、系统设计、代码开发、测试、系统实施、人员培训、运维整个信息化过程,并具有多个项目并行开发的能力。 自公司成立已来,本团队一直从事IT系统运维管理以及网络信息安全审计产品的开发,同时在电力、制造行业及政府部门的信息化、智能化系统的开发及信息安全系统的开发中有所建树;在企事业协同办公管理、各类异构系统的数据交换与集成(企业总线ESB)、电力行业软件系统架构设计、电网大数据量采集和数据分析、电能质量PQDF算法解析等应用方面拥有丰富开发的经验。特别在网络信息安全、IT应用系统的智能化安全监控领域具有独特的技术优势和深厚的技术储备。近年来随着企业的不断发展和技术的不断更新,公司的开发团队正在拓展更多业务范围和更新的技术应用。 一些企业的IT系统很容易成为竞争对手的攻击对象,然而跟据调查,百分之70的漏洞却是源自于组织内部的操作失误。在所有内部隐患中,一种由IT系统人员及其操作引出的非传统安全隐患日益突出,是所有安全隐患中主要的威胁之一。用户内网各种IT系统软硬件设备管理权限的人员,包括:系统管理员、系统运维人员、系统应用高权限用户、第三方厂商的维护人员以及其他临时高权限人员等。这些人员本身所拥有的高权限账号及其在操作过程中的各种动

LTE常见故障总结

LTE常见故障总结 11、System module failure (0010) 32、BTS reference clock missing (1898) 33、Configuration error: Unit initialization failure (0012) 34、Configuration error: Not enough HW for LCR (1868) 45、Configuration error: Power level not supported (4008) 46、Cell configuration data distribution failed (6253) 47、Failure in optical RP3 interface (4064) 58、Failure in optical RP3 interface (0010) 59、Baseband bus failure (3020,1906)5 10、RF module failure (6259,19 11、17 11、1712)5 11、Cell power failure (4090)6 12、GPS Receiver alarm: Control Interface not available (4011)6 13、X2 interface setup failure(6304)6 14、Transport layer connection failure in X2 interface6

15、Failure in replaceable baseband unit7 16、Temperature alarm(0002)7 17、VSWR(1838)7 18、Failure in optical RP3 interface (2004)8 19、GPS时钟盒闪断,时钟信号不正常,无法识别RRU8 20、Failure in optical RP3 interface(2000)8 21、光纤交叉连接8 22、基站始终无法建立S1连接,只到configed状态9 23、GPS时钟盒闪断,时钟信号不正常,无法识别RRU9 24、某一个小区的RRU无法识别9 25、BBU版本无法识别10 26、校准初步排查10 27、本地IP地址和路由正常,ping不通MME和网关11 28、TRS文件始终无法生效11 29、三种疑难告警12 30、远程ping不通基站12 31、风扇告警12 32、BTSlog有link消息,但是pinger始终不亮12 33、驻波问题13 34、pinger正常,但是SM里小区显示橙黄色告警13 35、几个特列13 36、FOSI 和FOSN的光功率范围13

常见故障排查 (1)

LTE常见故障排查 华为4G设备故障集成度更高,人机交互界面更为丰富,为了提高故障处理效率,下面简单介绍通过近端LMT登陆辅助排查故障的办法。华为4G站点故障在接到监控通知后,带上电脑、网线、LTE调试线便可不再需要后台的配合。 1、驻波比告警处理 该告警与2&3G一样是最常见告警之一,均可在近端检测驻波比值。有所不同的是,爱立信设备是通过OMT近端检测载波的驻波比值,而华为3&4G近端检测的是各个发射通道的驻波比值。 根据后台通知的故障或现场MLT产看到的告警,查询对应RRU相应通道驻波比值,确定故障通道,如下: 接下来,通过跳线以及射频通道口的对调方法确定跳线、天线、RRU哪个为故障单元,最后将其替换,并重新用DSP VSER 指令确认处理效果。 2、光收发异常告警 此类故障见于PNT的EG2光接口到BBU主控板、BBU基带板光接口道RRU光接口的传输收发光强度超过设备正常运行的范围。 根据后台通知的故障或现场MLT产看到的告警,查询对应光接口的收发光强度,确定故障部件,下面以BBU到PTN光收发异常为例: 3、基站断链故障 此故障为基站与OMC网管断连,此时基站业务可能还在运行。可先近端查看业务通道是否有用户、小区状态是否正常等。

如小区、业务端口也都都不正常,说明此时逻辑传输不通,需与传输网管核对传输数据是否配齐、是否正常,然后检查近端配置的IP、VLAN是否与传输网管一致。最后通过PING的方法的方法向上级路由、OMC网管发包确认是否通。 检查设备端定义的IP 检查IP路由 检查下一跳VLAN映射信息 检查维护通道定义信息 如上述传输定义信息无误,进行ping

LTE网管常用操作总结网优

LTE后台日常操作总结 一.机房常用命令 1、M ML命令界面 2、查询小区静态参数:LST CELL(包括常用参数频点、带宽、PCI等) 3、查询小区动态参数DSP CELL 4、修改小区MOD CELL 5、查询PDSCH配置信息(参考信号功率):LST PDSCHCFG 单位0.1毫瓦分贝 6、修改PDSCH配置信息(参考信号功率) MOD PDSCHCFG 7、查询活动告警:LST ALMAF(历史告警LST ALMLOG) 8、查询小区下所有实时在线用户数的基本信息:DSP ALLUEBASICINFO 二.信令跟踪 1、信令跟踪 2、S1标准信令跟踪 3、Uu口标准信令跟踪 4、RSSI统计监控(RSSI 接收信号强度指示)

5、干扰检测监控 干扰监测通过RRU做数据采集,经主控板对数据作FFT运算分析和处理后,实时显示当前设置频率范围内的信号频谱,实现类似频谱仪的部分功能,方便网上干扰问题的定位、排查和分析。 6、总吞吐量监控 该任务监测用户的保证比特速率GBR(Guaranteed Bit Rate)及非保证速率对应数据无线承载的吞吐量,用以评估当前空口情况及调度算法。 三.指标监控 1、L TE系统KPI指标查询 四.告警查询 1、当前告警浏览 选择菜单——监控——浏览当前告警 2、查询告警日志 选择菜单——监控——查询告警日志 五.eNodeB邻区操作 由于LTE系统的扁平架构,相对2、3G减少了BSC、RNC,导致每个eNodeB都要维护 一套邻区关系。

1、本站邻区添加 本站邻区直接添加:ADD EUTRANINTRAFREONCELL 2、增加系统内同频eNodeB邻区 系统内同频eNodeB间小区邻区关系的建立,需要先创建EUTRAN外部小区关系 在MML命令行输入:ADD EUTRANEXTERNALCELL 注意:EUTRAN外部小区信息一定要正确,基站通过增加这些信息来维护邻区关系,如果小区信息有错误,会导致切换失败。 创建完外部小区关系后,开始增加EUTRAN同频邻区关系,在MML命令行输入:ADD EUTRANINTRAFREQNCELL 3、查询系统内同频eNodeB邻区 在MML命令行输入:LST EUTRANEXTERNALCELL 注意:什么都不填表示查询所有EUTRAN外部小区信息。 在MML命令行输入:LST EUTRANINTRAFREQNCELL 注意:什么都不填表示查询所有EUTRAN同频邻区关系。 4、删除系统内同频eNodeB邻区 删除eNodeB邻区,需要先删除小区同频邻区关系,才能删除EUTRAN外部小区。

常见告警故障处理及分析

···常见告警故障处理及分析 MOTOROLA基站的告警按故障设备可分为三类:设备告警、内部告警、外部告警。 一、设备常见告警 设备告警是硬件告警最常见也是最重要的告警,告警设备一般为基站的主要器件,它的告警类型就是它的设备类型。 1. DRI 29:[Front End Processor Failure - Watchdog Timer Expired] 前端处理器故障 DRI硬件故障,出现此告警时DRI可能会反复自启,可能会退服,应先reset or ins DRI应进行INS或RESET处理,若告警未消失,更换TCU。 2. DRI 40-47 :[Channel Coder Timeslot 0(-7) Failure] 0-7时隙信道编码器失败。 M-CELL基站经常出现此类告警,应进行INS或RESET处理,不行再更换TCU900。此告警在GSR4时出现,升级到GSR5可能会消失。 3. DRI 51 :[Baseband Hopping TDM Link Error]基带跳频TDM链路错误。 此告警有几种可能性:TDM-Highway BUS或KSW可能有问题。 DRIM的FEP,CCDSP可能有问题。 此告警须在现场具体测试分析。测试后判定故障点。 此告警在GSR4时出现,升级到GSR5可能会消失 TDM——Time Division Multiplexing时分复用:该总线用于把来自BTS的呼叫与信令数据传送到MSC,反之亦然。可分为两个独立的部分:交换机公共通路&出局公共通路。 交换机公共通路:处理路由到交换机的数据,数据来自外部信源 (通过E1/T1接口)或由GPROC内部产生。 出局公共通路:这是一个被交换的数据,现在被路由出BSC/RXCDR (通过E1/T1接口)或通向内部GPROC。 4. DRI 81:[Transmitter Synthesizer Failure]收发单元故障 此告警为收发单元TCU故障,故障原因有可能为: -接收Calibration频点丢失 -信道盘的CEB故障 -射频电缆连接失败 处理方法:远程ins或reset TCU,告警消失并监测;若告警未消失,更换TCU 5. DRI 86 :[Transmitter Failure]输出功率失败,引起DRI退出服务。状态:

LTEFDD常见告警处理指导

LTE-FDD常见告警处理指导 1.1 SCTP偶联断 1.1.1 告警原因 1.本端或对端偶联参数配置错误; 2.传输链路故障。 1.1.2 处理措施 1.在告警管理系统中,检查告警详细信息中的附加文本字段,查看SCTP偶联 号; 2.在动态管理系统中,运行“查询SCTP”命令,根据SCTP偶联号查询对应 偶联的运行状态,确认SCTP偶联已断; 3.在配置管理系统中,检查SCTP偶联参数配置,确保SCTP偶联的远端地 址、远端端口号与对端的本端地址、本端端口号一致; 4.在诊断测试系统中,进入[IP通道测试]界面,然后在『目的IP』中输入对端 IP地址(即eNodeB的远端地址),进行ping测试,判断本端(eNodeB) 到对端(MME/SGW/邻接eNodeB)的传输地址是否可达; 5.在配置管理系统中,排查基站至对端的静态路由是否配置正确,包括:目的 IP地址、下一跳IP地址等; 6.在配置管理系统中,排查SCTP链路所在的IP层参数是否配置正确,包括: VLAN ID、IP地址、网关IP等参数; 7.如果上述配置数据不正确,修改参数,同步配置数据到基站。检查告警是否 清除,如果告警仍未消除,联系传输人员排查传输链路问题; 1.2 S1断链告警 1.2.1 告警原因 1.SCTP偶联断。 2.S1AP建立失败(协商失败或基站无小区)。 1.2.2 处理措施 1.检查告警详细信息中的附加文本字段,是否SCTP偶联断,如果是,参照 “SCTP偶联断”告警的处理措施进行排查; 2.检查告警详细信息中的附加文本字段,是否S1AP建立失败。如果是,在配 置管理系统中检查基站是否配置小区,S1配置参数是否有效; (1)检查MCC、MNC是否配置正确,必须按照运营商提供的数据规划 来配置MCC、MNC,由于EPC可能同时和不同E-UTRAN系统 对接,因此eNodeB侧配置的MCC、MNC必须在EPC侧也配置 了,否则会导致S1AP层信令交互失败、S1断链(此时SCTP链 路是通的); (2)检查TAC是否配置正确;并与核心网侧人员确认EPC是否已相应 配置了基站的TAC参数。若eNodeB侧和EPC侧配置的TAC参 数不一致,则会导致S1断链; (3)检查eNodeB标识(eNBID)是否配置正确,若整网存在eNodeB 标识(eNBID)冲突的情况,则会导致S1链路闪断;

运维管理系统方案

运维管理系统方案 概述 伴随着企事业网络规模的不断扩大,企事业服务器的增多,企事业管理的信息化,企事业网络管理也变的越来越重要。一旦网络、服务器、数据库、各种应用出现问题,常常会给企事业造成很大的损失。怎样能7x24小时检测网络系统的运行情况,避免各种故障的发生,改进传统的网络管理方式来适企事业信息化发展的需要? 因此,运维管理系统就有他的必要性。一个完备的运维管理系统能够提供7x24小时检测网络、服务器、数据库、各种应用系统,及时发现将要出现的问题,并通过短信、Email、声音报告给运维管理人员。运维管理人员就可以及时排除故障,避免造成重大损失。 运维管理系统的功能: ?故障发现与警报; ?记录日常运维日志信息; ?服务器故障统计; ?服务器软硬件信息统计; ?服务进程管理; ?将数据信息存储到数据库,并使用图形方式直观的展示出来; ?权限、密码管理; ?将数据生成报表。 运维管理系统的特点: ?邮件和短信实时故障报警; ?B/S结构,能够通过web对远程服务器下达指令; ?监控服务器和被监控服务器之间通过python socket来发送信息; ?统计日常故障处理,以便下次出现同样故障时能够更快的解决问题; ?实现自动化管理和自动化监控; ?安全管理服务器性能; ?操作流程统计与管理。

系统结构 运维管理系统采用B/S构架,运维管理人员随时随地可以对服务器进行管理、配置及故障处理。它是将部署在同一个局域网内的所有服务器统一管理,服务器之间的信息通讯、指令发送、运维管理都通过python来实现。监控服务器端负责采集、统计和分析数据,在数据出现异常时发送报警信息到管理员的email、手机中,并将错误日志存储到数据库中。 运维管理系统主要通过LAMP服务器、python编程、snmp和shell编程来实现。在被监控端安装python服务,并在被监控服务器上部署python程序和shell脚本用于接受监控服务器端指令、信息采集并发送会监控服务器端。监控服务器端部署python程序和LAMP服务器,用于发送指令、接受数据信息、存储数据、统计数据以及异常报警。 运维管理人员日常通过web浏览器远程登录监控管理系统,检测各被监控服务器的运行状态、服务状态、防火墙配置、进程信息、操作日志等信息。在出现异常时,通过运维系统可以查看到具体的异常服务器、进程等信息,并根据这些信息来处理异常。

TD-LTE(4G)站点华为设备常见故障告警处理

FAQ-TD站点常见故障告警处理 一、射频单元RRU类告警 (2) 1.1、射频单元驻波告警 (2) 1.2、射频单元通道异常告警 (2) 1.3、射频单元校准通道异常告警 (3) 1.4、射频单元通道幅相一致性告警 (3) 1.5、射频单元发射通道增益异常告警 (4) 1.6、射频单元下行输出功率异常告警 (4) 1.7、射频单元硬件故障告警 (4) 1.8、射频单元时钟异常告警 (4) 1.9、射频单元光接口性能恶化告警 (5) 1.10、 BBU连接的射频单元交流掉电告警 (5) 1.11、射频单元配置但不可用告警 (5) 二、基带单元BBU类告警 (6) 2.1、BBU IR光模块收发异常告警 (6) 2.2、BBU IR接口异常告警 (6) 2.3、BBU IR光接口性能恶化告警 (7) 2.4、光模块混插告警 (7) 2.5、单板心跳检测失败告警 (8) 2.6、单板硬件故障告警 (8) 2.7、单板温度异常告警 (8) 2.8、单板时钟输入异常告警 (9) 2.9、BBU单板维护链路异常告警 (9) 三、GPS类告警 (9) 3.1、星卡天线故障告警 (9) 3.2、时钟参考源异常告警 (10) 3.3、系统时钟失锁告警 (11) 3.4、星卡维护链路异常告警 (11)

3.5、星卡时钟输出异常告警 (11) 一、射频单元RRU类告警 1.1、射频单元驻波告警 告警影响:射频单元RRU发射通道的天馈接口驻波超过了设置的驻波告警门限,对于单通道RRU,该RRU的覆盖区域的业务会中断; 对于多通道RRU,发射功率下降,小区覆盖减小。 可能原因与处理建议: 1)DSP RRUPARA查询射频单元的驻波值与驻波告警门限 2)用负载堵住告警端口,告警恢复,则排查RRU故障,否则更换RRU 3)检查天馈接口的馈缆接头是否拧紧或进水 4)尝试更换或倒换馈线,重启RRU,观察告警是否恢复 5)检查对端天线、合路器是否正常,如故障则予以更换 小结:上站处理前建议携带堵头或小天线、RRU馈线及接头等,定位问题时需要用到 1.2、射频单元通道异常告警 告警影响:下行通道或者上行通道故障,影响小区边缘处的用户接入成功率和边缘处HSDPA用户的速率 可能原因与处理建议: 1)跟网管确认是否存在“射频单元驻波告警”、“射频单元通道异常告警”,如有,则先处理该告警//////驻波导致通道异常 2)执行MML命令RST RRU,远程复位射频单元 3)近端检查故障通道与天线的连接 4)将故障通道和无故障通道馈线调换,如果告警跟随馈线倒换,则判断是馈线问题,更换故障通道馈线 5)如果通道馈线调换后告警没有变化,则判断是RRU问题,更换故障RRU

IT运维信息安全方案

8.3I T运维信息安全解决方案 随着信息安全管理体系和技术体系在企业领域的信息安全建设中不断推进,安全运维占信息系统生命周期70% - 80%的信息,并且安全运维体系的建设已经越来越被广大用户重视。尤其是随着信息系统建设工作从大规模建设阶段逐步转型到“建设和运维”并举的发展阶段,运维人员需要管理越来越庞大的IT系统这样的情况下,信息安全运维体系的建设已经被提到了一个空前的高度上。它不仅单单是一个体系的建设,更是IT系统管理中的夯实基础。 运维服务的发展趋势对于企业的安全运维服务管理的发展,通常可以将其分为混乱阶段、被动阶段、主动阶段、服务阶段和价值阶段这五个阶段。 1、在混乱阶段:运维服务没有建立综合的支持中心,也没有用户通知机制; 2、在被动阶段:运维服务开始关注事件的发生和解决,也开始关注信息资产,拥有了统一的运维控制台和故障记录和备份机制; 3、在主动阶段:运维服务建立了安全运行的定义,并将系统性能,问题管理、可用性管理、自动化与工作调度作为重点; 4、在服务阶段,运维服务工作中已经可以支持任务计划和服务级别管理; 5、在价值阶段,运维服务实现了性能、安全和核心几大应用的紧密结合,体现其价值所在。

安全的概念 信息安全的概念在二十世纪经历了一个漫长的历史阶段,90年代以来得到了深化。进入21世纪后,随着信息技术的不断发展,信息安全问题也日显突出。如何确保信息系统的安全已经成为了全社会关注的问题。国际上对于信息安全问题的研究起步较早,投入力度大,已取得了许多成果,并得以推广应用。中国目前也已有一批专门从事信息安全基础研究、技术开发与技术服务工作的研究机构与高科技企业,形成了中国信息安全产业的雏形。 关于信息安全的定义也有很多,国内学者与国外学者、不同的社会组织也给出了不同的定义。 ?国内学者的定义:“信息安全保密内容分为:实体安全、运行安全、数据安全和管理安全四个方面。” ?我国“计算机信息系统安全专用产品分类原则”中的定义是:“涉及实体安全、运行安全和信息安全三个方面。” ?我国相关立法给出的定义是:“保障计算机及其相关的和配套的设备、设施(网络)的安全,运行环境的安全,保障信息安全,保障计算机功能的正常发挥,以维护计算机信息系统的安全”。这里面涉及了物理安全、运行安全与信息安全三个层面。 ?国家信息安全重点实验室给出的定义是:“信息安全涉及到信息的机密性、完整性、可用性、可控性。综合起来说,就是要保障电子信息的有效性。”

火灾自动报警等六大系统维保常见故障原因及处理方法

火灾自动报警等六大系统维保常见故障原因及处理方法 2016-06-29当宁消防网 一、火灾自动报警系统 1、系统组成 (1)触发装置:火灾探测器,手动火灾报警按钮 (2)火灾报警装置:火灾报警控制器,火灾显示盘 (3)警报装置:声光警报器,警铃等 (4)电源:主电源,备用电源 (5)联动装置 2、系统完成的主要功能 火灾发生时,探测器将火灾信号传输到报警控制器,通过声光信号表现出来,并在控制面板上显示火灾发生的部位,从而达到预报火警的目的。同时,也可以通过手动报警按钮来完成手动报警的功能。 3、系统容易出现的问题、产生的原因、简单的处理方法 (1)探测器误报警,探测器故障报警。 原因:环境湿度过大,风速过大,粉尘过大,机械震动,探测器使用时间过长,器件参数下降等。 处理方法:根据安装环境选择适当的灵敏度的探测器,安装时应避开风口及风速较大的通道,定期检查,根据情况清洁和更换探测器。 (2)手动按钮误报警,手动按钮故障报警。 原因:按钮使用时间过长,参数下降,或按钮人为损坏。 处理方法:定期检查,损坏的及时更换,以免影响系统运行。 (3)报警控制器故障。 原因:机械本身器件损坏报故障或外接探测器、手动按钮问题引起报警控制器报故障、报火警。 处理方法:用表或自身诊断程序判断检查机器本身,排除故障,或按(1)(2)处理方法,检查故障是否由外界引起。 (4)线路故障。 原因:绝缘层损坏,接头松动,环境湿度过大,造成绝缘下降。 处理方法:用表检查绝缘程度,检查接头情况,接线时彩用焊接、塑封等工艺。

二、消火栓系统 1、系统组成消防泵、稳压泵(或稳压罐)、消火栓箱、消火栓阀门、接口水枪、水带、消火栓报警按钮、消火栓系统控制柜。 2、系统完成的主要功能消火栓系统管道中充满有压力的水,如系统有微量泄漏,可以靠稳压泵或稳压罐来保持系统的水和压力。当火灾时,首先打开消火栓箱,按要求接好接口、水带,将水枪对准火源,打开消火栓阀门,水枪立即有水喷出,按下消火栓按钮时,通过消火栓启动消防泵向管道中供水。 3、系统容易出现的问题、产生的原因、简单的处理方法 (1)打开消火栓阀门无水。 原因:可能管道中有泄漏点,使管道无水,且压力表损坏,稳压系统不起作用。 处理方法:检查泄漏点,压力表,修复或安上稳压装置,保证消火栓有水。 (2)按下手动按钮,不能联动启动消防泵。 原因:手动按钮接线松动,按钮本身损坏,联动控制柜本身故障,消防泵启动柜故障或连接松动,消防泵本身故障。 处理方法:检查各设备接线、设备本身器件,检查泵本身电气、机构部分有无故障并进行排除。 三、自动喷水灭火系统 1、系统组成闭式喷头、水流指示器、湿式报警阀、压力开关、稳压泵、喷淋泵、喷淋控制柜。 2、系统完成的主要功能系统处于正常工作状态时,管道内有一定压力的水,当有火灾发生时,火场温度达到闭式喷头的温度时,玻璃泡破碎,喷头喷水,管道中的水由静态变为动态,水流指示器动作,信号传输到消防中心的消防控制柜上报警,当湿 式报警装置报警,压力开关动作后,通过控制柜启动喷淋泵为管道供水,完成系统 的灭火功能。 3、系统容易出现的问题、产生的原因、简单的处理方法 (1)稳压装置频繁启动。 原因:主要为湿式装置前端有泄漏,还会有水暖件或连接处泄漏、闭式喷头泄漏、末端泄放装置没有关好。 处理办法:检查各水暖件、喷头和末端泄放装置,找出泄漏点进行处理。 (2)水流指示器在水流动作后不报信号。 原因:除电气线路及端子压线问题外,主要是水流指示器本身问题,包括浆片不动、浆片损坏,微动开关损坏或干簧管触点烧毁、或永久性磁铁不起作用。

LTE常见故障总结

L TE-FZHA(RL25)常见故障总结 目录 LTE-FZHA(RL25)常见故障总结 (1) 1.System module failure (0010) (3) 2.BTS reference clock missing (1898) (3) 3.Configuration error: Unit initialization failure (0012) (3) 4.Configuration error: Not enough HW for LCR (1868) (4) 5.Configuration error: Power level not supported (4008) (4) 6.Cell configuration data distribution failed (6253) (4) 7.Failure in optical RP3 interface (4064) (5) 8.Failure in optical RP3 interface (0010) (5) 9.Baseband bus failure (3020,1906) (5) 10.RF module failure (6259,1911、1711、1712) (5) 11.Cell power failure (4090) (6) 12.GPS Receiver alarm: Control Interface not available (4011) (6) 13.X2 interface setup failure(6304) (6) 14.Transport layer connection failure in X2 interface (6) 15.Failure in replaceable baseband unit (7) 16.Temperature alarm(0002) (7) 17.VSWR(1838) (7) 18.Failure in optical RP3 interface (2004) (8) 19.GPS时钟盒闪断,时钟信号不正常,无法识别RRU (8) 20.Failure in optical RP3 interface(2000) (8) 21.光纤交叉连接 (8) 22.基站始终无法建立S1连接,只到configed状态 (9) 23.GPS时钟盒闪断,时钟信号不正常,无法识别RRU (9) 24.某一个小区的RRU无法识别 (9) 25.BBU版本无法识别 (10) 26.校准初步排查 (10) 27.本地IP地址和路由正常,ping不通MME和网关 (11) 28.TRS文件始终无法生效 (11) 29.三种疑难告警 (12) 30.远程ping不通基站 (12) 31.风扇告警 (12) 32.BTSlog有link消息,但是pinger始终不亮 (12) 33.驻波问题 (13) 34.pinger正常,但是SM里小区显示橙黄色告警 (13) 35.几个特列 (13) 36.FOSI 和FOSN的光功率范围 (13) 37.不同频段RRU类型 (13)

中国铁塔动环常见告警处理指导手册

中国铁塔动环常见告警处理指导手册一、FSU离线告警 告警名称:FSU离线; 告警解释:FSU和铁塔集团平台连接通讯中断; 原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)VPN服务器连接不上;7)SIM卡被盗、欠费或故障。平台处理方法:查询历史告警记录,如频繁离线或长时间离线,需现场检查。 现场处理方法: 第一步检查供电: 1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电; 2)现场检查FSU指示灯不亮设备没有供电。 原因分析:FSU供电异常。 解决方案: 1)检查整个基站是否停电,如停电则通知相关人员取电; 2)检查FSU供电空开是否跳闸及通电线路是否正常。 第二步检查无线模块: 检查无线模块指示灯都不亮或都常亮。

原因分析:无线模块供电异常或无线模块故障。 解决方案: 1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。 2)确认供电正常,则更换无线模块进行测试。 下站建议:下站时建议随身带上一套可以成功拨号的无线网卡和SIM 卡,下站的时候作对比验证,快速确认是SIM卡问题,还是无线模块问题。 第三步FSU检查 通过EISUConfig软件登陆FSU设备,点击设备诊断管理。 1)信号强度弱:通过设备软件登录设备,如信号强度小于15。

解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部) 2)铁塔VPN网络连接异常:铁塔VPN网络提示连接异常 3)铁塔网管未注册:铁塔网管提示连接异常(正常显示连接正常)解决方案: 确认总部平台正常,重启FSU(等待程序连接)。如重启后未恢复,联系厂家专业人员。 平台恢复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。 二、电源配套告警 2.1开关电源类告警: 2.1.1开关电源通信状态告警 告警名称:开关电源通信状态告警; 告警解释:开关电源和FSU之间的通讯中断; 原因分析:开关电源和FSU之间的通讯中断 平台处理方法:无 现场处理方法:检查开关电源屏幕是否显示正常,和FSU的监控线连接是否正常。

爱立信常见基站故障告警处理

基站常见故障处理 CF EC10(Main fail (External Power Source Fail)):外部电源故障 处理步骤: 1.检查出现故障小区的PSU是否工作正常:检查指示灯是否正常; 2.检查电源链路,包括电缆、熔丝空开等; 3.检查IDB中配置的电源系统是否和实际使用的电源系统一致; 4.检查交流电源是否连接正确; 5.更换PSU。 HW and IDB inconsistency(硬件和IDB数据不一致): 处理步骤: 1.检查硬件的频段、配置数量是否和IDB的配置数据相一致。 2.如发现数据不同,需要重新传建IDB或者在IDB中进行修改。 Climate sensor fault, System voltage sensor fault,A/D converter fault告警 处理步骤: 1.检查出现告警小区的PSU、ECU是否工作正常。 2.如PSU出现问题,则更换。(参照例三) 3.如ECU出现问题,则更换。 4.将出现告警的ECU电源关闭,更换ECU。 5.更换后,将其电源开启。 TRX 1A/13 (RF loop test fault): RF 环路测试故障 处理步骤:

1,检查TX电缆与TRU是否正确连接。 2,对TRU进行复位或者断电后重新加电,看是否能够恢复。 3,讲该载频进行退出/进入服务的操作,或者将该载频对应的TG退服后重新进入,看是否可以恢复。 4,若经过上述操作后,故障仍然存在,或者以后再次出现,建议更换该TRU。 TRX 1A/21 (Internal configuration failed): 内部配置失败 处理步骤: 1,检查CDU电源是否正常。 2,检查IDB中CDU配置是否正确。 3,检查TRU是否安装正确,与Y-link线连接是否正确。 4,检查IDB中TRU配置是否正确。 5,检查CDU-BUS线包括背板连线。 6,将CDU进行断电/加电操作。 7,重启DXU,CDU,TRU。 8,更换TRU。 9,更换CDU。 10,更换CDU-BUS线。 TRX 1A 11(DSP CPU Communication Fault):DSP CPU通信故障处理步骤为: 1,对该TRU进行复位; 2,若复位后无法消除该故障,或者复位后再次出现,更换该TRU。 TX 1B 4(TX Antenna VSWR Limits Exceeded):TX驻波比超限处理步骤如下: 1.在OMT检查IDB里面的VSWR Limits定义的值的大小:

相关主题