搜档网
当前位置:搜档网 › Dell PowerEdge服务器硬件故障排除手册

Dell PowerEdge服务器硬件故障排除手册

Dell  PowerEdge服务器硬件故障排除手册
Dell  PowerEdge服务器硬件故障排除手册

Dell PowerEdge服务器硬件故障排除手册

本文档介绍了物理、固件和软件接口部件,它们提供了系统的必备功能,确保系统能够正常运行。系统前面板和背面板上的物理连接器提供了方便的连接和系统扩展功能。系统固件、应用程序和操作系统监测系统和组件的状态,并在出现问题时发出警报。以下指示灯和信息均可以报告系统情况:

前面板或背面板指示灯

系统信息

警告信息

诊断信息

警报信息

本节介绍了各种类型的信息,列出了可能的原因,并提供了解决信息所指示问题的步骤。本节说明了系统指示灯和部件。

您可能需要的其它信息

警告:《产品信息指南》提供了重要的安全与管制信息。保修信息可能包括在本说明文件中,也可能作为单独的说明文件提供。

机架解决方案附带的《机架安装指南》或《机架安装说明》介绍了如何将系统安装到机架中。《使用入门指南》简要介绍了系统功能、如何设置系统以及技术规格。

系统附带的CD 提供了用于配置和管理系统的说明文件和工具。

系统管理软件说明文件介绍了软件的功能、要求、安装和基本操作。

操作系统说明文件介绍了如何安装(如果有必要)、配置和使用操作系统软件。

单独购买的任何组件所附带的说明文件提供了有关配置和安装这些选件的信息。

系统有时会附带更新,用于介绍对系统、软件和/或说明文件的更改。

注:请经常查看https://www.sodocs.net/doc/f92360991.html, 是否有更新,并首先阅读这些更新,因为这些更新通常会替代其它说明文件中的信息。

系统可能附带版本注释或自述文件,提供系统或说明文件的最新更新,或者专供有经验的用户或技术人员使用的高级技术参考资料。

在启动过程中访问系统部件

表 1-1 介绍了在系统启动过程中访问系统部件可能需要输入的击键。如果输入击键之前已开始载入操作系统,请让系统完成引导过程,然后重新启动系统并再试一次。

表1-1. 用于访问系统功能的击键

前面板部件和指示灯

表 1-1 显示了位于系统前面板上的控件、指示灯、连接器和驱动器。图1-1. 前面板部件和指示灯

硬盘驱动器指示灯代码

硬盘驱动器托盘带有两个指示灯—驱动器活动指示灯和驱动器状态指示灯。图1-2. 硬盘驱动器指示灯

活动 LED 指示硬盘驱动器和存储控制器之间的命令活动。

状态 LED 是一个双色(绿色/琥珀色)LED ,用于指示插槽中驱动器的状态。LED 的颜色和闪烁速率指示驱动器的状态,如表 1-2 中所示。 表 1-2. 硬盘驱动器指示灯

在 RAID 配置中,通过驱动器状态指示灯的亮起可以指示驱动器的状态。

注:对于非 RAID 配置,只有驱动器活动指示灯处于活动状态。驱动器状态指示灯不亮。

表 1-2 列出了 RAID 硬盘驱动器的驱动器指示灯显示方式。系统中发生的驱动器事件不同,显示方式也不同。例如,硬盘驱动器出现故障时,显示方式为“驱动器故障”。选择要卸下的驱动器后,显示方式为“准备卸下驱动器”,然后为“准备插入或卸下驱动器”。安装备用驱动

器后,显示方式为“准备运行驱动器”,然后为“驱动器联机”。

连接外部设备

将外部设备连接至系统时,请遵循以下原则:

大多数设备必须连接至特定连接器并且必须安装设备驱动程序,才能正常运行。(您的操作系统软件或设备本身通常会附带设备驱动程序。)有关具体的安装和配置说明,请参阅设备附带的说明文件。

请始终在系统和设备电源处于关闭状态时连接外部设备。然后,先打开所有外部设备,再打开系统(除非设备的说明文件另有说明)。

有关各个连接器的信息,请参阅跳线和连接器。有关启用、禁用以及配置I/O 端口和连接器的信息,请参阅使用系统设置程序。

背面板部件和指示灯

图 1-3 显示了位于系统背面板上的控件、指示灯和连接器。

图1-3. 背面板部件和指示灯

连接外部设备

将外部设备连接至系统时,请遵循以下原则:

大多数设备必须连接至特定连接器并且必须安装设备驱动程序,才能正常运行。(您的操作系统软件或设备本身通常会附带设备驱动程序。)有关具体的安装和配置说明,请参阅设备附带的说明文件。

请始终在系统和设备电源处于关闭状态时连接外部设备。然后,先打开所有外部设备,再打

开系统(除非设备的说明文件另有说明)。

有关各个连接器的信息,请参阅跳线和连接器。有关启用、禁用以及配置I/O 端口和连接器的信息,请参阅使用系统设置程序。

电源指示灯代码

前面板上的电源按钮控制输入系统电源设备的电源。打开系统电源时,电源指示灯将呈绿色亮起。

冗余电源设备上的指示灯显示了是否存在电源或者是否出现了电源故障(请参见图 1-4)。表 1-3 列出了电源设备指示灯代码。

图1-4. 冗余电源设备指示灯

表1-3. 冗余电源设备指示灯

NIC 指示

每个NIC 有两个指示灯,用于提供有关网络活动和链路状态的信息。请参见图 1-5。表 1-4 列出了NIC 指示灯。

图1-5. NIC 指示灯

LCD 状态信息

系统的控制面板 LCD 可以提供状态信息,以表明系统何时运行正常或何时需要注意。 LCD 呈蓝色亮起表示系统运行正常,呈琥珀色亮起表示出现错误。LCD 滚动显示信息,包括后跟描述性文本的状态代码。表 1-5 列出了可能出现的 LCD 状态信息和导致生成每条信息的可能原因。LCD 信息是指系统事件日志 (SEL) 中记录的事件。有关 SEL 和配置系统管理设置的信息,请参阅系统管理软件说明文件。

警告:只有经过培训的维修技术人员才能卸下主机盖并拆装任何内部组件。有关安全预防措施、拆装计算机内部组件和防止静电损害的完整信息,请参阅《产品信息指南》。

注:如果系统无法引导,按下“系统 ID”按钮至少五秒钟,直至 LCD 上显示错误代码。记下该代码,然后请参阅获得帮助。

解决LCD 状态信息所描述的问题

LCD 上状态信息的代码和文本(请参见表 1-5)通常可以精确指明故障情况,因此更正起来

十分方便。例如,如果显示代码 E1418 CPU_1_Presence ,您即可知道插槽 1 中没有安装微处理器。 相比之下,如果发生多个相关错误,您也许能够确定问题所在。例如,如果收到一系列信息,指示多种电压故障,您可能会确定问题出自电源设备故障。 删除 LCD 状态信息

对于与传感器有关的故障,例如温度、电压、风扇故障等,当传感器恢复至正常状态后,将自动删除 LCD 信息。例如,如果某组件的温度超出范围,LCD 将显示该故障,温度恢复至允许范围后,该信息将从 LCD 中删除。对于其它故障,必须采取措施才能将信息从显示屏中删除:

清除 SEL — 您可以远程执行此任务,但是系统的事件历史记录将丢失。

关闭电源再打开 — 关闭系统并断开其与电源插座的连接;等待大约十秒钟,重新连接电源电缆,然后重新启动系统。

任何一项措施都将删除故障信息,并使状态指示灯和 LCD 颜色恢复至正常状态。在以下情况下,将重新显示信息:

传感器恢复至正常状态后再次发生故障,从而生成了新的 SEL 条目。 系统已重设,并检测到新的错误事件。

记录了与同一显示条目对应的另外一个故障。

系统信息

屏幕上将显示系统信息,通知您系统可能出现的问题。表 1-6 列出了可能出现的系统信息以及对每条信息的简要说明。

注:如果收到的系统信息未在表 1-6 中列出,请参阅信息出现时所运行的应用程序的说明文件或操作系统的说明文件,以了解对信息的解释和建议采取的措施。

警告:只有经过培训的维修技术人员才能卸下主机盖并拆装任何内部组件。有关安全预防措施、拆装计算机内部组件和防止静电损害的完整信息,请参阅《产品信息指南》。

DELL服务器错误代码

12G DELL服务器LCD信息代码 DELL服务器LCD信息代码的意思: E1114 Temp Ambient 系统周围环境温度超出允许范围。 E1116 Temp Memory 内存已超过允许温度,系统已将其禁用以防止损坏组件。E1210 CMOS Batt 缺少 CMOS 电池,或电压超出允许范围。 E1211 ROMB Batt RAID 电池丢失、损坏或因温度问题而无法再充电。 E12nn XX PwrGd 指定的稳压器出现故障。 E1229 CPU # VCORE 处理器 # VCORE 稳压器出现故障。 E122B 0.9V Over Voltage 0.9 V 稳压器电压已超过电压允许范围 E122C CPU Power Fault 启动处理器稳压器之后,检测到稳压器故障 E1310 RPM Fan ## 指定的冷却风扇的 RPM 超出允许的运行范围。 E1410 CPU # IERR 指定的微处理器正在报告系统错误。 E1414 CPU # Thermtrip 指定的微处理器超出了允许的温度范围并已停止运行。E1418 CPU # Presence 指定的处理器丢失或损坏,系统的配置不受支持。 E141C CPU Mismatch 处理器的配置不受 Dell 支持。 E141F CPU Protocol

系统 BIOS 已报告处理器协议错误。 E1420 CPU Bus PERR 系统 BIOS 已报告处理器总线奇偶校验错误。 E1421 CPU Init 系统 BIOS 已报告处理器初始化错误。 E1422 CPU Machine Chk 系统 BIOS 已报告机器检查错误。 E1618 PS # Predictive 电源设备电压超出允许范围;指定的电源设备安装错误或出现故障。 E161C PS # Input Lost 指定的电源设备的电源不可用,或超出了允许范围。 E1620 PS # Input Range 指定的电源设备的电源不可用,或超出了允许范围。 E1710 I/O Channel Chk 系统 BIOS 已报告 I/O 通道检查错误。 E1711 PCI PERR B## D## F## PCI PERR Slot # 系统 BIOS 已报告组件的 PCI 奇偶校验错误,该组件所在的 PCI 配置空间位于总线 ##,设备 ##,功能##。 系统 BIOS 已报告组件的 PCI 奇偶校验错误,该组件位于 PCI 插槽 #。 E1712 PCI SERR B## D## F## PCI SERR Slot # 系统 BIOS 已报告组件的 PCI 系统错误,该组件所在的 PCI 配置空间位于总线 ##,设备 ##,功能 ##。系统 BIOS 已报告组件的 PCI 系统错误,该组件位于插槽 #。 E1714 Unknown Err 系统 BIOS 已确定系统中存在错误,但无法确定错误来源。 E171F PCIE Fatal Err B## D## F## PCIE Fatal Err Slot # 系统 BIOS 已报告组件的 PCIe 致命错误,该组件所在的 PCI 配置空间位于总线 ##,设备 ##,功能 ##。系统 BIOS 已报告组件的 PCIe 致命错误,该组件位于插槽 #。 卸下并重置 PCI 扩充卡。如果问题仍然存在,请参阅排除扩充卡故障。 E1913 CPU & Firmware Mismatch

IT运维手册故障及处理

IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网

①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。

DELL服务器报错代码大全

DELL服务器LCD信息代码 DELL服务器LCD信息代码的意思: E1114 Temp Ambient 系统周围环境温度超出允许范围。 E1116 Temp Memory 内存已超过允许温度,系统已将其禁用以防止损坏组件。 E1210 CMOS Batt 缺少 CMOS 电池,或电压超出允许范围。 E1211 ROMB Batt RAID 电池丢失、损坏或因温度问题而无法再充电。 E12nn XX PwrGd 指定的稳压器出现故障。 E1229 CPU # VCORE 处理器 # VCORE 稳压器出现故障。 E122B 0.9V Over Voltage 0.9 V 稳压器电压已超过电压允许范围 E122C CPU Power Fault 启动处理器稳压器之后,检测到稳压器故障 E1310

RPM Fan ## 指定的冷却风扇的 RPM 超出允许的运行范围。 E1410 CPU # IERR 指定的微处理器正在报告系统错误。 E1414 CPU # Thermtrip 指定的微处理器超出了允许的温度范围并已停止运行。E1418 CPU # Presence 指定的处理器丢失或损坏,系统的配置不受支持。 E141C CPU Mismatch 处理器的配置不受 Dell 支持。 E141F CPU Protocol 系统 BIOS 已报告处理器协议错误。 E1420 CPU Bus PERR 系统 BIOS 已报告处理器总线奇偶校验错误。 E1421 CPU Init 系统 BIOS 已报告处理器初始化错误。 E1422 CPU Machine Chk 系统 BIOS 已报告机器检查错误。 E1618 PS # Predictive

思科故障排除手册

故障处理方法 一、网络的复杂性 一般网络包括路由、拨号、交换、视频、W AN(ISDN、帧中继、ATM、…)、LAN、VLAN、… 二、故障处理模型 1、界定问题(Define the Problem) 详细而精确地描述故障的症状和潜在的原因 2、收集详细信息(Gather Facts)R>信息来源:关键用户、网络管理系统、路由器/交换机1)识别症状: 2)重现故障:校验故障依然存在 3)调查故障频率: 4)确定故障的范围:有三种方法建立故障范围 由外到内故障处理(Outside-In Troubleshooting):通常适用于有多个主机不能连接到一台服务器或服务器集 由内到外故障处理(Inside-Out Troubleshooting): 半分故障处理(Divide-by-Half Troubleshooting) 3、考虑可能情形(Consider Possibilities)考虑引起故障的可能原因 4、建立一份行动计划(Create the Action Plan) 5、部署行动计划(Implement the Action Plan) 用于纠正网络故障原因。从最象故障源处,想出处理方法每完成一个步骤,检查故障是否解决 6、观察行动计划执行结果(Observe Results) 7、如有行动计划不能解决问题,重复上述过程(Iterate as Needed) 三、记录所做修改 在通过行动计划解决问题后,建议把记录作为故障处理的一部分,记录所有的配置修改。第2章网络文档 一、网络基线 解决网络问题的最简单途径是把当前配置和以前的配置相比较。 基线文档由不同的网络和系统文档组成,它包括: 网络配置表 网络拓扑图 ES网络配置表 ES网络拓扑图 创建网络的注意事项: 1)确定文档覆盖的范围; 2)保持一致:收集网络中所有设备的相同信息; 3)明确目标:了解文档的用途; 4)文档易于使用和访问; 5)及时维护更新文档。 二、网络配置表 网络配置表的通常目标是提供网络中使用的硬件和软件组成的列表,其组成有: 分级项目 杂项信息设备名、设备型号、CPU类型、FLASH、DRAM、接口描述、用户名口令 第1层介质类型、速率、双工模式、接口号、连接插座或端口 第2层MAC地址、STP状态、STP根桥、速端口信息、VLAN、Etherchannel配置、封装、

惠普服务器维护手册

. HP PC服务器维护手册 目录

第1章硬件状态指示灯 (3) 1.1HP P RO L IANT DL580G7指示灯状态: (3) 1.2HP P RO L IANT DL380G7指示灯状态: (13) 1.3HP P RO L IANT DL980G7指示灯状态 (23) 第2章常见硬件部件故障处理 (34) 2.1硬盘故障的处理方法 (34) 2.2RAID卡故障的处理方法 (35)

第1章硬件状态指示灯 1.1 HP ProLiant DL580 G7指示灯状态: Item Description Status 1 UID 开关和指示灯蓝色= 活动状态 蓝色闪烁= 服务器在被远程控制 不亮= 处于非活动状态 2 建康指示灯绿色= 正常(系统在正常运行) 橙色闪烁= 系统降级 红色闪烁= 系统健康出现严重问题 不亮= 正常(系统关闭) 3 NIC 1 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 4 NIC 2 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态

不亮= 没有网络联接 5 NIC 3 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 6 NIC 4 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 7 加电/ 待机按钮以及指示灯橙色= 有交流电并且服务器处于待机 状态 绿色= 有交流电并处于开机状态 不亮= 没有交流电源 Item Description Status

网络工程师排除网络故障手册

第1章故障处理方法 一、网络的复杂性 一般网络包括路由、拨号、交换、视频、WAN(ISDN、帧中继、ATM、…)、LAN、VLAN、… 二、故障处理模型 1、界定问题(Define the Problem) 详细而精确地描述故障的症状和潜在的原因 2、收集详细信息(Gather Facts)R>信息来源:关键用户、网络管理系统、路由器/交换机 1)识别症状: 2)重现故障:校验故障依然存在 3)调查故障频率: 4)确定故障的范围:有三种方法建立故障范围 ? 由外到内故障处理(Outside-In Troubleshooting):通常适用于有多个主机不能连接到一台服务器或服务器集 ? 由内到外故障处理(Inside-Out Troubleshooting): ? 半分故障处理(Divide-by-Half Troubleshooting) 3、考虑可能情形(Consider Possibilities)考虑引起故障的可能原因 4、建立一份行动计划(Create the Action Plan) 5、部署行动计划(Implement the Action Plan) 用于纠正网络故障原因。从最象故障源处,想出处理方法每完成一个步骤,检查故障是否解决 6、观察行动计划执行结果(Observe Results) 7、如有行动计划不能解决问题,重复上述过程(Iterate as Needed) 三、记录所做修改 在通过行动计划解决问题后,建议把记录作为故障处理的一部分,记录所有的配置修改。 第2章网络文档 一、网络基线 解决网络问题的最简单途径是把当前配置和以前的配置相比较。 基线文档由不同的网络和系统文档组成,它包括: ? 网络配置表 ? 网络拓扑图 ? ES网络配置表 ? ES网络拓扑图 创建网络的注意事项: 1)确定文档覆盖的范围; 2)保持一致:收集网络中所有设备的相同信息; 3)明确目标:了解文档的用途; 4)文档易于使用和访问; 5)及时维护更新文档。 二、网络配置表 网络配置表的通常目标是提供网络中使用的硬件和软件组成的列表,其组成有: 分级项目 杂项信息设备名、设备型号、CPU类型、FLASH、DRAM、接口描述、用户名口令 第1层介质类型、速率、双工模式、接口号、连接插座或端口 第2层 MAC地址、STP状态、STP根桥、速端口信息、VLAN、Etherchannel配置、封装、中继状态、接口类型、端口安全、VTP状态、VTP模式

HP ProLiant DL系列PC服务器维护手册

HP PC服务器维护手册 (v 20110730)

目录 第1章硬件状态指示灯 (3) 1.1HP P RO L IANT DL580G7指示灯状态: (3) 1.2HP P RO L IANT DL380G7指示灯状态: (13) 1.3HP P RO L IANT DL980G7指示灯状态 (23) 第2章常见硬件部件故障处理 (34) 2.1硬盘故障的处理方法 (34) 2.2RAID卡故障的处理方法 (35)

第1章硬件状态指示灯 1.1 HP ProLiant DL580 G7指示灯状态: ? Item Description Status 1 UID 开关和指示灯蓝色= 活动状态 蓝色闪烁= 服务器在被远程控制 不亮= 处于非活动状态 2 建康指示灯绿色= 正常(系统在正常运行) 橙色闪烁= 系统降级 红色闪烁= 系统健康出现严重问题 不亮= 正常(系统关闭) 3 NIC 1 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 4 NIC 2 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状

态 不亮= 没有网络联接 5 NIC 3 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 6 NIC 4 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 7 加电/ 待机按钮以及指示灯橙色= 有交流电并且服务器处于待机 状态 绿色= 有交流电并处于开机状态 不亮= 没有交流电源

DELL服务器LED错误提示代码大全

DELL服务器LED错误提示代码大全 E1000 Failsafe voltage error. Contact support.(故障保护电压错误。请联络支持人员。)查看系统事件记录以了解严重故障事件。 E1114 Ambient Temp exceeds allowed range.(环境温度超过了许可范围。)环境温度到了超出许可范围的某个点。 E1116 Memory disabled, temp above range. Power cycle AC.(已禁用内存,温度超出范围。请关闭交流电源再打开。)内存已超过许可温度,系统已将其禁用以防止组件损坏。 E1210 Motherboard battery failure. Check battery.(母板电池故障。请检查电池。)CMOS 电池丢失,或电压超出许可范围。 E1211 RAID Controller battery failure. Check battery.(RAID 控制器电池故障。请检查电池。)RAID 电池丢失、损坏或因温度问题而无法再充电。 E1216 3.3V Regulator failure. Reseat PCIe cards.(3.3V

稳压器故障。请重置PCIe 卡。)3.3V 稳压器出现故障。 E1229 CPU # VCORE Regulator failure. Reseat CPU.(CPU # VCORE 稳压器故障。请重置CPU。)特定处理器VCORE 稳压器出现故障。 E122A CPU # VTT Regulator failure. Reseat CPU.(CPU # VTT 稳压器故障。请重置CPU。)特定处理器VTT 稳压器出现故障。 E122C CPU Power Fault. Power cycle AC.(CPU 电源故障。请关闭交流电源再打开。)接通处理器电源时检测到电源故障。 E122D Memory Regulator # Failed. Reseat DIMMs.(内存稳压器# 故障。请重置DIMM。)某个内存稳压器出现故障。 E122E On-board regulator failed. Call support.(机载稳压器故障。请联络支持人员。)某个内置稳压器出现故障。 E1310 Fan ## RPM exceeding range. Check fan.(风扇##

惠普服务器维护管理手册样本

惠普服务器维护管理手册

HP PC服务器维护手册目录

第1章硬件状态指示灯..................................................... 错误!未定义书签。 HP P RO L IANT DL580G7指示灯状态: .................................... 错误!未定义书签。 HP P RO L IANT DL380G7指示灯状态: .................................... 错误!未定义书签。 HP P RO L IANT DL980G7指示灯状态 ...................................... 错误!未定义书签。第2章常见硬件部件故障处理............................................... 错误!未定义书签。 硬盘故障的处理方法................................................. 错误!未定义书签。 RAID卡故障的处理方法 .............................................. 错误!未定义书签。

第1章硬件状态指示灯 1.1HP ProLiant DL580 G7指示灯状态: Item Description Status 1 UID 开关和指示灯蓝色= 活动状态 蓝色闪烁= 服务器在被远程控制 不亮= 处于非活动状态 2 建康指示灯绿色= 正常(系统在正常运行) 橙色闪烁= 系统降级 红色闪烁= 系统健康出现严重问题 不亮= 正常(系统关闭) 3 NIC 1 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 4 NIC 2 链路/ 活动指示灯(针对主板集 绿色= 联接到网络 成) 绿色闪烁= 联接到网络并处于活动状 态 不亮= 没有网络联接 5 NIC 3 链路/ 活动指示灯(针对主板集绿色= 联接到网络

服务器故障排除手册

服务器故障排除手册 相比PC而言,服务器出故障的机率是小多了,但是它出故障造成的损失可也大多了。作为服务器维修人员需要了解一些服务器故障恢复的基本知识,知道在维修时可以做些什么来最快速的解决问题也可以减少故障停机时间。 本文并不是一本服务器故障解决的完全手册,但如果能够认真的按照下面的步骤维修维护,它也许可以解决大多数问题,但当你做完所有的这一切仍不管用时,不用惭愧,去找维修专家吧,可以放心的是,这些维修步骤不会出现大的损害,最坏的情形是“It does not work at all”。 本文主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题。第二部分讲述了一些服务器硬件故障排除的实例。第三部分讲述了一些服务器软件故障排除的实例。 第一部分服务器故障排除的基本原则性问题 一、服务器开机无显示应怎么办 1.检查供电环境,零-火;零-地电压? 2.检查电源指示灯,如果亮,正常吗? 3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗? 4. 是否更换过显示器,更换另一台显示器。 5. 去掉增加内存 6. 去掉增加的CPU 7.去掉增加的第三方I/O卡 8. 检查内存和CPU 插的是否牢靠 9. Clear CMOS 10. 更换主要备件,如系统板,内存和CPU 二、服务器故障排错的基本原则是什么 1. 尽量恢复系统缺省配置 a:硬件配置:去除第三方厂商备件和非标配备件; b:资源配置:清除CMOS,恢复资源初始配置; c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序; d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗? 2. 从基本到复杂 a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。 b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。 c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。 3. 交换对比 a:在最大可能相同的条件下,交换操作简单效果明显的部件; b: 交换NOS载体,既交换软件环境; c:交换硬件,既交换硬件环境;

dell戴尔poweredger720服务器错误代码二

Dell/戴尔 PowerEdge R720 服务器错误代码二 本空间免费为已购买客户提供终身售前以及售后技术支持 140 错误代码消息信息 MEM0701消息 Correctable memory error rate exceeded for .( 的可纠正内存错误比率超限。)详细信息内存可能无法操作。这是未来可能发生的不可纠正错误的早期迹象。操作重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM0702消息 Correctable memory error rate exceeded for .( 的可纠正内存错误比率超限。) LCD 消息 Correctable memory error rate exceeded for . Re-seat memory.( 的可纠正内存错误比率超限。重新安装内存。)详细信息内存可能无法操作。这是未来可能发生的不可纠正错误的早期迹象。操作重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM1205消息 Memory mirror redundancy is lost. Check memory device at location(s) .(内存镜像冗余已丢失。检查位置 的内存设备。)LCD 消息 Memory mirror lost on . Power cycle system.( 的内存镜像丢失。将系统关闭后再打开。)详细信息内存可能安装不正确,配置错误,或者发生故障。操作检查内存配置。重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM1208消息 Memory spare redundancy is lost. Check memory device at location .(内存备用冗余已丢失。检查位置 的内存设备。)LCD 消息 Memory spare lost on . Power cycle system.( 内存备份丢失。将系统关闭后再打开。)详细信息内存备份不再可用。操作重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM8000消息 Correctable memory error logging disabled for a memory device at location .(位置 的内存设备上可纠正内存错误日志已禁用。)LCD 消息 SBE log disabled on . Re-seat memory.( 上 SBE 日志已禁用。重新安装内存。)详细信息错误将被纠正但不再记录。操作检查系统日志排查内存异常。重新安装位于 处的内存。 PCI1302消息 A bus time-out was detected on a component at bus device function .(总线 设备 功能 的组件上检测到

电脑操作简易故障排除手册

电脑操作及简易故障排除手册 我们在使用电脑的过程中,经常会遇到这样或是那样的问题,令我们束手无策,即耽误了正常的工作,又破坏了良好的心情。其实,只要正确使用,在使用中总结,不断摸索去你电脑的“脾性”,便会找到一些排除的方法与心得。故初步编写此手册,以指导大家日常正确使用,减少故障,并对简易故障能进行自我排除,以提高工作效率,希望大家在使用中多提宝意见,以便不断修订和完善本手册。 第一节:如何正确操作电脑及周边设备: 1、开机时必须“先外设,后主机”,即先开插座电源,再开显示器、打印机等外围设备,最后在开主机;关机时相反“先主机,后外设”,即关闭所有运行程序后,通过开始菜单软关机,完全关机后,再关显示器、打印机等外设。 2、插拔所有外设数据线时,均应在断电情况下进行,防止IC集成电路损坏。 3、在异常情况下需重启动时,应采取软开机,按“复位”开关启动,若实需硬开、关机的,按住主机电源开关10S钟以上,等开、关机灯有反应后再放手。 4、在系统非正常退出或意外断电,应尽快进行硬盘扫描,及时修复错误,因此情况下,硬盘某此簇链接会丢失,给系统造成潜在危险,不及时修复,会导致某此程序紊乱,甚至危及系统的稳定运行,所以开机的时候,应让系统自动走程序,不要按回车键,强制启动,应使电脑自动识别进入修复程序。 5、不能野蛮操作,在电脑故障时,应心平气和,去找原因,进行简单排除,不应施力、频繁地敲打键盘或电脑,防止电脑更严重损坏。 6、定期查杀病毒,进行磁盘整理,清除垃圾文件,进行系统优化。但不建议同时安装一个以上的杀毒软件。 7、注意电脑及周边外设卫生,尤其车间、仓库等,做到防水、防尘,雷雨天注意断开电源。 8、在二个小时以上不使用电脑时,应关机断电,如短时间停用,应使电脑处于休眠或屏保状态。 9、每台电脑均应设置密码,一般情况不允许他人使用,重要帐套或文件也应有密码保护,防止他人无意破坏或机密泄漏,尤其对共享文件一定要设好权限(只读、改写)。 10、如何查看本机的IP地址:

惠普服务器维护手册

HP PC服务器维护手册 目录 第1章硬件状态指示灯错误!未定义书签。

HP P RO L IANT DL580G7指示灯状态: .................. 错误!未定义书签。 HP P RO L IANT DL380G7指示灯状态: .................. 错误!未定义书签。 HP P RO L IANT DL980G7指示灯状态 .................... 错误!未定义书签。 第2章常见硬件部件故障处理错误!未定义书签。 硬盘故障的处理方法............................... 错误!未定义书签。 RAID卡故障的处理方法 ............................ 错误!未定义书签。

第1章硬件状态指示灯 1.1 HP ProLiant DL580 G7指示灯状态: Item Description Status 1UID 开关和指示灯蓝色 = 活动状态 蓝色闪烁 = 服务器在被远 程控制 不亮 = 处于非活动状态 2建康指示灯绿色 = 正常(系统在正常 运行) 橙色闪烁 = 系统降级 红色闪烁 = 系统健康出现 严重问题 不亮 = 正常(系统关闭) 3NIC 1 链路 / 活动指示灯 (针对主板集成)绿色 = 联接到网络 绿色闪烁 = 联接到网络并处于活动状态 不亮 = 没有网络联接 4NIC 2 链路 / 活动指示灯 (针对主板集成) 绿色 = 联接到网络 绿色闪烁 = 联接到网络并

处于活动状态 不亮 = 没有网络联接 5NIC 3 链路 / 活动指示灯 (针对主板集成) 绿色 = 联接到网络 绿色闪烁 = 联接到网络并 处于活动状态 不亮 = 没有网络联接 6NIC 4 链路 / 活动指示灯 (针对主板集成)绿色 = 联接到网络 绿色闪烁 = 联接到网络并处于活动状态 不亮 = 没有网络联接 7加电 / 待机按钮以及指示 灯橙色 = 有交流电并且服务器处于待机状态 绿色 = 有交流电并处于开机状态 不亮 = 没有交流电源 Item Description Status

Dell戴尔PowerEdgeR720服务器错误代码二

Dell/戴尔PowerEdge R720 服务器错误代码二 本空间免费为已购买客户提供终身售前以及售后技术支持 140 错误代码消息信息 MEM0701消息 Correctable memory error rate exceeded for .( 的可纠正内存错误比率超限。)详细信息内存可能无法操作。这是未来可能发生的不可纠正错误的早期迹象。操作重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM0702消息 Correctable memory error rate exceeded for .( 的可纠正内存错误比率超限。) LCD 消息 Correctable memory error rate exceeded for . Re-seat memory.( 的可纠正内存错误比率超限。重新安装内存。)详细信息内存可能无法操作。这是未来可能发生的不可纠正错误的早期迹象。操作重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM1205消息 Memory mirror redundancy is lost. Check memory device at location(s) .(内存镜像冗余已丢失。检查位置 的内存设备。)LCD 消息 Memory mirror lost on . Power cycle system.( 的内存镜像丢失。将系统关闭后再打开。)详细信息内存可能安装不正确,配置错误,或者发生故障。操作检查内存配置。重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM1208消息 Memory spare redundancy is lost. Check memory device at location .(内存备用冗余已丢失。检查位置 的内存设备。)LCD 消息 Memory spare lost on . Power cycle system.( 内存备份丢失。将系统关闭后再打开。)详细信息内存备份不再可用。操作重新安装内存模块。如果问题仍然存在,请参阅“获得帮助”。 MEM8000消息 Correctable memory error logging disabled for a memory device at location .(位置 的内存设备上可纠正内存错误日志已禁用。) LCD 消息 SBE log disabled on . Re-seat memory.( 上SBE 日志已禁用。重新安装内存。)详细信息错误将被纠正但不再记录。操作检查系统日志排查内存异常。重新安装位于 处的内存。 PCI1302消息 A bus time-out was detected on a component at bus device function .(总线 设备 功能 的组件上检测

HP Serviceguard MCSG日常管理维护手册

目录 1.1 查看群集和包状态 (2) 1.2 启动群集 (2) 1.3 停止群集 (2) 1.4 启动一个节点 (2) 1.5 关闭一个节点 (2) 1.6 启动包 (3) 1.7 停止包 (3) 1.8 允许包切换 (3) 1.9 禁止包切换 (3) 1.10指定节点允许包切换 (3) 1.11指定节点禁止包切换 (3) 2.0 日常Serviceguard 操作 (4) 2.1 检查群集状态 (4) 2.2 启动群集 (5) 2.3 在指定的节点上启动群集 (6) 2.4 停止群集 (6) 2.5 加入运行群集 (6) 2.6 停止群集中节点 (7) 2.7 运行一个包 (7) 2.8 允许包切换 (7) 2.9 停止包 (8)

HP Serviceguard 操作手册 标准的 Serviceguard 命令 以下命令和操作步骤用于群集环境的管理和维护。关于命令详细的参数和选项解释及使用方式,请参考官方网站https://www.sodocs.net/doc/f92360991.html,/hpux/ha/index.html中的群集管理员手册. 本文档将提供日常管理的基本命令,如检查群集状态,启动和停止群集,启动、停止、包切换等等。 1.0 状态和启动 1.1 查看群集和包状态 # cmviewcl –v | more 查看群集, 节点, 包和服务的状态. 1.2 启动群集 # cmruncl 将所有配置的可用节点组成群集并启动,并启动所有’enable’状态的包。 1.3 停止群集 # cmhaltcl 在群集环境中所有当前运行的群集节点上停止群集操作。如果群集中当前有packages在运行, 群集将不会被停止。先使用cmhaltpkg 停止包或使用如下方式强制停止包和群集(包先于群集停止) # cmhaltcl –f . 1.4 启动一个节点 # cmrunnode 将群集的指定配置节点加入当前正在运行的群集。如果包在节点启动前没有运行但允许在该节点运行(enable状态) ,包将被启动。 1.5 关闭一个节点 # cmhaltnode

Dell服务器BIOS设置

系统设置程序是一种BIOS 程序,使您可以管理系统硬件和指定BIOS 级的选项。通过系统设置程序,您可以: ?在添加或删除硬件后更改NVRAM 设置 ?查看系统硬件配置 ?启用或禁用集成设备 ?设置性能和电源管理阈值 ?管理系统安全 选择系统引导模式 系统设置程序也能供您指定引导模式,以便于安装操作系统: ?BIOS 引导模式(默认)是标准的BIOS 级引导接口。 ?UEFI 引导模式是一种基于一体化可扩展固件接口规格(UEFI)(高于系统BIOS)的增强64 位引导接口。有关此接口的详情,请参阅进入UEFI Boot Manager。 在系统设置程序Boot Settings(引导设置)屏幕的 Boot Mode(引导模式)字段中选择引导模式。请参阅Boot Settings(引导设置)屏幕。指定引导模式后,系统将以该模式引导,然后即可通过该模式继续安装操作系统。然后,您必须将系统引导为同一引导模式(BIOS 或UEFI)以访问安装的操作系统。试图从其它引导模式引导操作系统将导致系统在启动时立即停机。 注:操作系统必须兼容UEFI(例如,Microsoft? Windows Server? 2008 x64 版)才能通过UEFI 引导模式进行安装。DOS 和32 位操作系统不支持UEFI,只能通过BIOS 引导模式进行安装。 进入系统设置程序 1.打开或重新启动系统。 2.系统显示以下信息时按 键: = System Setup( = 系统设置) 注:系统会在激活USB 键盘后才响应。

如果按 键之前已开始载入操作系统,请让系统完成引导过程,然后重新启动系统并再试一次。 响应错误信息 如果引导系统时出现错误信息,请记录该信息。有关此信息的说明和纠正错误的建议,请参阅系统信息。 注:安装内存升级后,系统会在首次启动时显示一条消息,提示系统内存大小已更改,这属于正常情况。 使用系统设置程序导航键 键操作 上箭头键或 组合键移至上一字段。 下箭头键或 键移至下一字段。 空格键、<+> 键、 键、左箭头键和右箭头键滚动浏览字段中的设置。在许多字段中,您还可以键入适当的值。 退出系统设置程序;如果对系统设置程序进行了更改,按该 键将重新启动系统。 显示系统设置程序的帮助文件。 注:对于大多数选项,您所做的任何更改都将被记录下来,但要等到重新启动系统后才能生效。系统设置程序选项 主屏幕 图2-1. System Setup program(系统设置程序)主屏幕

IT运维手册(故障及处理)(完整资料).doc

【最新整理,下载后即可编辑】 IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网 ①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可

以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns 来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。 2显示器 ⑴无图像显示 ①开机无反应 I检查电脑的外部接线是否接好,把各个连线重新插一遍,看故障是否排除。 II如果故障依旧,接着打开主机箱查看机箱内有无多余金属物,或主板变形造成的短路,闻一下机箱内有无烧焦的糊味,主板上有无烧毁的芯片,CPU周围的电容有无损坏等。 III如果没有,接着清理主板上的灰尘,检查显卡等硬件是否

DELL服务器硬件报错——错误代码和解决方法

以下为DELL服务器常见硬件故障代码,帮助大家快速定位DELL服务器硬件故障。代码文本原因纠正措施 E1000Failsafe voltage error.Contact support.(故障保护电压错误。请联 络支持人员。)查看系统事件记录以了解严重故 障事件。 断开系统的交流电源 10 秒,然后 重新启动系统。 如果问题仍然存在,请参阅"获得 帮助"。 E1114Ambient Temp exceeds allowed range.(环境温度超过了许可范 围。)环境温度到了超出许可范围的某 个点。 请参阅"系统冷却问题故障排除"。 E1116Memory disabled, temp above range.Power cycle AC.(已禁用内 存,温度超出范围。请关闭交流电源 再打开。)内存已超过许可温度,系统已将 其禁用以防止组件损坏。 断开系统的交流电源 10 秒,然后 重新启动系统。 请参阅"系统冷却问题故障排除"。 如果问题仍然存在,请参阅"获得 帮助"。 E1210Motherboard battery failure.Check battery.(母板电池故障。请检查电 池。)CMOS 电池丢失,或电压超出许 可范围。 请参阅"系统电池故障排除"。 E1211RAID Controller battery failure.Check battery.(RAID 控制 器电池故障。请检查电池。)RAID 电池丢失、损坏或因温度 问题而无法再充电。 重新插入 RAID 电池连接器。请参 阅"安装 RAID 电池"和"系统冷却 问题故障排除"。 E1216 3.3V Regulator failure.Reseat PCIe cards.(3.3V 稳压器故障。请 重置 PCIe 卡。)3.3V 稳压器出现故障。请卸下并重置 PCIe 扩充卡。如果 问题仍然存在,请参阅"扩充卡故 障排除"。 E1229CPU # VCORE Regulator failure.Reseat CPU.(CPU # VCORE 稳压器故障。请重置 CPU。)特定处理器 VCORE 稳压器出现 故障。 请重置处理器。请参阅"处理器故 障排除"。 如果问题仍然存在,请参阅"获得 帮助"。 E122A CPU # VTT Regulator failure.Reseat CPU.(CPU # VTT 稳 压器故障。请重置 CPU。)特定处理器 VTT 稳压器出现故 障。 请重置处理器。请参阅"处理器故 障排除"。 如果问题仍然存在,请参阅"获得 帮助"。 E122C CPU Power Fault.Power cycle AC.(CPU 电源故障。请关闭交流电源 再打开。)接通处理器电源时检测到电源故 障。 断开系统的交流电源 10 秒,然后 重新启动系统。 如果问题仍然存在,请参阅"获得 帮助"。 E122D Memory Regulator # Failed.Reseat DIMMs.(内存稳压器 # 故障。请重置 DIMM。)某个内存稳压器出现故障。重置内存模块。请参阅"系统内存 故障排除"。 E122E On-board regulator failed.Call support.(机载稳压器故障。请联络 支持人员。)某个内置稳压器出现故障。断开系统的交流电源 10 秒,然后 重新启动系统。 如果问题仍然存在,请参阅"获得 帮助"。 E1310Fan ## RPM exceeding range.Check fan.(风扇 ## 转速超出范围。请检 查风扇。)特定风扇的每分钟转数超出预期 的操作范围。 请参阅"系统冷却问题故障排除"。 E1311Fan module ## RPM exceeding range.Check fan.(风扇模块 ## 转 速超出范围。请检查风扇。)特定模块中的特定风扇的每分钟 转数超出预期的操作范围。 请参阅"系统冷却问题故障排除"。 E1313Fan redundancy lost.Check fans.(风扇冗余丢失。请检查风 扇。)系统中的风扇不再有冗余。如果 再次发生风扇故障,系统将存在 过热危险。 请查看 LCD 以了解其它滚动信 息。请参阅"风扇故障排除"。 E1410System Fatal Error detected.(检测到系统严重错误。)检测到严重的系统错误。请查看 LCD 以了解其它滚动信 息。断开系统的交流电源 10 秒, 然后重新启动系统。 如果问题仍然存在,请参阅"获得

相关主题