搜档网
当前位置:搜档网 › BGP邻居DOWN问题定位指导

BGP邻居DOWN问题定位指导

BGP邻居DOWN问题定位指导
BGP邻居DOWN问题定位指导

BGP邻居DOWN问题定位指导

本文档介绍BGP邻居down掉时的定位思路和定位步骤,以确认问题的归属和原因。本文档适合于

BGP开发与维护工程师。

1 相关知识

1.1 BGP协议简述

BGP ( Border Gateway Protocol )是一种用于自治系统AS (Autonomous System )之间的动态路由协议。BGP-4做为事实上的Internet外部路由协议标准,被广泛应用于ISP ( Internet Service

Provider )之间。当BGP运行于同一自治系统内部时,被称为IBGP ;当BGP运行于不同自治系统之

间时,称为EBGP。

BGP邻居建立流程

BGP邻居建立过程共有六个状态,最后建立成功的状态就是Established状态。如果当前状态不是

Established,则可能是因为某种原因一直就没有到达Established状态,或在Established状态时,

因为某种原因,迁移到Idle状态。

1.2查看邻居状态和邻居状态变化日志命令基本原理

要确认当前邻居所处的状态,需要执行命令display bgp peer命令。通过这个命令查看的BGP邻居

如果一直没有达到Established状态,则说明出现了问题。如果系统资源和配置没有问题,最常见

的定位命令就是display bgp peer x.x.x.x log-info 命令。当bgp 邻居变成Established 或由Established

变成Idle时会记录下来,通过这条命令,我们可以查询bgp邻居Up/Down的记录和down原因。

2 定位方法

2.1基本定位思路

1 .对等体之间不能建立连接故障诊断流程

寻求枝术支持

BGP 邻居的建立需要满足如下条件:

条件

要求

否配置了禁 订的 rout di 王在非直连接口

方是否配置 T 吠认13

确保丈?端口 rrg 不

被券止

interface

一致

根据血b 吃僖息

进行排查

可题廨决吗

BGP 对等体无

法建立

W

是 确保取方踣由表中 F 存在到肘等体的路由

匸端口 iTg 的A

査*确保配置了口met-

是 是

确保自身配置的 ? AS 号利对端扌旨定.

是否駅置 的RS 是

是 E

<

打开dmbug 开

j 保冒认证

P 对等体 是

问题解决吗

确保本路由器的 root e-idft 51 等体 配需简不同

可题廨决吗

确保配畫了

ebgp-max-licp

问迴解决吗

定位踣束

2.对等体之间建立连接后断开故障诊断流程图I

BGP

2.2定位步骤

举例:

在上述组网图中,采用了如下的方案:

RTA属于AS域65008, RTB和RTC属于AS域65009,物理接口地址和LoopbackO地址分别如图中

? 所示

RTA和RTB建立一条EBGP连接,互相配置Loopback。地址为对等体的地址

RTB和RTC建立一条IBGP连接,互相配置POS直连接口地址为对等体的地址

在定位之前先把当前的系统资源查一下,确认系统资源没有不足。主要看一下cpu和内存。

执行命令display health对等体无法建立故障处理步骤

2.2.1对等体无法建立故障处理步骤

步骤1:使用带源地址参数的ping命令检查路由是否正常。

命令格式为ping -a source-ip-address host,例如需要检查RTA 和RTB的Loopback接口之间的

路由是否正常,在RTB上使用如下命令:

ping -a 10.1.1.2 10.1.1.1

若有路由无法ping通,请参照《IP转发不通或丢包的定位指导》

步骤2:检查BGP配置是否配置了禁止TCP端口179的ACL。

使用display current-configuration命令或display acl all命令可以查看路由器是否配置了禁止TCP

端口179的ACL。179端口为BGP对等体建立TCP连接的监听端口,如果被禁止,将无法建立连接TCP连接。

步骤3:如果使用Loopback接口建立对等体,是否配置了connect-interface。

使用display current-configuration configuration bgp命令可以查看BGP的配置信息。如果配置不

对,将无法建立TCP连接

步骤4:检查本端指定的AS号是否和对端一致,如果配置不正确,请修改配置。

步骤5:检查本端和对端的ruoter id是否为不一致,若一致请修改配置。

步骤6:TCP建立连接前提下,通过Debug信息提示检查BGP配置是否有误。

用debugging bgp ipv4-address all打开某个对等体的debug开关。例如,RTB和RTA不能建立连接,可以在RTB上用debugging bgp 10.1.1.2 all命令打开BGP的debug开关,观察和RTB不能建立连接的原因。

如果出现“ Send/Receive NOTIFICATION Err/SubErr: 2/2 (OPEN Message Error/Bad Peer AS) ”说明AS

配置有误,请在RTA和RTB上检查自己的AS是否和对端指定的一致

如果出现“ Send/Receive NOTIFICATION Err/SubErr: 2/3 (OPEN Message Error/Bad BGP Identifier)"说? 明Router-ID配置有误,请检查RTA和RTB上Router-ID是否错误地配置为相同值

如果错误码在Send Notification中出现,则表示本BGP路由器发生上述错误;

如果错误码在Receive Notification中出现,则表明对等体发生上述错误。

步骤7:如果是非直连接口建立EBGP对等体,是否配置了Ebgp-Max-Hop。

女口果出现提示信息“Might miss configing ebgp-max-hop for ebgp multi-hop peer ” ,说明非直连接口

建立EBGP对等体,但没有配置Ebgp-Max-Hop。常见Open消息断开的错误码如下:

步骤8:如果配置了peer x.x.x.x valid-ttl-hops hopsvalue,需要确认对端的报文的TTL是否在[255 - hopsvalue+1, 255]的范围内。如果不是,请修改hopsvalue。

步骤9:如果本端路由器的一个peer在某个地址族上使能了,对端路由器相应的地址族上未使能。则本端路由器上peer的状态显示:No neg,解决办法是对端相应的地址族上使能这个peer。

步骤10:如果配置了peer x.x.x.x ignore,贝U peer 的状态显示:Idle(Admin),解决办法是undo peer x.x.x.x ignore [quidway-bgp]display bgp vpnv4 all peer

BGP local router ID : 1.1.1.41

_ocal AS number : 60000

Total number of peers : 1 Peers in established state : 0

Peer V AS MsgRcvd MsgSent OutQ Up/Down State PrefRcv

1.1.1.44 4 60000 5649 5327 0 00:00:04 Idle(Admin) 0

步骤11:如果发现如下状态:

说明配置了peer x.x.x.x route-limit limitValue idle-forever 或peer x.x.x.x route-limit limitValue idle-timeout ,导致路由超限。确认一下路由和配置。

2.2.2对等体断开故障处理步骤

查看BGP连接断开的错误码。

display bgp peer peer-addres s log-info_h BGP

Send Notification BGP

如果错误码在Receive Notification中出现,则表明对等体发生上述错误。

若根据上述方法仍旧无法排除问题,请用故障采集工具采集信息,联系研发分析。

相关主题