欢迎大家来到IT世界,在知识的湖畔探索吧!
常见原因
本类故障的常见原因主要包括:
- BFD故障。
- 对端设备故障。
- CPU利用率过高。
- 链路故障。
- 接口没有Up。
- 两端IP地址不在同一网段。
- RouterID配置冲突。
- 两端区域类型配置不一致。
- 两端OSPF参数配置不一致。
故障诊断流程
在配置OSPF后发现OSPF邻居Down,可按照故障诊断流程图1排除故障。
图1 OSPF邻居Down故障诊断流程图
故障处理步骤
执行命令完成故障处理操作后,请根据系统中的配置生效模式,确保配置下发。如无特殊说明,本手册采用配置两阶段生效模式进行描述。
- 配置立即生效模式下,输入命令行并键入回车键后,配置将立即生效。
- 配置两阶段生效模式下,请在完成配置后,执行命令commit,提交配置。
请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。
操作步骤
- 通过日志查看OSPF邻居Down的原因
- 执行display logbuffer size buffersize命令,查看如下日志信息。
- 如果日志信息如下:
- CE12800 %%01 ospfv2comm/6/NBR_CHANGE(l):VS=0-CID=[UINT];Neighbor changes event: neighbor status changed. (ProcessId=[UINT], NbrIpAddr=[IPADDR], NbrEvent=[UINT], NbrPreviousState=[UINT], NbrCurrentState=[UINT])
- 说明是邻居状态改变导致,重点关注关键字NbrEvent,此关键字记录的是OSPF邻居Down的原因。OSPF邻居Down的原因一般会有以下几种:
- Inactivity(NbrEvent=7)
- 发生邻居状态机InactivityTimer事件,表示在deadtime时间内没有收到Hello报文导致OSPF邻居Down,出现这种情况请执行步骤2。
- LLDown(NbrEvent=6)
- 发生邻居状态机LLDown事件,表示由下层协议通知邻居不可达到,出现这种情况请执行步骤2。
- 1-Way Received(NbrEvent=4)
- 发生邻居状态机1-Way Received事件,表示因为对端OSPF状态首先变成Down,从而向本端发送1-Way hello,导致本端OSPF状态也变成Down,出现这种情况请排查对端设备的故障。
- Kill Neighbor(NbrEvent=5)
- 表示接口Down或BFD Down。此时,可以执行display interface [ interface-type [ interface-number ] ]命令查看接口状态,排查接口故障。
- 如果日志信息如下:
- CE12800 %%01 ospfv2comm/6/OSPF_RESET(l):VS=%u-CID=[UINT];OSPF process or area reset. (CompCID=[UINT], Parameter=[UINT], ResetReason=[UINT])
- 表示执行了reset ospf process的操作,可以获取操作记录或查看日志中是否有此操作。
- 其他情况请执行步骤9。
- 检查链路是否故障
- 请执行ping命令和在接口视图下执行display this interface命令,检查设备链路是否故障(包括传输设备故障)。如果链路正常,请执行步骤3。
- 检查CPU利用率是否过高
- 请执行display cpu命令检查故障设备的CPU利用率是否过高。如果CPU利用率过高会导致OSPF无法正常收发协议报文从而导致邻居振荡。如果CPU利用率过高则先解决此问题,关闭一些不必要的功能,否则执行步骤4。
- 检查接口状态是否为Up
- 请执行display interface [ interface-type [ interface-number ] ]命令查看接口物理层状态,如果接口物理层状态为Down请先处理接口故障问题。
- 如果接口物理层状态是Up,请执行display ospf interface查看接口在OSPF协议下状态是否为正常状态(即接口状态为DR、BDR、DROther或P2P等正常状态)。
- <HUAWEI> display ospf interface OSPF Process 1 with Router ID 10.1.1.1 Interfaces Area: 0.0.0.0 (MPLS TE not enabled) Interface IP Address Type State Cost Pri Vlanif50 192.168.1.1 Broadcast DR 1 1
- 如果OSPF下的接口为Down,请执行命令display ospf cumulative检查OSPF进程下使能的接口数是否超出了当前版本OSPF的规格,如果超出规格则减少OSPF使能的接口数。
- <HUAWEI> display ospf cumulative OSPF Process 1 with Router ID 10.1.1.1 Cumulations IO Statistics Type Input Output Hello 0 86 DB Description 0 0 Link-State Req 0 0 Link-State Update 0 0 Link-State Ack 0 0 ASE: (Disabled) LSAs originated by this router Router: 1 Network: 0 Sum-Net: 0 Sum-Asbr: 0 External: 0 NSSA: 0 Opq-Link: 0 Opq-Area: 0 Opq-As: 0 LSAs Originated: 1 LSAs Received: 0 Routing Table: Intra Area: 1 Inter Area: 0 ASE: 0 Up Interface Cumulate: 1 Neighbor Cumulate: ======================================================= Neighbor cumulative data. (Process 1) ——————————————————- Down: 0 Init: 0 Attempt: 0 2-Way: 0 Exstart: 0 Exchange: 0 Loading: 0 Full: 1 Retransmit Count:1 Neighbor cumulative data. (Total) ——————————————————- Down: 0 Init: 0 Attempt: 0 2-Way: 0 Exstart: 0 Exchange: 0 Loading: 0 Full: 1 Retransmit Count:1
- 如果OSPF下的接口状态正常,即接口状态为DR、BDR、DROther或P2P等正常状态时,请执行步骤5。
- 检查两端IP地址是否在同一网段
- 请执行display interface interface-type [ interface-number ]命令查看两端接口的IP地址。
- 如果IP地址不在同一网段,请执行ip address命令修改两端的IP地址,使其在同一网段。
- 如果IP地址处于同一网段,请执行步骤6。
- 检查各接口的MTU是否一致
- 如果在接口上使能了ospf mtu-enable,则要求接口的MTU一致,否则OSPF邻居无法协商成功。请接口视图下执行display this interface命令查看接口MTU信息。
- 如果接口的MTU值配置不一致,请在接口视图下执行mtu mtu,修改链路两端的MTU值为一致。
- 如果接口的MTU值配置一致,请执行步骤7。
- 检查各接口的优先级是否非零
- 对于Broadcast和NBMA类型的网段,各接口的优先级至少有一个是非零的,以确保能够正确的选举出DR,否则两边的邻居状态只能达到2-Way。
- 执行命令display ospf interface,查看接口的优先级。
- <HUAWEI> display ospf interface OSPF Process 1 with Router ID 10.1.1.1 Interfaces Area: 0.0.0.0 (MPLS TE not enabled) Interface IP Address Type State Cost Pri Vlanif50 192.168.1.1 Broadcast P-2-P 1 1
- 检查两端OSPF的配置是否有错误
- 检查两端OSPF RouterID配置是否冲突
- <HUAWEI> display ospf brief OSPF Process 1 with Router ID 10.1.1.1 OSPF Protocol Information
- 如果冲突则修改配置,否则继续执行以下检查。
- 检查两端OSPF Area配置是否一致
- <HUAWEI> display ospf interface OSPF Process 1 with Router ID 10.1.1.1 Interfaces Area: 0.0.0.0 (MPLS TE not enabled) Interface IP Address Type State Cost Pri Vlanif50 192.168.1.1 Broadcast BDR 1 1
- 检查两端OSPF的其他配置是否一致
- 每10秒钟执行一次命令display ospf error,持续5分钟。
- <HUAWEI> display ospf error OSPF Process 1 with Router ID 10.1.1.1 OSPF error statistics General packet errors: 0 : IP: received my own packet 0 : Bad packet 0 : Bad version 0 : Bad checksum 0 : Bad area id 0 : Drop on unnumbered interface 0 : Bad virtual link 0 : Bad authentication type 0 : Bad authentication key 0 : Packet too small 0 : Packet size > ip length 0 : Transmit error 0 : Interface down 0 : Unknown neighbor HELLO packet errors: 0 : Netmask mismatch 0 : Hello timer mismatch 0 : Dead timer mismatch 0 : Extern option mismatch 0 : Router id confusion 0 : Virtual neighbor unknown 0 : NBMA neighbor unknown 0 : Invalid Source Address
- 查看Bad authentication type字段,如果这个字段对应的计数值一直增长,表示建立邻居的两台设备配置的OSPF认证类型不一致,需要在两端设备上配置相同认证的类型。
- 查看Hello timer mismatch字段,如果这个字段对应的计数值一直在增长,表示接口上hello timer配置不一致,需要通过检查两端设备接口配置,将hello timer间隔配置一致。
- 查看Dead timer mismatch字段,如果这个字段对应的计数值一直在增长,表示接口的dead timer配置不一致,需要通过检查两端设备接口配置,将dead timer间隔配置一致。
- 查看Extern option mismatch字段,如果这个字段对应的计数值一直在增长,表示区域类型配置不一致(一端配置为普通区域,另一端配置为stub或nssa区域),需要将两端区域类型配置一致。
- 如果故障仍然存在,请执行步骤9。
- 请收集如下信息,并联系技术支持人员上述步骤的执行结果。设备的配置文件、日志信息、告警信息。
相关告警与日志
相关告警
OSPF_1.3.6.1.2.1.14.16.2.2 ospfNbrStateChange
相关日志
OSPF/6/NBR_CHANGE
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/102386.html