2 T5 ]) s0 _6 s$ M, y4 q4 X
一、基础
5 z' z5 y4 u6 C$ aSTP(spanning tree protocol)生成树协议,用于消除数据链路层环路的协议,仅在网络中存在冗余链路或者存在环形网络结构(封闭的物理环路)时才采用。
* ^* {3 g; Y/ O1 P# p, F. S# b通常在网络中关键设备使用冗余链路、多条等价链路、接入环网等时采用。生成树在保证冗余链路的同时,又可确保不会出现二层环路。: R E2 L$ a3 F4 U
运行生成树协议的设备彼此交换信息发现网络中的环路,并有选择的对某个端口进行阻塞,最终将环形网络结构修剪成树形网络结构,防止报文在网络中不断循环;在网络发生故障时,生成树能快速发现故障并尽快找出另一条路径进行数据传输。
' e4 p @& T- O4 ?& K如果在环形网络中不启用生成树协议会产生:1、广播风暴导致网络不可用;2、MAC地址表震荡导致MAC地址表项被破坏。! N8 b" z3 z; ~
二、基本概念
: ~0 U& x6 D7 I& R u( H2 m! U1、根桥
: r0 y: R5 W' _: t5 i2 l- [全网中只有一个,具有最小桥ID(BID)的桥(可以当作一台交换机来看待),其他的统称为非根桥。根桥(root bridge RB)是整个网络逻辑中心,一般将环网中性能最好的设备设置为根桥。网络收敛后,根桥间隔一定时间向外发送配置BPDU。; }' ~) ~8 s7 a, i, m4 D9 d( \
2、两种度量
7 E |' u3 i# G3 `' w T: B1、ID
+ l3 E9 z' Z6 p; w8 P: h: MID有BID(bridge ID,桥ID)和PID(port ID,端口ID)之分( }* r; `" _& m6 O7 |! p8 w) b
BID:
+ ~* N z: B. h, X& F3 n, UBID决定哪台交换机成为网络中的根桥,在STP中规定BID最小的交换机被选举为根桥。
8 s. n- F: b$ O% F7 XBID由高16位桥优先级(bridge priority)和低48位桥背板MAC地址组成,是一个用户可以设定的参数,设定的值越小,越能成为根桥。各交换机只有桥优先级相同时才比较背板MAC。( L2 s C* |% ]4 p+ a H$ b
PID:6 `* z# Y1 v/ w$ t& C1 R
用于在有些情况下选择指定端口。
- F* H6 r: q x: `在选择指定端口时,只有在端口的根路径开销和发送BPDU交换机的BID都相同的情况下才会比较端口PID,PID小者为指定端口。* X: W2 i& @$ p6 a: p _ H. T
2、路径开销
% x3 |) B8 l, ?. L/ P) d0 N: {由端口的链路速率决定(聚合链路为UP成员速率之和),stp选择保留带宽最大的链路,阻塞多余的速率小的链路,以便剪成无环网络。在理解STP时一定要理解成一个阻断的环。" H7 X2 _% `) d6 V
在一个运行stp协议的交换网络中,某端口到根桥累计的路径开销就是所经过的各个桥上的各端口的路径开销累加值,这个值叫做根路径开销(root path cost)。根桥上所有端口的根路径开销、以及同交换机上不同端口间的路径开销值均为0。
! c# I: f w! y Y+ I3、三个选举要素/ |' X, K& Y& @* N% Q
1、根桥(root bridge RB):
$ S4 S b% k0 N& ZBID最小的设备;每个STP网络中仅有一个。
! H/ z+ v0 }7 T8 x; e5 B同一交换机上只能配置为根桥或备份根桥,不能同时配置;在配置STP、RSTP中,建议手动配置根桥和备份根桥。在一棵生成树中,当桥优先级相同时MAC最小的将成为根桥;一棵生成树中可配置多个备份根桥,当根桥故障时,1 Q% L2 `& E8 J4 E: M: a
备份根桥中MAC最小的将成为根桥。
+ s# ^' n; {8 B+ R* S6 `在配置根桥时,一般选择性能高的设备作为根桥,而性能高的设备不一定优先级高,所以要配置性能高的设备优先级最高(数值最小)。
9 P# m) w# o4 K( X' S2、根端口(root port RP):
6 Q/ i) ]% h0 @$ X0 r" Q- E负责向根桥方向转发数据,是非根桥交换机离根桥交换机最近的端口,即当前桥(可以当成一台交换机设备)设备上去往根路径开销(root pathcost RPC)最小的端口。# K9 m- @& N4 l7 d0 Q
在一个stp网络中,根端口只有一个,且根桥上没有根端口。
. m( ^' n$ K/ Z$ k; W9 I# f2 ?4 O c当多个端口根路径开销相同时,先比较指定桥(见后面)ID(最小的会成为根端口),指定桥ID相同则比较指定桥上的端口ID(port ID最小的成为根端口)。
# d& S j1 p! i' \9 e E端口路径开销由路径开销计算方法决定;当确定路径开销方法后,端口的速率越大,其开销值越小(越能成为根端口)。
! ]/ p) u4 ~& {7 S8 w 默认端口速率与端口开销值
$ Q0 r2 C; Y6 ]9 O+ W1 E \/ u, v3、指定端口(designated port)
, n1 |. q2 H) g指定端口与指定桥息息相关,但不是一一对应,具体如下:0 Z! G% w4 n) t$ U& C. Q; s
指定端口与根端口相对,也可理解为与下游设备最近,唯一可以接收下游设备数据的端口。根桥上的所有端口都是指定端口(除根桥有环路)。. A+ w# x0 Q, w3 ` _
对于一台设备:0 [* k6 \. R/ L, n( v
与本设备直接相连且向本设备直接转发配置消息的其它设备就是指定桥,指定桥中向本设备转发配置消息的端口就是指定端口。/ C4 I) r. Z# D+ L7 [# g7 r& u. c* M' J! `
对于一个局域网:* w2 u0 R# b4 o
向本网段转发配置消息的设备就是指定桥,指定桥上向本网段转发配置消息的端口时指定端口。9 Q H: q, w7 P- v7 U- U! \- Z
端口优先级默认为128,当优先级越大(数值越小)越容易选举为指定端口;在选择指定端口时,两个端口的根路径开销和发送BPDU交换机的BID相同时,PID小的端口为指定端口。
0 I$ \5 s: H. {; T: K1 K& | `一旦根桥、根端口、指定端口选举成功,则整个网络树形拓扑建立完成,在拓扑稳定后,只有根端口与指定端口转发流量,其他非根、非指定端口处于阻塞(blocking)状态。
8 I7 _; D$ v/ A5 [$ H) Q/ b' h4 _# _4 T) D4、四个比较原则1 ~+ Q- U4 C2 v, l8 f" X6 z
1、最小BID:4 t* A7 b" s; l) g Q+ L/ b# i: n$ Y
用来选举根桥。
: Y0 a: N! b- ]. GBid中桥优先级(数值越小)最高将成为根桥,桥优先级相同则比较MAC地址,MAC地址最小的成为根桥。) t6 x9 m( W# C! n
2、根路径开销:
. E0 J9 N1 v5 t/ y1 J$ P$ }0 f用来选举根端口。9 M8 B% z t' o7 R
当前设备到达根桥设备总路径开销值最小的端口选为根端口。
/ |' c! b4 p, W# q: [: M3、最小发送者BID:1 `/ B. ^' H- H- Y. I
用来在非根桥之间选举指定桥和根端口。
9 T3 s7 X3 z; a& X如果两个以上根路径开销相等,则选择对方发送BPDU中BID最小的那个作为自己的指定桥,接收该BPDU的端口作为自己的根端口
9 Z7 C" g4 n5 x3 S& A2 m9 D6 r0 B3 U4、最小PID:# E! f' M: h# N) P- w) M3 U( R
用来选举指定端口。& r' `9 ?) p6 i" }: p# ?8 `9 Y4 q* ^
在根路径开销相同的情况下,阻塞PID值最大的端口,PID值最小的成为指定端口。3 T6 S+ k/ \. U! B- p, `- M% o
5、五种状态* U9 X+ u0 G* V7 H9 I3 G: L5 _& s
1、Forwarding(转发状态):6 G9 {2 q+ O# a
只有根端口或指定端口才能进入转发状态(转发用户流量和BPDU报文)。
, ~! r" g# k8 Y8 h G$ M6 f/ W) }2、Learning (学习状态):
. B/ U! \0 P) O9 e9 A& b T根据收到的用户流量创建MAC地址表,不转发流量,是一种过渡状态,是为了防止临时二层环路。4 V0 x( M& \$ ?& ?+ q
3、listening (监听状态):
9 Y8 g! \3 m( H4 s2 f9 X/ k, L正在确定端口角色,选出根桥、根端口、指定端口。
7 i X4 A+ A5 d$ L g: R% S4、Blocking (阻塞状态):
7 Y1 x% G! l% |5 q/ [此时端口仅接收并处理BPDU报文,不转发用户流量。
+ D4 U' M1 l$ E9 d5、Disabled (禁用状态):
3 S, o1 C5 W6 d7 d7 h0 {此时端口不能转发BPDU报文,也不用转发流量。
' L$ N* S: N$ m7 Q/ c2 r9 J4、STP的三个定时器
8 \# I' z4 z' O2 V, Q& {1、Hello time(hello定时器):: q- A6 g9 W3 j+ ?, T0 O
发送配置BPDU的时间间隔。主要是确认链路是否存在故障。
7 a" q4 L! ]7 w6 j9 G当网络拓扑稳定后,该定时器的修改只有在根桥修改后才会生效。根桥会在发出的BPDU报文中填充适当的字段向其它非跟前通知定时器修改的信息。
$ H# C2 U1 u$ o, S; T 2、forward delay(转发延时):
3 s6 s* }2 J) f8 ^设备进行状态变更的延迟时间,即端口处于listening和learning状态各自持续时间(默认各自15S)。当出现链路6 l( n. {$ l6 Q
故障后,新选举出的根端口和指定端口要等待2倍的forward delay后才进入转发状态,以避免环路的产生。3 F0 M3 ~' V+ w( ^7 \1 q3 y
3、Max age(最大生存时间):
& F; W+ I* J4 c: o指端口BPDU报文老化时间。可在根桥上设置。
& {& [" b* i, `5 ^ i( r 在stp网络中非根桥设备收到配置BPDU报文后,会对报文中的message age (消息生存时间)和max age 进行% B9 Y1 O) K" L1 G+ ~1 [
比较:如果message age 小于max age,则非根桥设备继续转发BPDU报文;如果message age大于max age,则BPDU
: o8 a1 T! C A: T! |报文老化,非根桥设备认为网络直径过大,直接丢弃该BPDU,导致根桥连接失败。
" h+ |1 n1 ^) d' }5 m. [# T i$ u 实际实现中,配置BPDU报文每经过一个桥,message age 增加1。
5 F6 D' }. K' \- c8 X8 Z/ ~1 P2 X5、STP BPDU报文
9 T& N& f( m2 f; e# ISTP采用的是BPDU(bridge protocol data unit 桥协议数据单元)类型报文,也称配置消息。Stp通过在设备之间传
) B4 E) X; K0 n7 T8 K6 x$ f, w递BPDU来确定最终修剪完成的网络拓扑结构。
% C1 u8 u9 l p7 Y- g) ESTP BPDU报文分为两大类:
" V7 v7 e/ O# ~; ~& f! Q1、配置BPDU(configuration BPDU):. T$ o' s# ]0 j2 S8 R) @% W5 W0 v0 n
是一种心跳报文:就是定时发送一个自定义的结构体(心跳包或心跳帧),让对方知道自己“在线”。以确保链接的有效性。
! B* C8 e0 b& f用来进行生成树计算和维护生成树拓扑的报文。当网络拓扑稳稳定后只有根桥发送配置BPDU报文,其它桥在收到上游传来的配置BPDU后才触发发送自己的配置BPDU% F$ B3 j: A. ~: J
2、TCN BPDU(topology change notification BPDU 拓扑变化通知BPDU):
/ k- u8 ?2 c; B/ T当拓扑结构发生变化时,下游设备用来通知上游设备网络拓扑结构发生变化的报文。7 V7 [) g$ a4 U2 t: f
BPDU优先级:
% Q: b8 {( C) R7 d; W$ [) M当同一桥收到不同配置的BPDU时,优先级高的BPDU将被采用,其他的被丢弃。$ B/ ]. q% ]8 R( ^& {8 d. L
6、STP 的不足. P* z5 J- K2 E! C/ G# f
网络收敛慢:, h4 @" N- n( }' N2 j
任何端口从阻塞到转发状态至少需要两倍转发延时(30S以上);没有细分端口状态和端口角色,端口之间最本质
! L/ T5 V9 H1 _/ h8 x8 c8 i+ k的区别并不在于端口状态,而在于端口扮演的角色;, T% f& N c8 X6 G6 N& N; |
STP采用被动算法,依赖定时器;
( {6 O) J) R( [( W* k: o拓扑稳定后,只有根桥发送BPDU报文,其他桥只有被动转发,直到传遍整个网络。 |