1、L2/L3 交换的应用和发展中国电信股份有限公司北京研究院 胡捷L2/L3 交换的应用和发展在当前电信和网络技术领域非常活跃。根据 OSI分层,L2 对应数据链路层,L3 对应网络层。本文主要针对对应第二层的以太网协议和对应第三层的 IP 协议的交换和路由技术进行论述。1. L2 交换的应用和发展1.1 L2 交换原理和应用交换的概念最早出现在 L2 层面。以太网交换机相当于多端口高密度网桥,所有端口位于一个 L2 广播域,每个独立的端口是一个 L2 冲突域。接入交换机中的所有主机,在开机后相互通信之初,会采用广播方式(如 DHCP Discover广播包) ,寻找网段内的 DHCP 服务器,
2、进行参数自动配置。此时交换机通过对进入端口的以太网广播帧的源 MAC 地址的自动学习功能,获得 MAC 地址与交换机端口的对应关系,从而在下次进入交换机的以太网帧中,读取目的 MAC 地址,查找对应的端口,进行交换。所有的步骤都在第二层进行,交换机不打开第三层,因此可以通过硬件实现,交换的速度很快。早期的以太网交换采用半双工方式,必须启用 CSMA/CD(Carrier sense multi access/collision detect)冲突检测机制。为了避免两台主机同时侦听网络得知没有流量而同时发送数据导致在中途产生碰撞,对以太网传输距离进行了限制。在一个冲突域里的往返传输时长(Roun
3、d-trip time)绝对不能超过512 比特的传输时长。由于 100M 以太网的每比特传输时间为 0.01 毫秒,FE 网络的最大 RTT 只有 5.12 毫秒,因此可计算出基于 CAT5 的 UTP 对绞线传输距离大致为 100 米,可以组建一个最大直径 205 米的局域网络。同理,10M 以太网,在不考虑线路衰耗等电气特性情况下,理论最大直径为 2050 米。对于 FE 网络而言,可实现在一个楼层、相邻几个机房或公司的几间办公室之间组网。因此L2 交换应用最多的地方为局域网交换,顾名思义是在一个较小的范围内。这样的应用方式中,用户通常采用运行 Windows 网络操作系统的 PC 主机
4、,建立对等模式或域模式 Windows 局域网,建立本系统内部的文件服务器、打印服务器,以及 Email Server、Web Server 和 Database Server。每台主机一般采用 DHCP方式进行自动配置。目前的以太网技术普遍采用全双工模式,不再受 CSMA/CD 机制的限制,理论上传输距离可以无限远,如采用光接口技术,利用大功率光接口和光纤的低衰耗特性,将 FE、GE 接口的传输距离延伸至几公里甚至几十公里。除了局域网应用外,许多校园网也采用 L2 交换网络组建。由于 L2 交换是基于硬件的桥接,在交换中,以太网帧的转发是由 ASIC 芯片处理的,可以提供比传统的 L2 网桥
5、或 L3 路由器更高的处理性能,如更高的包转发率和更低的转发时延。因此 L2 以太网交换广泛应用在 ISP 的 POP 节点构成上,也广泛应用在 IDC 的网络结构中,提供吉比特路由器之间的高速数据链路。1.2 L2 交换的局限尽管 L2 交换有很多优势,但是 L2 交换依然没有摆脱桥接的所有特性和限制,通过 L2 交换机所建立的广播域仍然面临着与过去大型桥接网络同样的扩展和性能问题。如在具体应用中,L2 广播域有一个 5-4-3 效应,即在一个广播域中,允许最多 5 个 L2 Segment,4 个 Repeater/bridge, 其中只有 3 个 Segment可以有负载。随着主机数量的
6、增加,网段中广播、组播及 Flooding 流量都会增多,干扰网段中所有主机,占用主机 CPU 资源,并无端耗费局域网带宽。此外,L2 交换没有 L3 路由的智能,不能实现端到端多路径和负载分担,这也是网桥的特性决定的。因此在一个 L2 广播域中不能出现链路环路,L2 交换机需要启用 Spanning tree 协议来杜绝 L2 网络形成环路,并在主用链路故障时,自动提供备份路径。目前 Spanning tree 的链路恢复时间还不够理想,没有达到电信级的 50ms。其次,在 ISP 网络中,如果采用 L2 交换来提供 POP 节点内核心、汇聚层路由器之间的链路,还有一个潜在的路由收敛性能下降
7、问题。当路由器之间的以太网交换机故障时,有可能路由器和交换机之间的物理接口和线路协议都是正常的(interface is up, line protocol is up) ,路由器不能及时感知网络状态的改变,需要高达 40s 的 IGP PDU Hello 协议进行判断。正是这个原因,目前 ISP POP 内通行的做法是将两台路由器通过 FE、GE 网线直接实现背靠背连接。1.3 L2 交换的发展目前的 L2 交换应用趋势,逐步从局域网范围走向城域甚至广域,尤以城域最为活跃。当前从两个领域开始在城域范围内切入到 L2 交换技术和应用:以SDH 为内核的城域综合传输系统,如 MSTP,支持的厂家
8、有Alcatel、Lucent、Nortel、中兴、华为等;以 L2/L3 交换机为主的城域以太网交换机,支持的厂家有 Cisco、Foundry、River stone、Force 10 等。两个领域的 L2 交换产品都可以将以太网广播域从地域上扩大到城市范围,提供在城域内的以太网透传业务。MSTP 支持点到多点的能力稍差,设备的 L2交换性能也不及纯粹的以太网交换机。此外 MSTP 提供以太透传是采用将以太帧进行封装、映射到若干 VC-12 或 VC-3 内,再将 VC-12、VC-3 进行级联而实现的,相比较而言,以太网交换机的组网更灵活一些,对带宽的利用率也更高,可以采用光口通过裸光纤
9、直连。在城域范围内提供 L2 以太网交换和透传,也非常适应采用以太上行接口的DSLAM 组网。在提供 ADSL 上网业务时,可以通过城域以太交换或 MSTP 等以太传输系统,将分散设立于各个端局的 DSLAM 通过长途以太传输通道汇聚到相对集中设置的 BRAS 处。 降低建网成本,符合将用户进行统一管理、集中认证和计费的策略。在实际组网中,需要综合考虑网络性能、数据流量、业务种类来对 MSTP 还是 L2/L3 交换机组网进行取舍。同时需要考虑网络可扩展性、故障恢复和保护能力、VLAN 支持性能、网管能力、网络安全和 QoS 等因素。一般而言,MSTP 虽然在以太网交换和透传性能上稍弱,但是其
10、提供 TDM 电路的能力目前 L2 交换机组建的网络无法实现。2. L3 交换的应用和发展2.1 L3 交换原理和分类至于第三层交换,有许多相关的概念。从不同角度,对第三层交换有不同理解和定义。最早的第三层交换,是基于 ATM 技术的 MPOA 和 IP Switch,分别基于 ATMF和 IETF 标准(RFC1953 和 RFC1987) 。其基本原理相近,把路由功能分为第三层路径选择(智能路由选择)和第三层交换(快速转发) 。趋势是把第三层交换放到骨干网 ATM 交换机中去,把路由器和 ATM 骨干网融为一体。MPOA 方式的前提是一定要由 ATM 网络事先建立一条端到端的连接,再采用“
11、Short Cut”方式对 IP 包进行路由。IP Switch 方式中的 RFC1953 解决了“多跳”数量增长的问题,通过软件提供一种“直通” (Cut-through)来满足多 IP 业务要求,它与 RFC1987 共同构成 IP Switch 基础。IP Switch 对数据包的处理多采用以 ATM 交换机跨接路由器直通(CUT-THROUGH)处理的方式,即第一个包通过路由器进行检查、鉴别和处理,以后相同的包由 ATM 交换机跨接直通传输,不再通过路由器。无论是 IP Switch 还是 MPOA,这个 IP 数据流都是在虚电路里传输,所有IP 包都在一个已经选定的路由中传输,不存在
12、不同的 IP 包经过不同的路由。只是 IP Switch 方式每个 ATM 交换机可独立处理 IP 交换,以直通 IP 数据流。但 MPOA 一定要所有 ATM 交换机统一动作,所以 MPOA 方式实施前一定要先建立一条端到端的 SVC。除了以上两种 L3 交换之外,在其他领域也相继产生了第三层交换技术。如思科公司的专有技术 CEF(思科快速转发) 、普遍被所有第三层交换机厂家采用的多层交换技术 MLS 以及当前被广泛推广、基于 IETF 标准的多协议标记交换MPLS。本篇文章重点介绍第三层交换机中采用的多层交换技术。2.2 L3 交换的起源和发展基于 L2 以太网交换技术的多层交换最早起源于
13、校园网络,后来在 IDC 中也有较多应用。早期互联网业务流量模型符合 20:80 规则,即 80%的流量为本地,20%的流量出网。后来此流量模型发生逆转,80%流量来自网段外部,内部通信只有 20%。因此导致不同的网段之间越来越多的业务交换。由于每一个 L2 网段都代表一个广播域,出于网络可扩展性的限制,需要在 L2 以太网交换机上对不同网段划分不同 VLAN,我们知道,在一个多 VLAN 环境下,VLAN 内部采用 L2 交换,VLAN 之间采用 L3 路由。因此需要在 VLAN 之间通过路由器进行 L3 数据包转发。传统的路由方式,对 IP 包的处理性能低于对以太网帧的交换。随着跨网业务的
14、增多,与传统 L3 包转发性能低下的矛盾越来越大。这些因素推动了 L3交换技术的产生。L3 交换与 L2 交换一样,也是基于硬件的交换,更确切地说,是基于硬件的选路。L3 交换机对 IP 数据包的处理程序和传统路由器一样,提供如下功能: 根据第三层信息决定转发路径 通过 Checksum 验证第三层报头的完整性 验证数据包 TTL 值并进行核减 处理并响应任何选路信息 在 MIB 库中更新转发统计数据 实施策略,如 ACL、策略路由、CAR/Shaping 或 QoS 队列L3 交换与传统路由器的区别,除了路由器采用基于 CPU 的软交换,L3 交换机通过 ASIC 之外,它们的主要区别在于转
15、发机制上。L3 交换在满足第三层选路需求的同时,需要满足对数据进行线速转发的要求,只有提高了吞吐率,才能彻底解决第三层瓶颈问题。L3 交换结合了交换和路由技术的优点,其高性能是基于“一次路由,多次交换”的机制实现的。在 L3 交换过程中,L3 交换机监测进入路由器接口的第一个以太网帧(判断依据是以太网帧的目的地址为路由器接口 MAC 地址) ,因为这些数据帧一定是跨网流量。然后 L3 交换机需要剥离以太网帧,读取 L3 信息,通过查找 FIB 路由转发表,将数据包输出到相应接口。在这同时,L3 交换机根据这个数据包的 IP 地址(源/目的地址)对后续进入交换机的具有共性的数据包进行流(Flow
16、)分类,并对每个流及这个流的输出端口进行缓存,这个流中的后续数据包不用每次再针对数据包的目的地址查找路由表进行 L3 转发,只需将封装 L3 数据包的以太网帧的目的 MAC 地址进行更换即可。从而实现了一次路由,多次交换。由于互联网上两个端点之间可以同时建立多个数据流,具有相同的源/目的IP 地址,如果设备能根据 IP 数据包中更多的字段来进行流分类,如根据协议类型和 TCP/UDP 端口号,即可实现对每个会话(Session)的分类,此时的多层交换可以称为 L4 第四层交换。如果策略规定根据应用对流量进行细化控制,或者需要按应用进行流量统计,L4 交换是必需的。其交换原理同 L3 交换相同,
17、但是会耗费更多的设备资源(CPU 和内存) 。2.3 L3 交换的应用和趋势随着以太网交换技术的日益成熟,无论是运营商的城域网还是企业网或校园网,越来越多地采用了第三层交换机组网技术。它带来的优势显而易见。首先,建网成本低、组网灵活。L3 交换机的选路性能、转发性能都已经不低于吉比特路由器,但是具有更高的端口密度。L3 交换机的每个端口可以灵活配置为交换口或路由口,同时还具备 POS 接口,设备之间互连,可以通过 POS口运行 IGP,提供选路功能,实现互联网上网业务;通过 GE 口互连配置为 VLAN Trunk 提供以太透传业务。传统的路由器对 L2 起到终结作用,无法提供 L2 透传业务
18、。其次,一定程度上满足多业务需求。目前的数据业务,可以划分为专线业务和互联网上网业务两大类。L3 交换技术可以在一个设备上提供两种业务。互联网业务中,对于以太到户的宽带小区用户,在 CPE 侧通过路由器或交换机以FE/GE 接口经裸光纤接入 ISP 城域网的汇聚层(L3 交换机) ;对于 ADSL 用户,汇聚到 DSLAM 后通过 FE/GE 上行经城域以太网终结到 BRAS。这都是基于 L3 交换机的路由功能实现互联网路由可达基础上实现的。目前性能优良的 L3 交换机,支持的路由协议和路由策略已经可以同传统路由器相比,如对 BGP 路由条目的支持上、IGP 的收敛性能上、路由策略的实施上(P
19、olicy Routing、针对 VLAN ID 或端口的 CAR)以及网络安全方面(NAT、ACL、针对 EtherType 字段的过滤、广播包过滤)和 QoS 领域(针对 802.1p 优先级队列、802.1p 与 ToS 字节中的IP Precedence 比特位映射) ,甚至 MPLS 应用,都提供了较好解决方案。对于专线业务,目前 L3 交换机组网对于提供以太网透传业务具有与生俱来的优越性。尤其对于点对多点业务、VLAN 堆叠应用、端口绑定等可以提供很好的性能。当然,任何设备、技术或组网方案都不是万能的,L3 交换机组网的缺陷是网络环路保护恢复(通过生成树协议)对网络可扩展性和管理维
20、护简易性带来的影响。以及在 L3 交换机互连链路中同时支持 IGP 路由、VLAN Trunk 及 MPLS交换的能力不够。今后的发展趋势,最完美的情况是逐步、彻底替代传统路由器,实现路由器所支持的所有功能,尤其需要在 MPLS 的支持能力上加强,如MPLS TE、L3 MPLS VPN 和 L2 MPLS VPN 技术。届时,随着 MPLS 技术、应用和标准的进一步完善,以 L3 以太网交换机构建的城域以太网络将可以提供真正的全业务,如已知的以太透传(点到点和点到多点) 、互联网上网,甚至利用 L2 MPLS 技术实现 AToM(Any Transport over MPLS)业务(PWE3 提供的ATM/FR/Ethernet/PPP 甚至 TDM 透传)。