1、ChinaNet 路由政策中国电信数据通信局2000 年 1 月1Chinanet 骨干网结构概述Chinanet 骨干网的拓扑结构逻辑上分为两层,即核心层和大区层。1.1 核心层核心层由北京、上海、广州、沈阳、南京、武汉、成都、西安等 8 个城市的核心节点组成。核心层的功能主要是提供与国际 internet 的互联,以及提供大区之间信息交换的通路。其中北京、上海、广州核心层节点各设有两台国际出口路由器,负责与国际 internet 互联,以及两台核心路由器与其他核心节点互联;其他核心节点各设一台核心路由器。核心节点之间为不完全网状结构。以北京、上海、广州为中心的三中心结构,其他核心节点分别以
2、至少两条高速 ATM 链路与这三个中心相连。1.2 大区层全国 31 个省会城市按照行政区划,以上述 8 个核心节点为中心划分为 8 个大区网络,这 8 个大区网共同构成了大区层。每个大区设两个大区出口,大区内其它非出口节点分别与两个出口相连。大区层主要提供大区内的信息交换以及接入网接入 chinanet 的信息通路。大区之间通信必须经过核心层。2路由协议当前路由政策国际部分采用 BGP4 与国外其它网络进行路由交换,国内部分采用 BGP4 进行与省网内进行地址交换,而采用 IS-IS 进行骨干网内部的路由选择。2 . 1 BGPBGP 是域间路由协议。Chinanet 骨干网申请的自治域号为
3、 4134,Chinanet 作为一个独立的自治域,采用 BGP 路由协议与国际 internet 及各省接入网交换路由信息。骨干网内路由器之间是 IBGP,骨干网和国外及接入网之间是 EBGP。但是 IBGP 路由在自治域内只会向前传递一次,所以 IBGP 路由器之间需要具有全网状连接,才能保证每台路由器都收到完整的路由,但是骨干网内路由器数量很多,做全网状连接是不现实的,因此骨干网采用 BGP Confedration 的方法;对内将骨干网用私有 AS 号划分为 9个私有 AS 域,每一个小的自治域中, IBGP 采用全网状的联接方式,自治域之间为 EBGP 联接方式。对外通过 BGP C
4、onfedration 将这些 AS 集合成一个独立的 AS 4134。这样,ChinaNET 骨干网就采用 AS 4134 分别与国际 Internet 以及各省网交换路由信息,在内部用私有 AS 号交换路由。2 . 2 ISISISIS 是一种 IGP(内部网关协议) ,通过 ISIS 路由协议可以对从 BGP 学来的 nexthop 进行寻径。在 ChinaNET 骨干网中使用 single IGP。即核心层及八个大区层网络中使用同一个 Tag(core)的 IS-IS。采用 Single IGP 的好处是所有的 IS-IS 路由器可以正常地交换 IS-IS 路由信息。如果采用不同的Ta
5、g,则不同 tag 下的 isis 彼此交换路由,需要 redistribute,这将导致许多不必要的麻烦。2.1.1 AREA 的划分ISIS 路由协议是一种 link state 路由协议,它的一个特点就是在一个域内可以分为很多个区,如果一台路由器的路由表发生变化,它就会向本区内的其他路由器广播这一变化,直到同一区内的所有路由器都将形成一张完全相同的本区的拓扑图为止。由于 ChinaNET 骨干网路由器及链路数量很多,如果所有路由器都在一个区的话,每一条路由的变化,都会导致全网的路由器进行路由更新,这将大大降低网络的效率。因此根据骨干网的网络结构状况,将 chinanet 划分为九个 IS
6、-IS 域,核心层网络与八个大区层网络分别处于一个独立的区域内。这样就将链路状态的频繁变化对网络的影响限制于一个区域内部,而不致于对全网产生影响。2.1.2 Level-1 和 Level-2 路由在 ISIS 中,路由可分为两类:level-1 和 level-2。level-1 的链路信息可以从 level-2 的链路上广播,而 level-2 的链路信息不可以从 level-1 的链路上广播。level-1 的路由和 level-2 的路由在路由器内分别在两个数据库中。如果某台路由器只有 level-1 路由的数据库,则称为 level-1 router ,反之为 level-2路由器。
7、level-1 router 只和与它具有相同 area id 的路由器交换路由信息,而 level-2 路由器可以和与它具有相同 area id 的路由器交换路由信息。如果 level-1 router 发现 IP 包的目的地址与它的 area id 不同,它就会将此包自动转发到离它最近的(并不一定最好)的 level-2 路由器上。区分 level-1 和 level-2 路由可以减少路由交换的数量,提高网络的效率。2.1.3 ISIS metricISIS 的路由选择通过 metric 实现,metric 值越小越优先。Metric 的范围为 063,缺省为 10。目前 Chinanet
8、 骨干网根据主要根据链路带宽的大小设置 metric 的优先级,带宽越大,metric 值越小,这样网络可以动态地优先选择大带宽的路径。2.1.4 静态路由和直连路由的广播路由器上设置的静态路由,为了使它加入到 ISIS 的路由表中去,需要将静态路由 redistribute 进ISIS 中。同样,在 isis core 的边缘上路由器,如国际出口链路和大区与接入之间链路,也需要redistribute 进 ISIS。Redistribute 的原则是:国际和核心路由器 redistribute 进 level-2,大区出口路由器 redistribute进 level-1 和 level-2
9、,大区内路由器 redistribute 进 level-1。3 国内路由政策国内路由在全网范围内进行广播,路径选择首先选择被访问地址所属省网的出口,然后选择到此省网出口的最短路径。大区第一出口节点、非大区出口节点首选大区第一出口作为访问其它国内地址的出口,大区第二出口首选大区第二出口作为访问国内其它大区地址的出口。3.1 核心路由器与国际出口路由器之间的路由政策3.1.1 BGP 在北京、上海和广州这三个国际出口分别设了两台国际出口路由器,同属 AS64999,为了减少 IBGP 的数量,采用了 route reflector 技术,将核心路由器作为 RR server,国际路由器作为 RR
10、 client,这样其他核心路由器不和国际路由器做 IBGP,也能接收到国际路由。3.1.2 ISIS 国际路由器与核心路由器之间的连接均为 level-2。 两者采用 155M 的 POS 相连,因此 metric=5。3.2 核心与核心路由器之间的路由政策3.2.1 BGP 核心与核心路由器之间以 Loopback 地址为 neighbor 做 IBGP 的 full-mesh。 核心路由器之间的 IBGP 不做任何控制,所有的核心路由器都接收全路由表。3.2.2 ISIS 所有核心与核心路由器之间的连接都是 level-2 only。 isis 的 metic 按附录二设置。3.3 核心
11、与大区出口路由器之间的路由政策每个大区现在除与本大区核心路由器相连的第一出口之外,还设有第二出口与另一台核心路由器相连,作为第二大区出口。3.3.1 BGP 核心与大区出口路由器之间为 confederation 内的 EBGP,以 interface 作为 neighbor。 为了减少大区路由器的负载,提高网络效率,在核心路由器向大区路由器广播路由时,过滤掉国际路由,即大区路由器不接收国际路由。(北京除外) 北京大区路由器接收全路由表,与核心路由器之间的 IBGP 不做任何控制。3.3.2 ISIS 所有核心与大区路由器之间的连接都是 level-2 only。 在大区出口路由器上设置缺省路
12、由,分别指向与本其直连的核心路由器和另一出口路由器,这样大区出国的路由均根据静态路由的指向出国。 国内的路由及入大区的流量根据 metric 值的大小动态调节。 isis 的 metic 按附录二设置。3.4 大区与大区路由器之间的路由政策3.4.1 BGP 大区内所有路由器做 IBGP full-mesh.。 大区路由器之间 IBGP 不做任何控制。3.4.2 ISIS 大区内的连接定义为 level 1。 大区非出口路由器定义为 level-1 router。 大区非出口路由器出大区,选择离它最近的 level-2 路由器。3.5 大区路由器与接入网之间的路由政策大区与接入网之间为 EBG
13、P,且原则上不做控制。对于到骨干网有两个出口的接入网,由接入网自行设置流量分担。对于省网广播上来的路由,骨干网在国际路由器上重新进行 aggregate,以 4134 广播出去,从而隐藏掉各省网的私有 AS。根据 BGP 协议的规定,对地址进行 aggregate 时,BGP 路由表中必须有关于该地址块更小的路由。例如骨干网要 aggegate 一个 64 个 C 的地址块,接入网必须以两个 32 个 C 的地址块广播给骨干网。4 国际路由策略在北京、上海和广州这三个国际出口分别设了两台国际出口路由器,接收国际路由,分别广播给所在节点的核心路由器,再广播给其它的核心路由器。大区路由器不接收国际
14、路由表,靠缺省路由选择路径。4 . 1 目前 CHINANET 在北京、上海、广州设有国际出口,负责国内不同地区地区的国际访问时的流量出口。下表说明的是不同出口所负责的地区:北京负责地区 北京大区、成都大区、长春、兰州、济南上海负责地区 上海大区、南京大区、武汉大区、西安大区、沈阳大区、南宁、天津广州负责地区 广州大区、重庆、长沙、福州某地区国际访问流量的流入和流出优先选择主要负责出口,并且以其它出口作为备份。对国外对等网访问时的路由可不受此原则的限制。4 . 2 路由政策的实现方法4 . 2 . 1 由于 IP 网络选路的原则是只根据目的地址选路。因此,流出时,一方面要通过调整接收国际路由的
15、属性,另一方面还要调整国内路由,使主要负责出口距离最短的来实现,但只能原则上实现,不排除从非主要负责出口流出的可能。流入时,通过调整国内不同地址块向国际广播时的属性来实现。4 . 2 . 2 根据国际上一些 ISP 的规定,Chinanet 新广播出去的路由必须先在国际公共的路由注册机构进行注册之后,才给予接收。目前 Chinanet 的地址是在MCI 的数据库中注册,MCI 同意之后,再通知 AT&T 等 ISP 接收。 4 . 3 划分的依据:4 . 3 . 1 地理位置及网络拓扑:北京主要负责华北、东北及西南地区,上海负责华东、华中和西北地区、广东负责华南地区。负责出口的节点要有和此节点
16、直联的电路,或与此节点所在大区的核心节点有直联电路,作为大区的第二出口节点由直联的节点出口负责。4 . 3 . 2 流量均衡由于目前的统计手段还无法确知某省的国际流量情况,因此由此省的接入流量代替,由于国际与国内可以近似看作成一定比例,故通过比较省内网流入和流出骨干网的总流量,可知按上述范围划分基本可以保证三部分的流量基本平均分配在三个出口上。5 政策调整今年年初根据安排 CHINANET 的国际出口带宽会有大幅度的提高,因此路由政策也需要有相应的调整。根据目前所掌握的流量情况,原有的负责范围调整如下:北京负责地区 北京、河北、内蒙、山西、沈阳、河南、吉林、黑龙江、山东上海负责地区 上海、浙江
17、、江苏、安徽、湖北、天津、江西、陕西、甘肃、青海、宁夏、新疆、广西广州负责地区 广东、福建、湖南、海南、四川、云南、贵州、西藏、重庆5 .1 分配原则的调整基本继续沿用以前的流入、流出原则并增加以下原则:为减轻国内流量压力,北京、上海、广州本地地址流量在本地的一条出口中断时,原则上从还从本地其它流入,其它在主要负责出口中迂回到非主要出口流入。5 . 2 其它需要注意调整的原则5 . 2 . 1 鉴于国际带宽的大幅度增长,国内带宽要相应的具有对国际带宽不稳定时的备份功能。北京、上海、广州之间的带宽应不少于 4 条 155M。5 . 2 . 2 为了使路由政策能够准确实现,应该变目前 IS-IS
18、metric 严格按照带宽取值的情况。大区出口到主要国际出口的数值应为 10,备分出口应为 15;非大区出口到大区第一出口的数值应为 10,到第二入口应为 15。5 . 2 . 3 建议采取预设相应的 community string 与 LOCAL PREFERENCE 的对应关系来使对方能够调整不同出口之间流出 CHINANET 的流量平衡;如:4134:480 代表 80 ,4134:500 代表 100,4134:520 代表 120。附录附录一 ISIS area id 表AREA 名 AREA 号核心 0北京大区 1沈阳大区 2南京大区 3上海大区 4广州大区 5武汉大区 6成都大
19、区 7西安大区 8附录二 ISIS metric 与 Bandwith 对应表带宽大小(Mbps) METIRC 值2M 以下 602M 555 5010 4520 4030 3550 3070 25100 15120 10150 5附录三 三出口负责地区接入流量表附录四 调整后的国际带宽分配和路由政策:1 . 北京1.1 至美国 155M 一条 1.1.1 播出:北京负责地区路由不作控制;其它路由加 4 个 AS 1.1.2 接收:不作控制1.2 至 P-NAP 45M 一条1.2.1 播出:北京地址不作控制;河北、内蒙、山西、沈阳、河南、吉林、黑龙江、山东路由 metric=50;其它路由
20、加 4 个 AS,metric=1001.2.2 接收:P-NAP 本身的路由不作控制;其它 LOCAL PREFERENCE 降低至 901.3 至 verio 45M 一条 1.3.1 播出:北京地址 2914:490;河北、内蒙、山西、沈阳、河南、吉林、黑龙江、山东路由加 4 个 AS 2914:490;其它路由加 4 个 AS,2914:4601.3.2 接收:verio 本身,UUNET,MCI-CW 的路由不作控制;其它 LOCAL PREFERENCE 降低至 901.4 至 verio 8M 一条 1.4.1 播出:河北、内蒙、山西路由不作控制 2914:490;其它路由加 4
21、 个AS,2914:4601.4.2 接收:verio 本身,UUNET,MCI-CW 的路由不作控制;其它 LOCAL PREFERENCE 降低至 902 .上海2.1 至美国 155M 一条 2.1.1 播出:上海负责地区路由不作控制;其它路由加 4 个 AS 2.1.2 接收:不作控制2.2 至 P-NAP 45M 一条 2.2.1 播出:上海地址不作控制;安徽、湖北、天津、江西、陕西、甘肃、青海、宁夏、新疆、广西 metric=50;其它加 4 个 AS,metric=1002.2.2 接收:P-NAP 本身路由不作控制;其它路由 LOCAL PREFERENCE 降低至 902.3
22、 至 AT&T 45M 一条 2.3.1 播出:上海地址不作控制;江苏、浙江、安徽、湖北、天津、江西、陕西、甘肃、青海、宁夏、新疆、广西加 4 个 AS;其它加 6 个 AS2.3.2 接收:不作控制3 . 广州3.1 至美国 155M 一条 3.1.1 播出:广州负责地区不作控制;其它路有加 4 个 AS3.1.2 接收:不作控制3.2 至 Global One 45M 一条 3.2.1 播出:广东地址不作控制;福建、湖南、海南、四川、云南、贵州、西藏、重庆不作控制加 4 个 AS;其它加 6 个 AS3.2.2 接收:Global One 本身路由、 UUNET、MCI-CW 路由不作控制;其它 LOCAL PREFERENCE 降低至 903.3 至 verio 16M 一条 3.3.1 播出:福建、湖南、海南、四川、云南、贵州、西藏、重庆不作控制;其它加 4个 AS3.3.2 接收:verio 本身的路由不作控制;其它 LOCAL PREFERENCE 降低至 904 . 国外对等网国外对等网及其子网地址 LOCAL PREFERENCE 升高至 500;对外广播地址一般不作控制,确实需要在多条链接上进行分担时采取对广播路由加 metric 的方式;5 . 国内对等网国内对等网的地址优先从北京出口广播;广州、上海广播时加 4 个 AS;