1、Network Design 第三章 现有网络分析,中国科学技术大学网络学院 李艺 ,第一章 概述 第二章 用户需求分析 第三章 现有网络分析 第四章 逻辑网络设计 第五章 网络设备选择 第六章 WAN接入设计 第七章 网络介质设计 第八章 网络设计案例,3.1 网络性能概念 3.2 调查现有网络的特征 3.3 调查现有网络流量特征 3.4 估测通信容量和模式 3.5 局域网数据流量的基线法测量 3.6 编制流量说明书,3.1 网络性能概念,网络性能定义: 容量(带宽):电路或网络传输数据的能力,通常以美妙多少比特来衡量。例 T1信道的容量是 64Kb/s 表示该信道的上限是64Kb/s。 利
2、用率:所能使用的全部可用容量的百分比。 最优利用率:网络饱和之前的最大平均利用率。 吞吐量:单位试时间内节点之间(通常为秒),成功传输的无差错数量。 可提供负载。在某一特定时间,准备发送的所有网络节点的所有数据的数量。 精确度:相对于全部通行量,正确传送的有用的通信数量。 效率:产生一定数量的数据吞吐量所需努力的测量值。 延迟(等待时间):帧准备从一个结点传送到网络其他任何节点之间的时间。 延时变化量:平均延时变化的时间量。 响应时间:网络服务请求和响应该请求之间的时间。,最优网络利用率 共享以太网的典型“规则”时,平均利用率不超过37%,因为超过这一极限,碰撞比率辉急速增加。这一比率和实际拓
3、扑结构有关。 对广域网来说合理的网络利用率在70%。 吞吐量 吞吐量的定义是单位时间内传输的无差错的数据数量。 网络互连设备的吞吐量:PPS(packet per second)一般用64bit包来测量。例如:10Mb以太网的最大PPS值 14,880,如果有一个30端口的交换机,它的理论最大吞吐量为:14,880*30=446,400PPS 应用层的吞吐量 端到端的差错率 协议功能,例如握手机制、窗口、应答等。 协议参数,如帧大小和重发定时器。 网络互连设备的PPS或CPS(每秒字符率)。 工作站及服务器性能因素,吞吐量,吞吐量:描述了整个网络真正有用的容量。带宽给出了网络所能传输的比特数,
4、那么吞吐量就是它真正有效的数据传输率。衡量有效吞吐量的参数是信息比特吞吐率(TRIB),计量单位有: PPS 数据包每秒 CPS 字符每秒 TPS 事物处理每秒 TPH 事物处理每小时,精确度 对广域网线路,可用误位率(BER)阈值来说明。模拟链路的典型BER阈值为10-5。数字链路要低的多,光缆链路的错误率约为10-11 ,铜线链路的错误率约为10-6。 在共享以太网中,错误通常是由碰撞冲突引起的。受合法冲突(碰撞发生在帧的前64字节内)影响的帧不应该超过0.1%,这不包括出现在8个前导符的冲突,因为故障排查工具不会记录这种记录;受滞后冲突(late collision,发生在前64字节之后
5、的冲突)是不合法的。但以太网经常发生大量的滞后冲突,因为发送最小帧长的站点无法在允许的时间间隔内侦听到其它站点。网络的大量额外传播延迟导致在相距最远的节点之间发生大量的滞后冲突。发生故障的中继器和网卡也会产生大量的滞后冲突。全双工以太网不会发生冲突,否则便市全双工不匹配。广域网链路上也不应该发生冲突。 效率 网络效率明确了发送通信需要多大的系统开销,不论这些系统开销是否由碰撞、令牌传递、错误报告、重新路由、应答、较大的帧引起的等。,延时与延时变化量 不同的应用对延时和延时变化量的容忍程度不同。 引起延时的原因 延时与数据传输技术有关,尤其是卫星链路和长距离陆地电缆。 将数据放到传输线路的时间,
6、取决于数据容量和传输线路速度。例如,在1.544Mbps的T1线上传输1024字节的分组要花费5毫秒。 分组交换延时。 分组交换的队列深度。 队列深度=利用率/(1-利用率)例如,一个分组交换机由5个用户,每个用户每秒提供10个分组。分组的平均长度是1,024位。分组交换机需要在56Kbps广域网电路上传送这些数据。 负载=5x10x1024=51,200bps 利用率=51,200/56,000=91.4% 队列中的平均分组数量=(0.914)/(1-0.914)=10.63分组 延时变化量 对于不能提供准确目标的客户,基本规则是变化量应该低于延时1%2%。例如,对于平均延时为40毫秒的目标
7、,变化量应该不超过400或800微秒。,响应时间:从对服务器提出请求开始到收到的响应时间,常用于评价交互式终端从一个主机请求信息的情况。用户不了解传播延时和抖动,也不明白每秒多少分组或每秒多少兆字节的吞吐量。他们关心的是当他们启用一个应用到得到结果的响应时间。当响应时间超过100毫秒时,用户就会变得不耐烦。作为经验值,100毫秒阈值适用于交互式应用。根据要采用的技术告诉用户需要等待时间的长短。响应时间是数据通过网络中的每一部分所需时间的总和。包括:轮询延迟链路延迟设备延迟时间CPU延迟,主/从结构中的响应时间,客户机服务器结构中的响应时间:在客户机服务器结构中,响应时间是服务器对客户机工作站的
8、请求作出响应的时间。 网卡延迟 物理介质延迟 服务器延迟,公共网络延迟:请求/应答数据通过公共广域网时,响应时间会发生很大变化。这种延迟非常难以预测,而且会随着时间的不通而产生变化。,CPU利用率:是指在处理网络的请求和作出响应时处理器的繁忙程度。当CPU利用率超过某个值时,网络整体性能就会下降。路由器必须处理转发数据以外的事物。,链路利用率:是指链路带宽的有效利用百分率。例 T1线路有 24条信道,每条信道最大带宽为64Kb/s,如果只充分利用6条信道,该线路利用率为 (64Kb/s * 24)/(64Kb/s * 6) = 25% 带宽是指可以通过通信线路或通过网络的最高频率与最低频率之差
9、。 模拟网络以 Hz 为计量单位; 数字网络以 b/s 为计量单位; 不同应用需要不同带宽: 数字音频 1-2 Mb/s PC连接 56 kb/s 压缩视频 2-10 Mb/s 全运动视频 1-2 Gb/s 当网络连接利用率达到100%的时,网络性能会严重下降。 广域网链路最佳利用率为 70%。,3.2 调查现有网络特征,对现有网络进行调查,是为了判断原网络是否可以很好地扩展,性能是否能达到预期设想。对网络的调查包括拓扑结构、物理结构以及网络技术性能的调查。具体来说,调查包括如下调查内容: 网络基础结构特征 现有互联网络健壮性检查 网络健康检查表 刻划通信流量特征,网络基础结构特征,绘制网络拓
10、扑图 地理信息 广域网线路 楼宇和楼层及可能的房间或配电室 WAN和LAN数据链路层技术的标记 WAN服务提供者的名字 路由器、交换机和集线器的位置 VPN的范围和位置 主服务器和服务器长的位置 大型主机的位置 主要网络管理站的位置 VLAN的范围和位置。 所有防火墙安全系统的拓扑结构 所有拨入拨出系统的位置 工作站所处位置的标记 逻辑拓扑结构或网络结构的描述,网络寻址和命名的特征:使用什么样的命名系统或命名规则?使用了子网或超网技术没有?子网掩码是多少?DNS名字是什么?等等。汇集入表册。 布线与介质特征:使用了什么样的传输介质?以及它们的型号,如何布线的等。汇集入表册。 检查建筑物及环境约
11、束,汇集入表册。 空调、供暖、通风、电源 电磁干扰保护 用于无线传输和无反射表面的干净的路径 可以锁住的门 足够的空间布线、配线板、设备架、工作空间,现有互联网络健壮性调查,调查现有网络的性能,可以给新设计的网络一个参照的基准线。如果现有网络太大没法测量调查,可以只调查与新网络互联操作最多的一段,或者只调查老网络的主干段。如果用户想要降低费用,并且不在乎性能的低劣,必须记住原有网络的性能,来证明新设计的网络从一开始就没有优化,而新设计的网络也没有导致网络性能更低。 指定网络性能基线制定网络性能基线应尽量在正常流量负载期间进行,同时注意: 检测时间必须分配足够多的时间段。短时间段里测得的网络性能
12、,可能与实际情况发生严重的偏差; 找出特定时间段里流量异常的原因。比如,对于商业POS系统,逢年过节的网络流量要比增长出许多倍;如果一个网站域名被热点站点连接或被列入搜索引擎里,流量的增长将是不可预料的。 出错、延时、丢包的频繁发生,也会引起流量的增加。 如果用户的主要目标是在峰值期间提高性能的话,一定要调查峰值负载期间的性能。,分析网络可用性以文档形式调查现有网络的可用性的诸项特征。包括重要网段的平均无故障时间(MTBF)、平均修复时间(MTTR),新设计的网络是否希望提高这些技术指标。,分析网络利用率网络利用率(Network Utilization)是指在特定时间间隔内使用了多少带宽的的
13、测量值。可以通过协议测量带宽利用率。为此,必须在各个主要网段上安置协议分析仪或远程检测探针。将测量数据汇总成表册:,分析网络精确度网络精确度衡量目的节点收到的数据与发出的数据的正确比。可以用误码率BER来度量。对于数字信道来说,铜缆的误码率约为10-6,而光缆的BER约为10-11。对于LAN 而言,通过比较错误帧的数量与全部帧的数量,可以估算出它的EBR。一般约为10-7。 可以在串行线路上使用BER测试仪(也叫BERT)测试链路上全部传输的比特中出错的比特量。 半双工交换机遵循CSMA/CD的正常规则,一个经验门限值是千分之一的帧可能遇到冲突。应该没有滞后冲突。 一个交换机端口如果只与一个
14、设备相连(如,一台服务器、一台工作站),则该链路的两端都应该设置为全双工,就不会发生冲突。因为全双工以太网不是CSMA/CD,只有两个站点发送数据,而各自又有专用信道,它们不是多路访问(MA)。站点不需检测载波信号,因为没有其他人往线路上发送信息。因此不需要载波检测(CS),也不需要碰撞检测(CD)。,半双工与全双工设备同时在网上时,存在不能自动协商,不兼容的问题。主要原因是一些老设备如网卡和交换机并没有完全遵循802.3u规范致使硬件不兼容。结果是,点到点链路中老设备一端成为半双工(如老网卡),而新设备的一端被设置成全双工(如新交换机),这种错误的配置产生大量的冲突。尤其是服务器网卡,一定要
15、检测是不是全双工网卡。检测发现双工不匹配的方法,是在链路的两端查看数据包错误的数量和类型。在一端查找 CRC 和 Runt 错误。全双工的一端不需要载波监听,想发数据就发数据,而半双工一端需要载波监听,并在检测到其它端在传输时停止本次传输,报告一个冲突,等待一段时间后再重新传输。半双工停止传输的结果通常是一个Runt帧(短于64字节的帧),并且总是一个CRC错误帧。 全双工端接收Runt和CRC错误帧并且报告这些错误,而半双工帧则报告冲突。当双工不匹配时,注意错误的不对称性。 如果网络中存在3类双绞线,它不能支持100Mbps、1000Mbps的高频信号,双工自动协商的LAN 上会发生很多错误
16、,解决的方法只能是手工配置成10 Mbps网络,分析网络效率利用传输大尺寸的帧可以提高网络效率。 如果将网络应用程序和协议配置成每一帧都能发送大量的数据,就可以提高网络带宽的利用率,从而将事务处理所需要的帧和往返延迟降到最低。 改变服务器和客户机的接收窗口为最大值,在向发送方发出确认之前可接收多个数据帧,从而提高带宽传输效率。 在路由器上增加最大传输单元(MTU)数值,也可以提高效率。但用语传送语音和其它实时流量的低带宽链路不适用。我们常使用协议分析仪来确定用户已有网络效率,检查网络上当前帧的尺寸。协议分析仪可以输出一张表,显示各种尺寸的帧的流量。 大多数帧是64字节的应答。 HTTP多数情况
17、下使用1500字节的数据包。 Web托管的用户如果一直使用传输将网页发送到Web上,就会有更多的1500字节帧。 小于最小帧长度(64byte)并且具有正常FCS的帧,即Runt帧,多由网络产生了严重问题,如网卡故障、双工匹配等造成。,网络性能数据应该是双态、多态或者偏离均值。典型的帧尺寸分布图通常呈两个峰值,称为双模态分布,双峰分布(bimodal distribution) ,也称为驼峰分布(camel-back distribution)。大量的帧分布在驼峰附近。但平均帧长的地方实际上没有多少数据包。如果网络性能数据是双模态、多模态或偏离均值,就应该记录与均值测量值的标准偏差。分析帧尺寸
18、不但能了解网络效率,还能了解网络健康情况。由于访问争用,冲突发生的概率与效率成正比。但如果利用率没有增加,或只有几个节点在传输的情况下,冲突发生频繁,就可能是网络产生了严重的问题所致,如网卡故障、双工不匹配等问题造成。,分析响应时间为验证新网络设计性能是否达到要求,在网络设计实施前后,测量重要网段上设备之间的响应时间十分重要。可以用很多方法测量出响应时间。根据数据分析仪查看数据帧之间的时间总长,可以推断出数据链路层、传输层、应用层的大致响应时间。测量响应时间的常规方法是ping数据包,并获得其往返时间(RTT),记录如下表:表中节点指路由器、服务器、客户机、大型主机等。,检查主要路由器、交换机
19、、防火墙的状态最后是检查网络上互联设备的状态。检查它们的忙碌程度(CPU利用率)、设备处理了多少数据包、丢弃了多少数据包以及缓存和队列的情况。,网络健康调查表,网络拓扑结构和物理基础结构均被良好记录。 网络地址和名称已结构化方式分配并被良好记录。 网络连线以结构化方式安装,并做好了标记。 电信设施接线柜与末端点的网络连线总体上不超过100米。 网络是否满足当前用户需要。 是否已经有共享以太网段饱和(10分钟平均利用率超过50%) 是否由WAN链路饱和(10分钟平均利用率超过70%) 每百万字数据中,是否CRC错是否超过一个。 每个网段上广播是否超过20%。 没有任何路由器被超量使用(5分钟CP
20、U利用率超过75%)。 平均来说,路由器丢失的分组不超过1%。 客户机与主机响应不超过100毫秒。,3.3 调查现有网络流量特征,网络流量特征包括通信流量、流量负载和协议行为特征。通过对现有网络流量特征的调查,有助于我们透彻分析现有网络的流量行为特点,帮助我们选择满足用户建网目标的合适的逻辑网络设计和物理网络设计的模型。我们从流量、负载、行为和服务质量等诸多角度来考察网络的流量特征。包括: 调查通信流量特征; 调查流量负载特征; 调查流量行为特征; 调查服务质量需求特征。,调查通信流量特征,调查通信流量特征,主要关心流量的源和目的地,以及数据传输的对称性。在一些应用中,流量是双向的,而另一些应
21、用中流量则是单向的。大多数应用中,如Web应用、C/S数据库应用和广播应用等,流量是非对称的。而象网上聊天等应用,流量则是对称的。调查现有网络的主要流量和存储位置调查通信流量,首先调查现有应用的用户组群和数据存储状况。,除此之外,还要还要调查主要数据的存储状况。存储位置可以是一台服务器、一组服务器群,或者是网络分布式存储。,调查现有网络的通信流量一个通信实体可以是一台主机、一个网络或一个自治系统。通信流量具有的属性包括:传输方向、对称性、路由选择路径和选项、数据包数量、字节数量、通信双方地址。弄清楚通信源与通信目的地之间每个独立的通信流量、流量行为特征、以及是否允许端点为流量指定性能需求。这些
22、调查资料主要是帮助设计者在使用诸如边界网关协议的对等系统路由选择协议中确定哪台路由器作为对等路由器。同时还能帮助我们完成如下工作: 了解现有网络行为特征; 便于网络的扩展和开发; 严整网络服务质量; 基于用户和应用分配网络资源。下面分别论述。,能够表征网络通信流量特征值,莫过于实体之间每秒流通的字节量。我们可以用协议分析仪或网络管理系统记录下重要端点之间的流量,并记录成册:,调查现有网络应用的流量特征流量特征,除了流量大小外,还有方向性与对称性。方向性刻画信息流量从哪里来,到哪里去;对称性刻画了流量是否是一个方向比另一个方向有更高的服务质量要求。许多网络应用在不同的方向上的流量有不同的要求,如
23、Web服务,下行带宽就要比上行带宽大得多。有些数据链路层技术,如非对称数字用户专线(ADSL)、就是典型的流量非对称性范例。我们可以将应用程序按流量类型分类,来区别流量的方向性和对称性: 终端/主机通信流量; 客户机/服务器通信流量; 对等通信流量; 分布式计算通信流量。,终端/主机通信流量终端/主机通信流量往往是不对称的。终端发送少量字符,主机回传许多字符。典型的应用是Telnet,缺省操作是,终端用户每键入一个字符,都形成一个数据包传给主机。当然这种缺省方式是可以改变的。比如,不是键入一个字符产生一个数据包,而是碰见回车键回超时才产生一个数据包,这样带宽利用率更高。但也会产生一些问题,比方
24、说使用UNIX的Vi全屏幕编辑器,必须立刻看见每个字符,以确定用户是否键入了光标符。网络应用中,终端/主机模式已经不是主流模式了。 客户机/服务器通信流量这是目前网络应用最普遍的一种模式。流量通常是双向非对称的。除了向服务器写数据采用大数据帧外,客户机发向服务器的帧都是典型的小帧。从服务器回传给可户机的信息帧长度在64到1500字节的范围。有时会更长。在TCP/IP环境下,许多应用都是在客户机/服务器模式方式实现的。如HTTP应用。,瘦客户机通信流量瘦客户机(thin client)是客户机/服务器的特例。用户的应用程序一般在中心服务器上,并在中心服务器上运行,只将结果返回给客户机。这种模式的
25、服务器完成大量的数据处理工作。这种模式也称为基于服务器的计算。瘦客户机通信的优点在于维护成本低,网管只要维护好中心服务器上的应用程序,不必配置分布在不同地方的客户机。但瘦客户机模式并不适用所有情况,比如,当用户客户机不需要连接服务器而仍能完成一些计算应用的情况。瘦客户机的通信流量是非对称的,服务器向瘦客户机发回的数据量很大。含有瘦客户机的网络需要足够的带宽和尽可能延时较小的拓扑结构。推荐使用交换网络,并且限制每个交换机的客户数量,以避免广播流量引起的问题。,对等通信流量对等通信中,通信流量往往是双向、对称的。典型的对等引用是小型网环境,可以将网络配置成对等网,每台PC机在网络中的地位彼此对等,
26、大家彼此共享数据。另一种范例是一组多用户UNIX主机,用户可以在主机之间建立FTP、Telnet、HTTP和NFS会话。每台主机都相当于客户机和服务器,在两个方向上都有许多流量。下载音乐、视频文件的P2P软件,如emule等软件,用户在下载网上的音乐、视频文件的同时,又把这些文件公之于众,以便其他网络用户下载。每个用户即使数据的分发提供者,有时数据的下载使用者。所以,总体来说,这类应用的通信流量既是双向的,又是对称的。ICQ、QQ之类的视频聊天软件,也是典型的对等通信流量,双方都传输自己的图象和字符给对方,也从对方接收图象和字符信息。流量也是双向、对称的。,服务器/服务器通信流量指服务器之间的
27、传输和服务器与管理程序之间的传输。服务器通过与其他服务器通信实现目录服务、告高速缓存常用数据、镜像数据以及广播服务。流量通常是双向的,并且大多数是对称的,但某些情况下,比如层次化结构的服务器群,一些服务器主要是发送数据,而另一些主要是接收数据。 分布式计算通信流量分布式计算需要多个节点协同工作。电影中的视觉效果就常常用分布式计算完成。半导体工业中的芯片设计和验证的极限计算,也常使用分布式计算。在分布式计算环境中,数据在任务管理器和计算节点之间,以及计算节点和计算节点之间传播。有些分布式计算,节点之间的流量很少,如松耦合型节点间的流量;而其他则可能很多,如紧耦合型节点间的流量。调查分布式计算应用
28、的流量,可能需要协议分析仪研究流量特征,或使用网络仿真器模拟潜在六。,IP语音网络的通信流量IP语音传送的网络流量可能是十分复杂的。因为网络中存在多重数据流:数字化音频数据流和控制信息流。传送音频数据的流量本质上对等的,而传送控制信息流则是客户机/服务器模型,但也使用分布式或对等式模型。控制信息包括呼叫控制和呼叫交换。呼叫控制包括呼叫的建立与拆除、遍址和路由,以及其他附加服务。在VoIP网络中,呼叫控制把电话号码或用户名字映射到目标IP上,使其能被包结构层理解。而呼叫交换是指实际的呼叫转接。在VoIP网络中,音频数据包有数据包结构层处理,数据包结构层是指以太网交换机和IP路由器。语音数据被封装
29、在RTP、UDP、IP和一个链路层报头中,它可能在互连网络上控制数据包使用不同的路径进行交换。当考虑带宽和QoS时,音频数据流和控制数据流是不同的。,记录现有网络应用的通信流量调查完现有网络的通信流量特征及类型后,我们将其记录并汇总成如下表格形式:,调查流量负载特征,弄清楚流量负载及其特征,为用户选择合适的网络拓扑结构及技术是非常重要的。调查流量负载有助于设计出有足够容量满足LAN间通信需求的网络,避免存在关键瓶颈的网络设计。当然,我们也可以在网络使用时遇见瓶颈问题,在拓宽网络带宽。但这不是可取的办法。在局域网成本如此低廉的今天,完全没有理由在设计阶段不把网络瓶颈杜绝掉。网络通信受许多因素的影
30、响,通信负载的调查也不可能精确。我们关心的网络负载特征值,主要是程序使用模式、数据包和会话之间的空闲时间、帧尺寸、流量行为模式。,计算理论流量负载流量负载是指某个特定时间网络节点准备发送的所有数据之和。网络设计者所寻求的是,网络容量应足以满足流量负载。一个简单的示例可以说明容量和负载的关系:对于一个容量为1 Mbps的网络,如果有1000个站点每秒钟发送1000比特的数据帧,则流量负载等于网络容量。这种方法适用于局域网、广域网链路、部分或全部互连网、交换机和路由器背板的容量计算。计算网络容量是否足够,我们只需要几个参数: 站点数目; 发送两帧之间的平均空闲时间; 一旦获得介质使用权,传输报文所
31、需的时间。可以用协议分析仪测评发送两帧之间的平均空闲时间和帧长,也可以按照各类流量类型,对各类发送两帧之间的平均空闲时间进行评估。,对客户机/服务器应用而言,服务器的空闲时间依赖于客户机的数量和服务器的性能(磁盘存取速度、RAM存取速度、高速缓存能力),使用协议分析仪,可以评估出服务器的的平均空闲时间。客户机空闲时间部分依赖于用户对网络应用程序的使用频度,通过网络分析仪和网络建模工具,可以评估出客户机的空闲时间。当然,建模工具所依赖的参数应该有MAC子层延迟、到达服务器和网络设备数据包的分布、以及网络设备上的队列和缓存机制等参量。当调查清楚了应用程序的大致流量负载后,可以用该负载乘以运行应用程
32、序的设备数量,就可以估算出应用程序的总负载。再结合已经调查的用户组群和数据存储方面的数据,就可以帮助设计者估算出应用程序所需的大致汇聚带宽。并填入前面介绍的“现有网络应用的通量特征表”中。,在估算流量负载时,还要考察应用程序的使用模式和服务质量。有些应用需要网络尽可能快地传递数据,而有些应用(如视频应用)则需要网络提供恒定数量的带宽。 有些程序不常使用,而一旦使用就要耗用大量带宽,例如,使用网络打印机打印文件。此时的网络流量特征和服务质量与平常相比就大不一样。下面我们来讨论应用软件使用模式对流量负载的影响。,记录应用程序使用模式我们关注应用程序模式以下一些属性: 用户组群、组群中用户的数量;
33、网络应用程序的会话频度; 网络应用程序的会话平均时间; 网络应用程序的并发用户数量。有了这些数据后,我们可以测算出针对每种应用中,所有用户的汇聚带宽需求。当然,如果某些指标难以求得,可以根据经验值作出一些假设: 假定用户数量等于并发用户数量; 假定所有的应用一直在使用,汇聚带宽计算值就是峰值的估算值; 假定每个用户只打开一个会话,而且会话维持到关机。,估算应用程序产生的流量负载估算应用带宽需求,需要弄清楚应用程序发送的数据对象长度、协议层开销和应用程序初始化的额外负载(有些程序初始化发送的流量比稳定操作状态发送的流量要大得多)。 各种应用程序网络传输数据长度的经验估算值:下表给出的应用程序流量
34、负载的估算有一定的参考作用,但不能代替对实际网络的透彻分析。,估算不同协议的流量开销应该调查各种应用程序使用的网络协议,一旦知道了哪种协议,就可以把协议报头开销加到数据对象尺寸中,以便精确地估算负载。下表给出了常用协议的报头尺寸大小:,估算站点会话初始化流量负载客户机使用应用程序时,往往有些网络初始化工作,而带来网络流量负载。尤其是校园网和经济势力弱的小型企业构建的LAN,这种流量负载会严重影响网络带宽和网络传输效率。,估算路由选择协议产生的流量负载网络设计阶段可能还没有为新网络选择路由协议,但应该调查清楚现有网络上运行的路由协议占用的带宽量。,调查流量行为特征,网络设计前,我们还需要理解协议
35、和应用的行为。例如,为了设计合适的LAN拓扑结构,需要调查LAN上广播流量级别。为了使LAN和WAN提供足够的容量,需要检查由于协议低效、非优化尺寸或重发定时器引起的额外带宽资源占用。广播/组播行为 什么是广播/组播帧:广播/组播流量是必要的,不可避免的。路由选择和交换协议使用它们来共享互连网拓扑结构信息;服务器使用它们通告自己的服务;许多协议(TCP/IP、NetBIOS、NetWare、AppleTalk)的桌面服务通过它们发现服务并检查地址和名字的唯一性。以太网广播帧是指网络中所有站点都要接收的帧,其目的地址是FF:FF:FF:FF:FF:FF;组播帧是指网络中部分站点接收的帧。,广播/
36、组播帧的行为二层网络互连设备如交换机、网桥,将向所有的端口转发广播和组播帧。对于大型交换网络或桥接网络,广播/组播帧的转发会带来可扩展方面的问题。三层网络互连设备如路由器不转发广播/组播帧。在路由器的一端连接的所有设备,都视为一个独立的广播域,而不于另一个端口连接的另一个广播域转发广播/组播帧。 网络的错误配置,如子网掩码错误,会导致工作站发出不必要的ARP帧,因为站点此时不能正确区分广播地址和单播地址。 网卡往往将收到的广播/组播帧交给工作站的CPU处理,处理高级别的广播/组播帧时,站点CPU就会被淹没,干不了其它事情。 广播辐射:指发送者扩散到广播域中所有设备的广播流量的效应。网络设计中,
37、广播域应尽可能地小,以减小广播辐射(broadcast radiation)产生的网络效率的降低。 减小广播辐射的方法 通过用路由器互连网络,因为路由器不转发广播帧。 通过VLAN的划分。VLAN中的广播流量不会传送到VLAN以外。LAN中如果超过20%的流量是的广播/组播流量,就要用这两种办法之一,来减小广播域范围。,通过以上分析,网络拓扑结构设计时,就必须考虑桌面协议的广播行为。下表给出了常用桌面协议广播域中站点数目的推荐值。如果IP用户正在运行需要的高带宽应用、低延迟应用或高级别广播/组播的视频应用,下表的推荐的最大站点数应从500减小到200。,网络效率调查网络效率是指应用和协议是否高
38、效利用带宽。效率受帧尺寸、使用的协议交互作用、窗口和流量控制以及错误恢复机制的影响。 帧尺寸我们已经讨论过,在批量数据应用模式下,使用介质多支持的最大帧尺寸有利于提高网络性能。尤其是文件传输,尽可能采用最大传输尺寸MTU的帧长。在IP环境里,我们却要避免增加MTU使其超过介质所支持的最大帧尺寸,以避免帧的分段和重组,因为分段重组导致性能下降。现代操作系统支持MTU发现功能,使用MTU发现,软件能够动态地发现和使用可通过网络传输的最大帧尺寸,以避免分段。 协议交互作用协议交互作用和确认应答定时器的参数配置不当,也会导致网络效率降低。为避免这些情况的发生,我们应该增加应答定时器长度等参数的设置。,
39、窗口调节和流量控制要了解网络流量,需要了解窗口调节和流量控制。最佳窗口尺寸等于链路带宽和链路延迟的乘积。为有效使用带宽,发送窗口应该足够大,以便发送者能够在停止传送等待确认之前将数据完全充满带宽管道。比如,使用TCP/IP协议传送/接收数据的一对站点,发方可以快速发送数据段,不需要等待确认,直到发送窗口用完为止。站点的发送窗口大小由收方窗口大小(即收方剩余内存)决定。收方在每个传往对方的TCP数据包中申明它准备接收的多少数据,发方根据这一数据和自己处理数据的速度动态调节自己的窗口尺寸。如果增加站点内存,提高CPU处理能力,就可以获得更大的接收窗口,从而提高网络效率。窗口尺寸可以从几个字节到65
40、535字节变化。,但在高带宽大延迟的“长肥管道(long fat pipe)”链路上,比如高容量卫星信道或长距离光纤链路上,带宽与延迟的乘积远远大于65535,包括这种路径的网络叫 LFN ,此时,建议使用基于RFC1323的TCP。它定义了一个窗口比例扩展,通过比例因子将TCP报头中的窗口字段由16比特扩展到32比特,但TCP窗口字段中仍用16比特表示,在TCP三次握手过程中,主机可以通过TCP中的选项字段来表明他支持窗口比例扩展。有些传输层协议采用UDP而不是TCP,此时它要么没有流量控制,要么在会话层或应用层进行流量控制。,下面列出了常用协议哪些是基于TCP,哪些是基于UDP: 基于TC
41、P协议:FTP: 端口20(数据口)、21(控制口);Telnet: 端口23;SMTP: 端口25;HTTP: 端口80;SNMP: 端口161、162; 基于UDP协议:DNS: 端口53;TFTP: 端口69;DHCP服务器: 端口67;DHCP客户机: 端口68;RPC: 端口111.,差错恢复机制糟糕的差错恢复机制设计会浪费带宽。例如,等待时间过短,还没有收到确认就认为确认丢失而重传数据。进而,由于此时带宽被占用,这可能由引起网络其余部分性能下降。无连接协议通常不执行差错恢复,情况稍许好些。而面向连接协议的差错恢复机制有多种。TCP实现自适应重传算法,当网络拥塞时,降低重传速率,从而
42、提高网络利用率。在容易出错、高延迟的路径上,TCP的确认方式造成很低的吞吐量。因为TCP的确认应答ACK一直累计到错误发生点。如果某数据段丢失,即使后面的数据段都收到了,ACK码也只是累计到丢失前正确接收到的数据段的最后一个字节加1。对于接收者来说,没有办法报告接受数据中漏洞的位置。使得发送者要么等待一个数据往返时间检查出每个丢失的段,要么重发所有数据。RFC2018纠正了这一错误,它提供了一种选择确认机制SACK,告诉发送者哪些数据段是已接收了的非邻近数据块,发方可以只选择丢失的数据段重发。许多新的TCP协议实现包含了这一算法。使用协议分析仪,可以确定客户的协议是否有效地实现了差错恢复。有些
43、情况下,可以配置重传和超时定时器,或升级到更好的协议实现。,网络通信检查表,我已辨别了现有网络的主要通信源和存储,并记录了两者之间的通信流量。 我已经将每一个应用程序的通信流量进行了归类。 我已经估计了每一项应用的带宽需求。 我已经估计了路由选择协议的带宽需求。 我已经按广播/组播、效率、帧尺寸、窗口和流量控制、差错恢复机制等刻划了网络通信的特征。 我已经将每一项应用的服务需求进行了分类。,3.4 估测通信容量和模式,通过检测网络数据流量的总容量以及个体通信模式或数据流量可以反映出网络运行的瓶颈。 数量流量的方向 通信边界 数据流量分配,数据流量的方向,数据流量的方向决定了在不同网段上的数据流
44、量大小。 对等 客户机服务器 服务器客户机 每个网络节点可以在在一个或多个模式中通信,对等通信,对等通信常见于相似节点(客户机)之间的通信。 进行通信的节点有相似的应用程序和通信能力,而且每个节点与网络中另一个节点通信时都很相似。 对等通信没有明显的源或目标通信模式,客户机-服务器和服务器-客户机的通信,客户机-服务器通信描述了任意一个端节点(客户机)和一个共享资源(服务器)之间的通信。 客户机-服务器通信是有方向的。 客户机到服务器的发送 流向服务器的信息要比流出的信息多得多 服务器到客户机的发送 流向客户机的信息要比流出的信息多,数据流量的方向特征,服务器到客户机的发送,通信边界,冲突域和
45、广播域 物理边界 逻辑边界,未划分网段的网络,由中继器和集线器组成的局域网是一个冲突域,所有的节点以竞争的方式访问同一个共享介质集线器和中继器传输广播信息给网络上的所有节点,所以这种冲突域也是单一的广播域,被交换机划分网段后的网络,交换机和网桥能将一个单一的大局域网冲突域网段分成几个小的冲突域,提高网络性能由交换机产生的冲突域个体仍然是同一个广播域的成员,物理边界,逻辑边界,数据流量分配: 传统的流量 80/20规则,数据流量分配: 现今的流量 80/20规则,客户机,估计通信容量,估计通信容量的通常步骤: 将网络分成可理解的网段 估算每个网段上的应用数据流量 估算本地和远程网段上的通信信息分
46、配 对每个网段重复上述步骤,然后结合每网段的估算值得到广域网和主干网数据流量分析,将网络分成独立的网段 一般按照工作组或部门来划分网段 在分别分析网络的各个部分时,我们将被研究的网络部分当作“白箱”,把其他部分当作黑箱。 估算每个网段上的应用数据流量 可以利用需求分析阶段的调查数据估算每个网段的流量。 估算本地和远程网段上的通信信息分配 每个应用程序的用户通常扩展到公司以外,因此,我们必须估算每个应用程序的总数据流量分配。 我们需要寻找能指导逻辑设计和物理设计一般通信模式。 结合每个网段的估算值得到广域网和主干数据流量分析 对每个应用程序和网段分析进行估算后,我们就可以得到各个网段和主干网流量
47、。,总容量计算,Email (540,000/3,600) * 3 = 450 KB/s 450 * 8 = 3,600kb/s 3,600 / 1000 = 3.6Mb/s CAD 65 * 36 / 3600 = 0.65 MB/s 0.65 * 8 = 5.2 Mb/s 文件服务 2.5 * 100 / 3600 = 0.069 MB/s 0.069 * 8 = 0.56 Mb/s,主干数据流量计算,Email 每个网络容量 3.6Mb * 0.33 = 1.2Mb/s 只有 2/3网段通过主干, Email主干流量为: 3.6Mb/s * 0.66 = 2.4Mb/s CAD服务器 网
48、段 2/3容量 5.78Mb/s * 0.5 = 2.9Mb/s 主干容量 5.8Mb/s * 0.5 = 2.9Mb/s 文件服务器 1/2网段容量 560Kb/s * 0.25 = 140Kb/s 3网段容量 560Kb/s * 0.5 = 280Kb/s 主干容量 280Kb/s + 140Kb/s = 420Kb /s 总主干网容量2.4Mb/s + 2.9Mb/s + 0.4 Mb/s = 5.7Mb/s,输出:流量估算,当完成流量估算后,将它们总结成一份文件,该文件将成为最终的流量说明书的一部分。 如果流量估算显示出了定向通信模式,应该在图上标出这些模式。,3.5 局域网数据流量的
49、基线法测量,前面几节我们介绍了如何从网络用户收集的信息估算流量。比流量“估法”算更精确的方法,是“基线法”。基线法通过测量一个网络的容量和标准运作效率来衡量它的性能。通过这些测量数据,我们能看出网络操作的长期发展趋势以及这些趋势将给网络性能带来的影响。,测试工具,从网络操作系统或路由器、交换机软件可以得到详细的流量报告。 采用专用的分析仪器。如局域网分析器(嗅包器)。 NAI Sniffer HP LAN Advisor Novell LANalyzer 这些软件能够记录一网段给定时间内的通信信息。,仿真工具包,设计工具包可以模拟局域网在一个给定负载下的行为。给出拓扑、用户数、应用类型,就可以
50、准确的提供网络性能描述。 仿真与测试工具包可疑产生真实的局域网流量,通过改变产生的流量我们可以测出局域网的效率。,将网络基线化,一个网络基线是对网络活动和行为的“抽样”。它能提供对网络行为的预测。可以进行周期性测量,也可在网络具有特殊特征时抽样测量。应该对每一个子网、骨干网、WAN链路进行测量,以组成整个网络的基线集。基线化网络的各个子网的时候,最好在普通的工作日随机进行,而不要按指定的有规则的时间间隔进行,以避免产生同样的结果。,使用 Sniffer 进行基线测量,可以发现带宽的使用率、冲突率、误码率、平均帧大小、协议分配、上层对话站点以及在一个网段之内的总站点数。 分析工具可以诊断物理层问题、路由器异常、应用程序执行问题等,能够解码协议栈的全部7层。,