1、Internet 的访问时间分析李超,赵海, 张昕,袁韶谦(东北大学 信息科学与工程学院,辽宁 沈阳 110004)摘 要:通过 CAIDA 组织提供的海量样本数据,首先对 Internet 访问时间进行分析,发现访问时间服从多峰重尾分布。在此基础上对 Internet 的访问直径与访问时间之间的关系从整体和局部样本进行研究,认为链路延迟是导致相近的访问直径其访问时间相差较大的主要原因,并提出修正算法从样本数据得到链路延迟。对链路延迟样本数据的统计结果表明,超过 90%以上的路径其最大的链路延迟占访问时间的 1/4 以上,并以此定义了支配延迟。最后得出访问时间主要受支配延迟影响,正是由于支配延
2、迟本身导致了相近的访问直径其访问时间存在较大差异的结论。关键词:Internet 测量;访问时间;访问直径;链路延迟;支配延迟中图分类号:TP393.6 文献标识码:A 文章编号:1000-436X(2007)07-0054-07Analysis on traveling time of InternetLI Chao,ZHAO Hai,ZHANG Xin,YUAN Shao-qian(School of Information Science and Engineering, Northeastern University,Shenyang 110004,China)Abstract: Ba
3、sed on the giant data samples authorized by CAIDA, it found that the Internet traveling time was typically distributed by multi-modal and heavy-tailed when the Internet traveling time was statistically analyzed. Furthermore, a research on the relationship between the traveling diameter and the trave
4、ling time from the whole and local data samples supposed that link delay was the leading cause for the great variance of the traveling time, and a revising algorithm was proposed to process the raw data samples to obtain link delay. The statistical analysis of link delay presented that the ratio of
5、the biggest link delay to the traveling time in more than 90% of paths was over 1/4.Then a definition of dominant delay was put forward. The traveling time is affected greatly by dominant delay, which makes the similar diameters traveling time distinct.Key words: Internet measurement;traveling time;
6、 traveling diameter; link delay; dominant delay1 引言 Internet 作 为 一 个 复 杂 巨 系 统 1, 其 网 络 性 能一 直 是 人 们 所 关 心 的 话 题 。 目 前 已 有 许 多 研 究 机构 如 CAIDA 注 1 skitter2 、 NLANR, 对 Internet网 络 性 能 进行测量和研究。文献35分别从不同层面研究了 Internet 的 网 络 延 迟 特 征 。 其 中 , 文献 3以 小 范 围 内 3 条 链 路 为 对 象 , 发 现 RTT 每隔 90ms 收稿日期:2007-01-15;修回
7、日期:2007-05-10 基金项目:国 家 自 然 科 学 基 金 资 助 项 目 (69873007)Foundation Item: The National Natural Science Foundation of China (69873007) 注 1 CAIDA (cooperative association for Internet data analysis), 是 一 个 在 全 球 范 围 对 Internet 结 构 及 数 据 进 行 分 析 的 国 际 合 作 机 构 ,其 研 究 的 主 要 目 的 是 实 现 最 大 限 度 地 对 Internet 数 据
8、 进 行 获 取 、 分 析 、 研 究 和 共 享 。 东 北 大 学 嵌 入 式 技 术 实 验 室 已 经 成 为 CAIDA在 中 国 授 权 建 立 的 第 一 监 测 节 点 。第 28 卷第 7 期 通 信 学 报 Vol.28 No.72007 年 7 月 Journal on Communications July 2007第 7 期 李超等:Internet 的访问时间分析 55明 显 增 加 一 次 。 文 献 4 从 整 体 上 研 究 了 AS 层面 的 延 迟 , 认 为 瓶 颈 延 迟 主 要 由 传 播 延 迟 造 成 。文 献 5则 从 统 计 上 证 明 了
9、 Internet 复 杂 网 络 传 播行 为 的 幂 率 关 系 。本文从 CAIDA 机构取得 Internet 的真实海量数据,在 CAIDA 分布于世界范围内 20 多个监测节点中,选取地理位置上具有代表性的 4 个节点,从空间维度上获取同一天对 Internet 进行探测的数据,样本量巨大,数据可靠性高,能够以较高冗余度表现 Internet 的真实情况。因此,无论是在数量上还是在代表性上,其样本比文献3都更具有说服力。在此基础上分析了访问直径和访问时间的关系,并据此提出假设,认为链路延迟是导致访问时间相差较大的主要原因,进一步研究了Internet 的网络延迟特征。之后,提出一个
10、修正算法,对沿途中间节点返回给监测节点的响应时间进行处理得到链路延迟,对其分析的结果证实了本文设想。最后,通过得到的链路延迟分析其与访问时间的关系。 本文首先在第 2 节简要介绍了 Internet 测量方法以及样本数据的获取。第 3 节在对访问时间的分布做统计之后,分析了访问直径对访问时间的影响。第 4 节提出假设,以修正算法得到链路延迟,并对链路延迟进行期望、方差分析。第 5 节提出支配延迟的概念,分析了支配延迟对访问时间的影响。最后是全文的结束语。2 Internet 网络样本 2.1 测量方法概述本文以 CAIDA skitter2项目对 Internet 进行测量。监测节点采用类似
11、traceroute 的方式对本地列表上的目的 IP 地址进行主动探测。skitter 发送ICMP ECHO_REQUEST 探测包,出于安全性考虑,探测包可能在目的端被防火墙过滤,而目的端更改 IP 地址或其他一些原因也可能造成目的端主机在指定时间内无法响应探测请求。因此监测节点需要根据目的端的响应情况对本地的地址列表不断做出周期性调整,以尽可能多地从目的端得到响应。通过 skitter 进行路由追踪可以获得从监测节点到目的节点探测包经过的每一跳路由器地址,并且能得到沿途中间路由节点返回给监测节点的响应时间。2.2 数据获取为使采样得到的数据样本更具代表性,本文各选取位于北美洲以及欧洲的
12、4 个监测节点 注 2 分别进行路由探测,监测节点所属机构以及地理位置分布如表 1 所示。表 1 监测节点所属机构以及地理位置监测节点 所属机构 地理位置riesling CAIDA San Diego, CA, USmwest Worldcom San Jose, CA, USLhr MFN London, UKcdg-rssac GIP Renater Paris, FR由于探测数据包丢失导致监测节点在指定时间内无法收到目的端的响应,考虑到样本数据的有效性,为了便于分析,作如下定义。定义 1 有效访问时间在 Internet 中,监测节点发送一个探测数据包到目的端,在指定时间内,如果监测节
13、点能够收到目的端的响应,则记为一次有效访问,用 V 表示,并将监测节点发送数据包的时间与收到目的端返回响应的时间之差,定义为一次 Internet 有效访问时间,简称访问时间,记为 T。相应地,如果监测节点在指定时间之内不能够收到目的端的响应,则定义为一次无效访问,记为 I。表 2 给出了 4 个监测节点于 2006 年 8 月 15日对 Internet 进行探测,对有效访问样本数据和无效访问样本数据进行统计后的结果。表 2 有效访问样本数据和无效访问样本数据的统计结果从 表 2 可 以 看 出 , 4 个 监 测 节 点 的 有 效 访 问 样本 占 总 体 样 本 的 比 例 比 较 接
14、 近 , 均 在 36%左 右 , 说明 由 于 各 种 原 因 导 致 目 的 端 无 法 响 应 监 测 节 点 探 测包 的 比 例 接 近 2/3。 虽 然 有 效 访 问 记 录 所 占 比 例 较 小 ,但 是 有 效 样 本 数 据 绝 对 条 数 依 然 很 大 , 可 以 进 行 分析 。注 2 之 所 以 选 取 CAIDA 分 布 在 北 美 洲 以 及 欧 洲 的 监 测 节 点 ,主 要 是 因 为 分 别 从 二 大 洲 抽 取 的 数 据 能 更 客 观 地 表 现Internet 网 络 , 而 每 洲 各 取 2 个 节 点 ,是 为 了 比 较 同 一 洲
15、内 监 测 节 点 的 访 问 时 间 。 没 有 选 取 亚 洲 中 国 节 点 的 原 因 是 中 国 节点 成 立 的 时 间 较 短 。监测节点 V /条 I /条 Total /条 Percent /%riesling 353 975 617 084 971 059 36.45mwest 349 427 605 976 955 403 36.57lhr 338 318 617 572 955 890 35.39cdg-rssac 351 193 604 690 955 883 36.7456 通 信 学 报 第 28 卷3 理想 Internet 网络特征量分析3.1 理想 Inte
16、rnet 访问时间在对 Internet 网络特征量进行分析之前,考虑到网络复杂性造成目的端的不可达,有必要先对Internet 作如下理想化定义。定义 2 理想 Internet忽略 Internet 中的无效访问样本,只考虑有效访问样本,以这种方式抽象出来的 Internet 称为理想 Internet。对 表 2 中 4 个 监 测 节 点 有 效 样 本 数 据 的 访 问时 间 作 统 计 , 得 到 理 想 Internet 访 问 时 间 的 分 布如 图 1 所 示 。 为 了 便 于 比 较 , 清 楚 地 看 到 位 于 不同 地 理 位 置 监 测 节 点 访 问 时 间
17、 的 分 布 情 况 , 将 北美 洲 和 欧 洲 节 点 的 访 问 时 间 分 布 分 别 如 图 1(a)、图 1(b)所 示 。图 1 理想 Internet 访问时间的分布 为了突出访问时间的分布特征,并考虑到实际中访问时间大于 500ms 时意义不大,因此只对小于 500ms 的访问时间作图。从图 1 看到,4 个监测节点的理想 Internet 访问时间在分布上具有较强相似性,由此可以说明样本数据的有效性。图 1 直观地表明理想 Internet 访问时间服从多峰重尾分布 6,7。图 1(a)中的 mwest 和 riesling 监测节点的访问时间主要集中在区间70,90和15
18、0,170附近,图 1(b)中的 lhr 和 cdg-rssac 监测节点的访问时间主要集中在区间100,120和280,300附近,而大于 400ms 的访问时间只占很小比例,说明当前Internet 整体性能较好。由于访问时间在峰值附近的数据样本所占比例较大,为使样本分析更具代表性,本文主要针对访问时间在峰值附近的数据样本进行统计分析。3.2 理想 Internet 访问直径在 Internet 中,跳数代表从源节点到目的节点IP 包经过路由器的个数。文献5对跳数与往返延迟进行回归分析,认为数据包经过的路由跳数越少,那么相应的往返延迟也越短(当然还要取决于链路状态) 。本文首先对访问直径
19、8的分布进行统计,然后从整体和局部上对访问时间和访问直径之间的关系进行分析。定义 3 访问直径在 Internet 中,将数据包从任一源 IP 地址到任一目的 IP 地址所经过的路由跳数称为一次Internet 访问直径,简称访问直径。选取 riesling 注 3 监测节点的访问直径进行一维频数分析,其分布如图 2 所示,统计结果如表 3所示,可以说明访问直径服从均值为 21.28、方差为 13.674 的正态分布 9。图 2 理想 Internet 访问直径的分布表 3 访问直径正态分布参数均值 方差 偏度 峰度21.28 13.674 0.571 0.615图 3 给出了访问直径的累积分
20、布。从图 3 可以发现,超过 90%以上的路径其访问直径都在 15跳注 3 选取 riesling 监测节点的原因是 riesling 监测节点属于 CAIDA,成立时间较早,其数据集比较稳定。第 7 期 李超等:Internet 的访问时间分析 57以上,说明大多数 IP 数据包一般要经过较多的中间节点转发才能到达目的端。图 3 访问直径的累积分布3.3 访问直径对访问时间的影响由 于 访 问 时 间 和 访 问 直 径 分 别 服 从 多 峰 重 尾分 布 和 单 峰 正 态 分 布 , 访 问 直 径 对 访 问 时 间 会 产生 什 么 影 响 , 本 文 首 先 从 整 体 考 虑
21、两 者 之 间 的 关系 。对某一访问直径下对应的所有访问时间取均值,得到该访问直径下的平均访问时间,访问直径和平均访问时间的变化特征如图 4 所示。图 4 平均访问时间随访问直径变化的情况从图 4 直观地看,平均访问时间随着访问直径的增大而增大。也就是说,在整体上如果从源节点到目的节点 IP 数据包所经过的跳数越多,那么相应的平均访问时间也就越长。在 量 化 分 析 上 , 以 4 个 监 测 节 点 得 到 的 有 效数 据 为 样 本 , 对 小 于 500ms 的 访 问 时 间 与 相 应 的访 问 直 径 进 行 统 计 , 两 者 进 行 相 关 分 析 后 的 结 果如 表 4
22、。从表 4 看出,4 个监测节点访问时间的均值和中位数以及访问直径的均值和中位数均相差不大,说明数据中异常样本较少。另外,访问时间和访问直径的 Pearson 相关系数在 0.30.5 范围之内,说明访问时间和访问直径为低度相关。虽然图 4直观地表现出整体样本上平均访问时间随访问直径呈增长趋势,但是量化结果却表明平均访问时间和访问直径并不具有较强的相关性。表 4 对 4 个监测节点抽取的有效样本数据的访问时间和访问直径的统计结果分析监测节点访问时间均值/ms访问时间标准差/ms访问直径均值访问直径标准差访问时间中位数/ms访问直径中位数Pearson 相关系数riesling 134.85 7
23、7.36 21.275 3.68 141.657 21 0.346mwest 133.32 84.81 21.126 3.85 138.441 21 0.333lhr 158.69 111.72 18.58 3.73 125.636 18 0.492cdg-rssac 164.29 111.13 19.68 3.41 139.65 19 0.473从局部样本上分析访问直径与访问时间之间的关系,为不失一般性,本文选取 riesling 监测节点访问时间在峰值附近具有代表性的数据样本。为更完备地考察样本数据,不妨将样本范围扩大,对访问时间在区间50,120和120,220的有效样本进行统计。从 表
24、 4 的 统 计 结 果 来 看 , 如 果 整 体 上 样 本 数据 的 平 均 访 问 时 间 和 访 问 直 径 还 存 在 低 度 相 关 的话 (Pearson 相 关 系 数 为 0.346), 那 么 , 针 对 局 部样 本 上 访 问 时 间 在 区 间 50,120和 120,220的 有效 样 本 数 据 , 从 表 5 看 来 , 平 均 访 问 时 间 和 访 问直 径 之 间 相 关 程 度 极 弱 , 基 本 可 以 视 为 不 相 关(Pearson 相 关 系 数 分 别 为 0.096 和 0.142)。 也 就是 说 , 不 能 对 某 一 特 定 访 问
25、 直 径 下 的 平 均 访 问 时间 做 出 准 确 预 测 。比较表 5 的统计结果可以发现,访问时间在区间50,120和 120,220的有效样本数据访问直径的均值和中位数都相差不大( 大约仅相差 2 跳) 。但是,两区间上样本数据的访问时间均值和中位数却几乎相差了一倍。以 上 分 析 结 果 表 明 访 问 直 径 对 访 问 时 间 影 响较 小 。 什 么 原 因 造 成 了 访 问 直 径 相 差 不 大 的 样 本其 访 问 时 间 却 有 如 此 大 的 差 异 , 本 文 针 对 该 问 题首 先 做 出 假 设 , 然 后 根 据 该 假 设 进 一 步 分 析 路 径5
26、8 通 信 学 报 第 28 卷上 每 条 链 路 消 耗 的 延 迟 对 访 问 时 间 所 造 成 的 影 响 。表 5 访问时间分别在50,120和120,220的有效样本的访问时间和访问直径的统计结果分析访问时间区间访问时间均值/ms访问时间标准差/ms访问直径均值访问直径标准差访问时间中位数/ms访问直径中位数Pearson相关系数50,120 81.324 16.16 20.54 3.02 79.358 20 0.096120,220 171.345 23.28 22.25 3.73 172.136 22 0.1424 链路延迟分析4.1 假设根据表 3,riesling 监测节点
27、探测到的样本数据其平均访问直径为 21.28,如果路径上每条链路消耗的延迟时间都相等,那么平均每条链路消耗的延迟占总延迟的 4.7%。因此可以认为,如果链路延迟相差不大,那么探测包从监测节点到达目的节点所经过的跳数越多,相应的访问时间也越长。但是表 5 的分析结果否定了该假设。因此,可以设想路径上的链路延迟应该相差较大。4.2 链路延迟样本数据处理由于采用类似 traceroute 的方式进行探测,因此 只 能 获 取 中 间 节 点 返 回 给 监 测 节 点 的 响 应 时 间 。并 且 在 探 测 过 程 中 , 会 出 现 路 径 上 某 一 个 或 几 个中 间 节 点 对 探 测
28、包 不 响 应 的 情 况 , 但 是 监 测 节 点在 未 收 到 中 间 节 点 响 应 的 情 况 下 , 仍 可 通 过 增 加探 测 包 的 TTL 值 继 续 向 前 探 测 路 由 节 点 直 至 到 达目 的 端 10。 将 这 种 情 况 下 得 到 的 数 据 称 为 路 径 不完 整 样 本 数 据 。 由 于 数 据 集 存 在 较 大 冗 余 , 为 得到 每 条 链 路 上 的 延 迟 时 间 , 可 将 路 径 不 完 整 的 样本 数 据 不 作 考 虑 。 从 表 2 看 到 riesling 监 测 节 点 目的 端 可 达 的 样 本 数 据 共 353
29、975 条 , 在 此 基 础 上 ,除 去 路 径 不 完 整 的 样 本 数 据 , 共 得 到 有 效 样 本259 011 条 , 占 总 体 样 本 的 26.67%。对给定路径 ,设该路径11(,)mRsad相应的延迟时间为 ,其中 为从 s 到2,ndi的延迟 。理论上, 满足ia(,)ii,但实际上可能会出现在不同时刻12nd由于网络负载不同,导致在测量较远的路由器时网络处于较轻负载状况,而较近的路由器则恰好相反,所以可能会出现 ,因此需要对此类情1iid况做修正,具体修正算法如下:1)如 果 , ( ,10i1ii0 1为 随 机 变 量 , 其 概 率 密 度 服 从 区
30、间 0,1上 的 均 匀分 布 )。2)如果 , 。如果该情1id1()/2iiid况在一条路径中出现超过 3 次以上,则认为该条路径失效,不处理该条路径。对目的端可达且路径完整的 259 011 条数据以修正算法处理后,得到有效路径共 246 052 条,有效路径占 94.97%,所占比例较大,修正后的结果能真实地反映链路延迟,下面先定义链路延迟,然后对其分析。定义 4 链路延迟设第 j 条路径相应的延迟时间 ,12(,)njjd采用修正算法对延迟数据处理之后,得到的修正值为 ,令 ,则12*(,)njjd1*,iijjD为路径 j 上网络节点 , 之间的往返链路延jiDia迟,简称链路延迟
31、。4.3 链路延迟分析把链路延迟看作随机变量,所有路径上每跳之间的链路延迟组成的集合看作样本空间 S。为分析问题方便,并且考虑到不同路径上的跳数不同,记第 j 条路径链路间的延迟时间为一维随机变量,则 。|1,2ipnD ,|12jmSp方差 表示链路延迟2var()E()jjjiipD( )对于均值 的偏离程度,用ji1,2,n ji度量第 j 条路径上链路延迟的离散程度。r()分别记样本空间 S 中访问时间在区间50,120和120,220样本数据的链路延迟集合为 S1 和 S2。、 ( )以及 、 (jiD1var)jp1,2m2jiD2()varjp)分别为集合 S1 和 S2 上链路
32、延的迟均2,值和方差,对 S1 中的 随 以及 S2 中的()varjp1ji随 变化的情况进行统计。为清楚看到2()varjp2ji不同路径链路延迟方差变化情况,将访问时间在区间50,120和 120,220路径的链路延迟方差分布情况在图 5 中表示。第 7 期 李超等:Internet 的访问时间分析 59图 5 链路延迟方差随访问时间变化的情况图 5 表明访问时间在区间120,220上的路径,其链路延迟方差远远大于 50,120路径的链路延迟方差,说明访问时间长的路径其链路延迟之间相差较大。正是由于路径上的链路延迟导致了在访问直径相近的情况下,访问时间存在较大的差异,分析结果证实了本文之
33、前的设想。5 支配延迟对访问时间的影响5.1 支配延迟为 了 研 究 链 路 延 迟 与 访 问 时 间 的 关 系 , 将 路 径 j的 链 路 延 迟 时 间 按 从 大 到 小 排 序 , 设12(,)jjnD排 序 后 的 链 路 延 迟 为 , 对 最 大 的 前*,jjm 条 链 路 延 迟 求 和 , 令 Tm= ( ),1jiiim 设 ,则 为最大的前 m 条链路延迟之PTP和占该路径访问时间的比例。通过对不同路径计算 来分析链路延迟对访问时间的影响。m设 Top1,Top2,Top3 为该条路径上最大的前m(m=1,2,3)条链路延迟之和占该路径访问时间的比例,对所有路径求
34、 Top1,Top2,Top3,并按从小到大的顺序依次排序,Top1,Top2,Top3 的分布如图6 所示。从图 6 可以看出,超过 90%以上的路径其最大的链路延迟占访问时间的 1/4 以上,50%以上的路径其最大的链路延迟占访问时间的一半以上。此外,80% 以上的路径其最大的前 2 条链路延迟之和与访问时间的比例超过 50%,其最大前 3 条链路延迟之和占访问时间的 65%以上。对所有路径的 Top1,Top2,Top3 计算期望值,分别为:55.94%,70.89%,77.20% 。图 6 Top1,Top2,Top3 百分比分布与路径个数的关系根据图 3,超过 90%以上的路径其访问
35、直径都在 15 跳以上,从图 6 的结果看出大部分路径其最大的链路延迟占访问时间的 1/4 以上,因此认为链路中存在着支配延迟,可对支配延迟作如下定义:定义 5 支配延迟设 Internet 上的一条路径有 n 跳,每一跳的延迟分别为 ,访问时间为 T,设12,jjnD,如果 ,max|jjimax/4jD且 n 4,则 处于该路径链路延迟的支配地max位,称 为支配延迟。aj5.2 支配延迟与访问时间的关系分别计算访问时间在区间50,120和120,220上路径支配延迟对访问时间的比例,将区间50,120和120,220样本数据的 Top1 分布按从小到大排序,如图 7 所示。图 7 不同访
36、问时间区间上 Top1 百分比分布与路径个数的关系60 通 信 学 报 第 28 卷从 图 7 看 到 访 问 时 间 在 区 间 50,120的 样 本 有 90%以上 的 路 径 其 支 配 延 迟 占 访 问 时 间 的 比 例 超 过 1/4, 而访 问 时 间 在 区 间 120,220的 样 本 有 90%以 上 的 路 径其 支 配 延 迟 占 访 问 时 间 的 比 例 超 过 35%。 两 区 间 样本 的 Top1 分 布 比 较 接 近 , 由 此 可 以 说 明 支 配 延 迟对 访 问 时 间 的 影 响 与 访 问 时 间 本 身 没 有 必 然 联 系 。虽然图
37、7 表明访问直径相近的两区间其支配延迟对访问时间的比例在分布上相近,但是两区间的访问时间存在着较大的差异。由于访问时间主要由支配延迟组成,对访问时间分别在区间50,120和120,220样本数据的支配延迟按从小到大排序,两区间上支配延迟的数值分布如图 8 所示。从图 8 看到,访问时间在 120,220路径上的支配延迟远远大于访问时间在50,120上路径的支配延迟,证实了虽然支配延迟对访问时间的影响与访问时间本身没有必然联系,但是由于支配延迟本身在数值上相差较大,因而导致了相近的访问直径其访问时间存在较大的差异。图 8 两区间上链路支配延迟与路径个数的关系6 结束语本文对 CAIDA 组织授权
38、的海量样本数据进行采样,并做相应处理之后,共得到有效样本路径246 052 条,样本数据量大,且具有较强代表性,能较好地表现 Internet 的延迟特征。在对有效样本路径分析中,得到如下结论:针 对 访 问 时 间 与 访 问 直 径 分 别 服 从 多 峰 重 尾 分布 和 正 态 分 布 的 特 点 , 着 重 分 析 了 访 问 时 间 与 访 问直 径 之 间 的 关 系 , 发 现 访 问 直 径 对 访 问 时 间 影 响 较小 。在 此 基 础 上 做 出 假 设 , 设 想 路 径 上 链 路 延 迟 应该 相 差 较 大 。 通 过 修 正 算 法 得 到 链 路 延 迟
39、后 , 发 现访 问 时 间 长 的 路 径 其 链 路 延 迟 分 布 得 更 加 分 散 , 且超 过 90%以 上 的 路 径 其 最 大 链 路 延 迟 占 访 问 时 间 的1/4 以 上 , 据 此 定 义 了 支 配 延 迟 。 尽 管 Top1 的 分 布表 明 两 区 间 上 支 配 延 迟 对 访 问 时 间 的 比 例 比 较 接 近 ,但 是 由 于 两 区 间 上 支 配 延 迟 本 身 相 差 较 大 , 使 得 不同 路 径 的 访 问 直 径 在 相 差 不 大 的 情 况 下 访 问 时 间 有较 大 差 异 。参考文献:1 戴汝为, 操龙兵. Interne
40、t一个开放的复杂巨系统J. 中国科学, 2003, 33(4): 289-296.DAI R W, CAO L B. Internetan open complex giant systemsJ. Science in China, 2003, 33(4): 289-296.2 CAIDA skitter Project EB/OL. http:/www.caida.org.3 SANGHI D, AGRAWALA A, Gudmundsson O. Experimental assessment of end-to-end behavior on InternetA. Proceedings
41、 of IEEE INFOCOM93C. San Francisco,USA, 1993. 867-874.4 毕经平, 吴起, 李忠诚. Internet 延迟瓶颈的测量与分析J.计算机学报, 2003, 26(4): 406-416.BI J P, WU Q, LI Z C. Measurement and analysis of Internet delay bottlenecksJ. Chinese Journal of Computers, 2003, 26(4): 406-416.5 苏威积, 赵海, 徐野. 基于 hops 的 Internet 复杂网络分割度分析J. 通信学报,
42、 2005,26(9): 1-8.SU W J, ZHAO H, XU Y. Internet complex network separation degree analysis based on hopsJ. Journal on Communications, 2005,26(9): 1-8.6 BRADLEY H, MARINA F, DANIEL J. Distance metrics in the InternetA.Proceedings of the IEEE International Telecommunications Symposium 2002C. Natal,Bra
43、zil, 2002.7 HOOGHIEMSTRA G, VAN P. Delay Distributions on fixed Internet PathsR. Delft University of Technology Report, 2001.8 徐野, 赵海, 苏威积. Internet 网络的访问直径分析J. 计算机学报, 2006,29(5):690-698.XU Y, ZHAO H, SU W J. Analysis on traveling diameter of InternetJ. Chinese Journal of Computers, 2006, 29(5):690-
44、698.9 FEI A, PEI G,LIU R. Measurements on delay and hop-count of the InternetA. Proceedings of IEEE GLOBECOM98C. Sydney, Australia, 1998.10 张宏莉, 方滨兴 , 胡铭曾. Internet 测量与分析综述J. 软件学报, 2003,14(1):110-116.ZHANG H L, FANG B Y, HU M Z. A survey on Internet measurement and analysisJ. Journal of Software, 20
45、03,14(1):110-116.第 7 期 李超等:Internet 的访问时间分析 61作者简介:李超(1982-) ,男,湖北洪湖人,东北大学信息科学与工程学院博士生,主要研究方向为计算机网络、复杂网络。赵海(1959-) ,男,辽宁沈阳人,东北大学信息科学与工程学院教授、博士生导师,主要研究方向为计算机网络、复杂网络、数据融合。张昕(1979-) ,男,内蒙古赤峰人,东北大学信息科学与工程学院博士生,主要研究方向为计算机网络、复杂网络。袁 韶 谦 ( 1983-) , 男 , 辽 宁 辽 中 人 , 东 北 大 学 信 息 科 学与 工 程 学 院 硕 士 生 , 主 要 研 究 方 向 为 计 算 机 网 络 、 复 杂 网络 。