1、大 数 据 在 城 市 交 通 规 划 及 管 理 中 的应 用 研究I目 录1 交通大数据概述 11.1 交通大数据的定义 .11.2 交通大数据的分类 .11.3 交通大数据的特性 .41.4 交通大数据的采集方式 .51.5 交通大数据相关处理技术 .72 国内外交通大数据研究应用现状 102.1 研究机构关注交通大数据人才培养和技术应用 .102.2 领先企业成为交通大数据技术研发和应用的引领者 112.3 各城市相继建立交通信息中心,实现交通数据汇集 .142.4 数据源丰富和产学研优势互补是大势所趋 .163 大数据在交通规划及管理中的研究应用现状 183.1 地理信息数据的相关应
2、用 .183.2 手机数据的相关应用 .213.3 公 交 IC 卡数 据的相 关 应 用 303.3.1 起 讫矩 阵推 算 303.3.2 公共交通系统运行与管理 313.3.3 城市空间结构分析 323.3.4 出 行 为分 析 333.4 交通监测数据的相关应用 .343.5 运营票务数据的相关应用 .364 中山市交通大数据应用现状分析 374.1 城市交通发展现状 .374.1.1 城 市基 本概 况 374.1.2 道路交通发展现状 414.2 交通大数据来源现状 .434.2.1 交 通直 接产 生的数 据 434.2.2 公众互动交通状况数据 464.2.3 相 关行 业数
3、据 474.2.4 重大社会经济活动关联数据 514.3 交通大数据应用现状 .524.3.1 中山市智能公交系统 52I4.3.2 中山市智能交通管理系统 534.3.3 中山市信号控制系统 554.4 现状存在的问题与挑战 .575.大数据在中山市交通规划及管理中的应用展望 .595.1 交通规划中的应用展望 .595.1.1 交 通规 划概 述 595.1.2 大数据在中山市交通规划中的应用展望 615.2 交通管理中的应用展望 .755.2.1 交 通管 理概 述 755.2.2 大数据在中山市交通管理中的应用展望 766 中山市交通大数据平台建议 .836.1 交通大数据平台概述 .
4、836.1.1 交通大数据平台定义及功能 836.1.2 交通大数据平台典型案例 846.1.3 中山市建设交通大数据的必要性及目标 896.2 交通大数据平台建设的原则 .906.2.1 总 体原 则 906.2.2 存储和计算要求 906.2.3 高 可靠 性要 求 916.2.4 并发性要求 916.3 中山市交通大数据平台框架构想 .916.4 中山市交通大数据平台建设的建议 .936.4.1 构建开放共享的交通大数据体系 936.4.2 积极探索引进新技术、新方法,加强大数据的分析研判 .936.4.3 完善人才结构,强化大数据时代的人才队伍建设 .946.4.4 实现信息资源共享,
5、调用省厅各种新的便民服务功能 .956.4.5 加强保护个人私密信息 956.4.6 强化信息采集,提高交通数据质量 957 保障措施与建议 97参 考文 献 99大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究11 交 通 大 数 据 概 述1.1 交 通 大 数 据 的 定 义大数据 (big data) , 指 无法在一定时间范围内用常规软件工具进行捕捉、 管 理和处理的数据集合, 是需要新处理模式才能具有更强的决策力、 洞察发现力和 流程优化能力的海量、高增长率和多样化的信息资产。城市交通大数据是指由城市交通运行管理直接产生的数据 (包括各类道路交 通 、 公
6、 共 交 通 、 对 外交通 的 线 圈 、 GPS、 视 频、 图 片 等 数 据 ) 、 城市交 通 相 关 的 行业和领域导入的数据 (气象、 环境、 人口、 规划、 移动通信手机信令等数据 ) 、 来自公众互动提供的交通状况数据 (通过微博、 微信、 论坛、 广播电 台等提供的 文字、 图片、 音视频等数 据) 以及重大社会经济活动间接产生的交通数据构成的, 用传统技术难以在合理时间内管理、处理和分析的数据集。1.2 交 通 大 数 据 的 分 类一般而言, 大数据要做的是融合汇聚, 将不同来源尤其是不同领域的数据集 进行整合,本身就需要打破数据已有的分类,因此大数据是可以不需要分类的
7、, 或者说经过整合后的数据已经不再体现单一的类别特性。 但是对城市交通大数据 中的数据可以从某些角度进行划分, 便于更好地分析、 理解和使用城市交通大数 据。(1) 按照数据与交通管理和交通功能信息服务的关联度划分 城 市 交 通 大 数 据 可 以 分 为 交 通 直 接 产 生 的 数 据 、 公 众 互 动 交 通 状 况 数 据 、相关行业数据和重大社会经济活动关联数据四类。 这四类数据与交通管理、 交通 信息服务的关联度依次降低。 交通直接产生的数据包括了各类交通设施如线圈、 摄像头等产生的数据, 以及车载 GPS 产 生 的 车 辆 位 置 信 息 等 数 据 , 这 些 数 据
8、能 够 反 映 出 总 体 的 交 通 状 态和局部的交通状况,与城市交通最直接相关。 公众互动交通状况数据包括公众通过微博、 微信、 论坛 、 广播电台等提 供交通状况相关的文字、图片、音视频等数据。例如哪个路段上刚刚发生车祸, 这些信息未必会被交通设施直接捕捉到, 但是它们能够直接反映局部的交通状况, 因此和城市交通的关联程度也很紧密。大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究2 相关行业数据包含了气象、环境、人口、规划、移动通信手机信令以及 其他与交通间接相关的数据, 这些数据能够用于更准确地分析和预测交通状况和 总体交通状态,与城市交通有一定的关系。 重
9、大社会经济活动信息对交通状况也会产生一定的影响。例如大型文体 活动会对场馆周边道路的交通产生短时的拥堵、 电商促销活动可能会因物流增加 对高速公路流量产生影响的等, 但总体而言这些活动对交通的影响结果是局部的, 而且是可以预见的,在特定场景下与城市交通有关联。(2) 按照数据类型划分 城市交通大数据可以分为结构化数据、非结构化数据和半结构化数据。 结构化数据是指数据记录通过确定的数据属性集定义,同一个数据集中 的数据记录具有相同的模式。 结构化数据具有数据模式规范清晰 , 数据处理方便 等特点。 结构化数据通常以关系型数据库或格式记录文件的形式保存, 例如传统 的智能交通信息系统采集、 加工过
10、的数据。 线 圈等传感器产生的数据一般来说具 有固定的比特流格式, 各字段的比特长度和含义固定 , 可以是视作为比特尺度下 的结构化数据。 非结构化数据是指数据记录一般无法用确定的数据属性集定义,在同一 个数据集中各数据记录不要求有明显的、 统一的数据模式 。 非结构化数据能够提 供非常自由的信息表达方式, 但数据处理复杂。 非结构化数据通常以原始文件或 非关系型数据库的形式保存, 例如摄像头采集的视频、 公众发布在微博上的图片 或 是 微 信 上 的 语 音 信 息 等 。 半结构化数据是指数据记录在形式上具有确定的属性集定义,但同一个 数据集中的不同数据可以具有不同的模式, 即不同的属性集
11、 。 半结构化数据具有 较好的数据模式扩展性, 但需要数据提供方提供额外的数据之间关联性描述 。 半 结 构 化 数 据 通 常 可 以 扩 展 标 记 语 言 文 件 或 其 他 用 标 记 语 言 描 述 数 据 记 录 的 文 件 保存, 例如在超文本标记语言文件中以标签形式保存的数据、 资源描述框 架格式的本体库文件等。(3) 按照数据形式划分 城 市 交 通 大 数 据 可 以 分 为 ( 传 感 器 ) 流 数 据 、 数 据 文 件 、 数 据 库 记 录 、 在线 文 字 和 图 片 、 音 视 频 流 等 。大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用
12、研 究3 流数据是指各类交通设施或传感器以数据流的形式持续不断产生的具有 确定格式的数据, 其特点就是已经产生的数据无法再现, 除了数据处理算法在内 存中保存的一部分外, 无法重复获取之前的数据记录 , 对数据的获取和访问都存 在先后顺序。 数据文件是指以文件的形式在介质上持久保存的数据,又分记录文件和 无记录文 件(文 本文件 ) 。其特 点是可 以反复 获取,并 可根据 需要随 机访问,没 有先后顺序要求。 数据库记录是指在关系型数据库系统或非关系型数据库系统中,以“数 据记录 ”的形式保存的数据 , 其特点是用户不用自己维护数据记录的存取, 提供 了处理和计算上的便捷性。 在线文字和图片
13、是指存在于互联网上的、需要通过特定的网络协议才能 获取到数据, 其特点是以文件形式保存、 通过数据流方式可以反复获 取 (假定服 务器的文件未被删除) 。 音视频流是指经过数字化的并能够通过某种方法还原的音频或视频信息, 其特点与流数据相似, 但属于非结构化数据 , 往往需要非常复杂的算法才能从中 提取所需要的信息。(4) 按照数据产生和变化的频率划分 城 市 交 通 大 数 据 可 以 分 为 基 础 数 据 、 实 时 数 据 、 历 史 数 据 、 统 计 数 据 ( 结果数据)等。 基础数据是指静态的、规范化的、描述城市交通基本元素的数据,其特 点 是 数 据 定 义 /产 生 后 基
14、 本 不 会 发 生 变 化 , 例 如 道 路 名 称 、 匝 道 口 编 号 等 。 实时数据是指随城市交通活动实时产生的、反映城市交通运行情况的数 据,其特点是数据会非常频繁地产生和变化,例如线圈数据、温湿度气象数据、 微博和微信上的公众互动的交通状况等, 这类数据对判断短时交通拥堵等具有重 要 作 用 。 历史数据是指实时数据按照一定时间周期 (如按月) 归档后产生的 数据, 其特点是数据产生和变化的周期性明显, 这类数据可以用来预测未来交通状况的 变化趋势。 统计数据 (结果数据) 是指系统根据一定算法或根据使用者的主观需求,大 数 据 在 城 市 交 通 规 划 及 管 理 中 的
15、 应 用 研 究4经过计算后所产生的数据, 其特点是新数据的产生和变化的周期性不明显, 例如 拥堵指数、 路段平均车速、 人流量随时间变化趋势图等, 这类数据可以为公众出 行服务、 管理部门决策做支持。 有时候也可以用高频、 中频、 低频来划分这些数 据, 基础数据属于低频数据, 统计数据和历史数据属于中频数据, 实时数据属于 高频数据。1.3 交 通 大 数 据 的 特 性从城市交通大数据的定义不难看出, 交通大数据具有 6V 特点V olum( e 数据量大) 、 Variety(数 据种类多样) 、 Value(数据价值丰富) 、 Velocity(数据处理 快速 ) 、V eracit
16、y(数据 真假共存) 、V isualization(数据可视化 ) 。(1) V olume(数据量大) 城市交通时时刻刻产生大量的数据, 各类数据的汇聚, 尤其是视频、 图片等非结构化数据, 以及气象、 环境等数据, 直接导致交通大数据的数据量巨大。 此 外,相关行业和领域导入的数据和公众互动提供的数据,数据量也是非常巨大。(2) V ariety(数据种类多样 ) 从数据来源上看, 城市交通直接产生的数据本身就包含了道路交通功能、 公共 交 通 、 对 外 交 通 等 数 据 , 还 汇 聚 和 整 合 了 气 象 、 环 境 、 人 口 、 规 划 、 移 动 通 信 等多个相关行业的
17、数据, 以及政治、 经济、 社会 、 人 文等领域重大活动关联数据; 从数据类型上看, 既有结构化数据, 也有各种类型的非结构化数据、 半结构化数 据; 从数据形式上看, 既有传感器、 线圈等产生的流数据, 也有以文件形式保存 的数据, 还有保存在数据库数据表中的记录, 以及互联网上的网页文字和图片等。 城市交通直接产生的数据超过 30 大类,再算上其他行业的各类相关数据,种类 就更多了。(3) V alue(数据价值丰富 ) 城市交通大数据可以实现智慧交通公共信息服务的实时传递, 满足出行者实时准确获取交通出行信息服务的需求; 为交通管理部门的交通应急决策系统提供 有力的数据分析处理层面的支
18、撑, 实现对交通紧急突发状况的快速反应及应急指 挥, 对维护社会稳定和减少经济损失有重大意义; 为城市规划和功能区设置、 政 府跨部门协同管理提供决策依据, 通过城市交通大数据技术来预测规划, 例如功 能区设置 是否会导致交通拥堵、 发生拥堵后是否可以进行有效疏导等; 为交通功大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究5能管理及相关产业的科学研究提供数据, 例如交通管理措施的效果模拟、 深度挖 掘影响交通拥堵程度的因素和作用、交通信息服务和产品的研发测试等。(4) V elocity(数据处理 快 速) 利用城市交通大数据, 在可能发生拥堵之前通过提示板、 交通
19、信号灯控制等手段提前进行分流和疏导; 在极端天气状况发生之前提前预警; 在重大活动进行 过程中实时干预, 保证交通通畅, 防止人群滞留、 挤踏; 在公众出行时根据用户 所在地点、 附近的交通流量等信息, 通过移动终端应用实时给出出行建议和路径 规划等。 这些都是需要在获取到数据后能够及时准确地处理, 尤其是对车辆通过 线圈、 卡口等数据的分析以及利用手机信令来分析交通状态, 都需要毫秒级的响 应速度。(5) V eracity(数据真假共 存) 城市交通大数据同其他数据一样不可避免的存在数据缺失、 错误、 冗 余等异常现象。 所以交通大数据一般需要经过一定的算法处理, 提取出对交通研究有用 的
20、 数 据 进 行 分 析 。(6) V isualization( 数 据 可 视 化 ) 交通运行状态、 城市路网特性等需要可视化的展现。 大数据时代 处理着海量的数据,需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集, 同时也加工、 传播、 分享它们。 不知不觉中, 数据可视化已经遍布我们生活的每 一个角落,毕竟普通用户往往更关心结果的展示。百度地图采用 LBS 定位春运 的可视化大数据,就引起了学界对新闻创新和大数据可视化的热议。1.4 交 通 大 数 据 的 采 集 方 式交通大数据存在于各行业中,主要可以分为设备采集和行为共享两大类。 1设备采集 设备采集是通过硬件设备有
21、目的地采集交通数据, 主要代表是智能交通系统。智能交通发展至今, 每时每刻都在采集的数据中, 存在巨大的潜力和价值。 从统 计学上, 只要样本数量足够多, 就能从数据中找到规律和相关性。 数据越多, 准 确率越高,价值也越大。智能交通主要采集人、车、物三类数据。第一、 人。 最常见的是城市公共交通卡数据。 在每台公交车辆及轨道站点内 都有刷卡设备, 每个持卡用户乘坐过的公交线路和轨道交通进出站的名称及时间大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究6都被完整记录。第 二 、 车 。 车 辆 的 大 数 据 主 要 来 自 于 对 于 车 辆 和 道 路 的 监 控
22、 数 据 。 公 共 汽 电车及出租汽车等城市客运车辆上普遍安装 GPS 设备,每 530 秒 记 录 一 次 车 辆的位置、速度等信息。车辆的行驶轨迹能够被复原,用于监管出租汽车绕行、 从事非法客运等行为。 道路上的电子线圈和拍照识别系统 , 在局部区域增加了信 息采集的广度。第 三 、 物 。 通 过 RFID、 ZigBee 等 技 术 , 大 型 物 流 企 业 正 在 向 智 能 交 通 、 现 代物流和物联网融合发展。货物跟踪系统利用物流条形码和 EDI 技术及时获取 有 关 货 物 运 输 状 态 的 信 息 ( 如 货 物 品 种 、 数 量 、 货 物 在 途 情 况 、 交
23、 货 期 间 、 发 货 地和到达 地、货 物的货 主、送货 责任车 辆和人 员等 ) , 提高物 流运输 服务和方法 的水平,实现从始发地到目的地的全过程跟踪。以 辽 宁 省 丹 东 市 某 交 警 项 目 为 例 , 该 项 目 一 期 建 设 的 卡 口 电 警 设 备 每 天 产 生 300 万条过车记录和过车图片, 目前整个系统过车图片数量超过 2 亿条, 随着 时 间 的 累 计 会 更 多 。 2013 年 12 月,基于 Hadoop 大数据平台的 UniHadoop 系统 在 丹 东 试 用 , 满 足 了 30 亿 条 过 车 记 录 的 检 索 、 数 据 挖 掘 业 务
24、 。 在 前 端 , 1050 台图像采集设备有 700 多台内置算法的高清一体化智能卡口、电子警察抓拍单元, 部 署 于 市 内 、 高 速 、 收 费 站 、 国 省 干 道 , 以 光 纤 连 接 到 中 心 设 备 ; 1.5PB 容量的 IPSAN 存储可以将照片保存 6 个 月 , 视 频 保 存 1530 天 ; 中 心 管 理 平 台 统 一 以 地图作为窗口进行相应的功能和业务展示, 单级平台容纳百亿级数据量 , 查询和 统计能在 3 秒内返回 , 基于大数据的各项性能展示, 同步可提供轨迹碰撞、 拥堵 分析等智能研判。 该项目在应用中虽然数据量成倍增加 , 但查询和统计时间
25、仍为3 秒。2 行 为共 享 随着互联网和移动终端的普及 , 在互联网上的行为透露出个人的喜好 、 出行、习惯等信息。通过浏览记录和 APP 后 台 上 传 数 据 等 , 这 些 信 息 被 互 联 网 公 司 收 集, 整合处理后变成产品推荐、 路径选择等内容返回到用户。 这个共享的行为数 据 中 , 包 括 了 丰 富 的 交 通 大 数 据 。 常 见 的 数 据 有 :第一、 出行规划数据。 常见的出行规划导航或地图 APP, 会将用户的路径规 划数据保存并上传, 包含时间、 始发地和目的地、 途径道路等信息 。 当手机数据大 数 据 在 城 市 交 通 规 划 及 管 理 中 的
26、应 用 研 究7足够多时,就能推算特定时期人口迁徙的特征。第二、 LBS 数据。多数 手机 APP 提供基于位置的服务 ( LBS) ,通过运营商 网络,获取移动终端用户的位置信息,在 GIS 平台的支持下,为用户提供相应 服务的一种增值业务。 比如, 推荐周边的餐馆等服务。 LBS 数据提供 了用户移动 行为数据的交通大数据。第三、 手机信令数据。 手机信令数据是手机运营商记录的一系列手机用户通 话、 短信、 基站切换的数据。 由于每个基站有固定的位置 , 因此手机信令数据变 相地记录了用户的移动行为。 有别于前两种数据, 任何一部手机均会产生信令数 据,无需智能手机。因此,信令数据的样本量
27、更大,代表性也更高。设 备 采 集 和 行 为 共 享 数 据 的 另 一 主 要 区 别 在 于 设 备 采 集 数 据 一 般 是 政 府 行 为, 数据虽然分散在各政府部门, 不过获取相对容易 。 行为共享数据都由互联网 等企业掌握, 部分涉及商业机密, 这部分数据获取困难 , 但是对于研究交通特征 价值巨大。1.5 交 通 大 数 据 相 关 处 理 技 术城市交通大数据所涉及的相关处理技术,总结起来大致包括如下内容:(1) 基于 Hadoop 框架的 MapReduce 模式技术Hadoop 是一个能够对大量数据进行分布式处理的软件框架,而 map/reduce 是 Hadoop 的
28、 核 心 计 算 模 型 , 它 将 复 杂 地 运 行 于 大 规 模 集 群 上 的 并 行 计 算 过 程 高 度地抽象到了两个函数。 Hadoop 实现了一个分 布式文件系统 (Ha doop distributed file system, HDFS) 。 HDFS 有着高容错性的 特点,用来部署在低廉的硬件上。 而且它能提供高传输率来访问应用程序的数据, 适合那些有着超大数据集的应用 程序。(2) 数据仓库技术 数据仓库是决策支持系统 (DSS ) 和联机分析应 用数据源的结构化数据环境,研究和解决从数据库中获取信息等问题。 数据仓库的特征在于面向主题、 集成性、 稳 定 性 和时
29、 变性 。 其主要 功 能 是将 组织 通 过资讯 系 统 的联 机交 易 处理 ( OLTP) 经年累月所累积的大量资料、 数据仓库理论所特有的资料存储架构进行系统的分 析整理, 以利于各种分析方法如线上分析处理 (O LAP) 、 数据挖掘 (da ta mining) 的进行,进而支持决策支持系统、主管资讯系统(EIS)等系统的创建,帮助决大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究8策者快速、 有效地从大量数据资料中分析出有价值的信息, 以利于决策拟定及快 速回应外在环境变动,帮助构建商业智能。(3) 中央数据登记簿技术 中央数据登记簿系统是平台数据统一管
30、理、 综合交通信息服务的基础, 包括与交通信息有关的数据表不和交互以及交通信息服务、 适合于综合交通环境的数 据字典和消息模板、交通数据项定义规则、注册和管理机制等。(4) 平台 GIS-T 应用技术平台 GIS-T 应用技术是 交通地理信息系统的支撑技术, 可为交通信息服务提 供高效的信息查询功能、 海量的存储功能, 包括出租车 、 公交车、 综合交通视频 信息等数据 ; 提供优秀 用户体验的 WebGIS 引 擎, 让用户享受基于 浏 览器的交通 信息服务。(5) 基于非序列性数据操作技术 基于非序列性数据操作技术包括虚拟化环境以及流数据处理技术, 通过网络将大量服务器的内存空间统合在一起
31、, 使之形成一个超大型的虚拟内存, 然后在 其上进行数据配置, 可实现对现有设备资源的最大使用效率, 同时实现对即时性 数据的反馈能力。(6) 视频大数据处理技术 视频大数据处理技术将目前各个专用性的视频监控系统有机地整合在一起,实现视频资源统一接入、 统一转码、 统一分发、 统一管理和统一运营的 “五统一” 目 标 。 它 可 整 合 包 括 交 通 视 频 、 站 台 视 频 、 客 运 站 视 频 、 高 速 公 路 视 频 、 社 会 治 安视频、 车载视频等在内的多种视频资源, 提高整体视频监控的效率, 且基于视 频监控基础设施之上创造更多增值性的应用, 从而实现视频监控系统的最大化
32、效 用。(7) 大数据处理技术 大 数 据 预 处 理 技 术 是 将 接 入 平 台 的 数 据 根 据 具 体 的 业 务 规 则 进 行 进 一 步 的处理, 包括对接入的数据进行有效性的检验、 大数据清洗等。 大数据标准化处理 技术从数 据库中取出经过清洗后的数据, 根据业务规则将外部系统的数据格式转 化为平台定义的标准格式。(8) 大数据融合处理技术大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究9大 数 据 融 合 处 理 技 术 是 指 采 用 多 源 交 通 信 息 融 合 方 法 , 结 合 特 征 融 合 技 术(识别 /分类、 神经网络、 贝叶斯
33、网络等) 、 目标机动信息处理技术 (自适应噪声 模型等) 及多目标跟踪的信息融合技术, 提高信息系统的完整性及可靠性。 多源 交通大数据信息融合分为 3 级: 基础级是数据级融合, 它只完成数据的预处理和 简单关联; 第二级是特征级融合, 就是根据现有数据的特征预测交通参数; 第三 级是状态级融合, 根据当前交通流信息判断交通状态。 交通流信息融合的基本过 程包括多源信息提取、信息预处理、融合处理以及目标参数获取和状态估计。(9) 实时数据分发订阅技术 海量交通大数据具有数据量大、 更新频繁、 时效性高等特点, 往往需要来自于其他系统的实时数据来支持其业务逻辑。比如浮动车辆的 GPS 数 据
34、 、 目 前 城 市道路的路况分析和收费站排队监控分析、 省级运政卫星定位联网监控系统的上 报、营运车辆安全监管系统等监控分析系统需要向外单位共享的数据。(10)大数据挖掘技术 多源交通大数据挖掘是一个多步骤的过程,可以分为问题定义、数据准各、数据分析、模式评估等基本阶段。其处理模型如下图所示。图 1-1 交 通 大 数 据 挖 掘 模 型大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究102 国 内 外 交 通 大 数 据 研 究 应 用 现 状2.1 研 究 机构 关注交 通大 数据 人才 培养 和技 术应 用交通大数据是大数据技术在交通方面的应用, 高校一方面着
35、手培养大数据人 才, 另一方面传统交通院系基于已有的知识积累 , 在智能交通的研究中进一步应 用大数据技术, 把交通数据的应用作为研究的重点。 科研院所通过示范项目, 积 极参与政府交通大数据方面的技术研发和应用。(1)数据科学研究和人才培养引起高校重视 继旧金山大学、 纽约大学、 哥伦比亚大学、 伯克利加州大学开设研究大数据的相关课程之后, 斯坦福大学里也开始开设诸如机器学习这样全新的课程, 培养 下一代的 “数据 科学家 ”,其中 交通大 数据作 为分析的 大数据 应用案 例之一。我 国复旦大学、 北京航空航天大学、 南京大学等高校相继成立了近十个从事数据科 学研究的专门机构, 虽就交通大
36、数据方面, 并未有专门研究机构, 但交通是其技 术应用方向之一。(2)传统交通院系把交通数据的应用作为研究重点 美国华盛顿大学的智能交通与应用研究室建设基于网络的交通数据平台, 如应用交通数据计算旅行时间来解决交通拥堵, 实现数字化道路的交互式可视化和 评价网络等。 我国如清华大学、 同济大学等高校的传统交通、 汽车院系, 基于 已 有研发基础, 纷纷跻身于交通大数据的研究一线。 清华大学汽车工程系从整车入 手, 研发交通大数据管理系统。 同济大学交通运输学院开展智慧城市交通监测管 理服务平台研发,监测各道路交叉口、快速路出入口的交通实时变化信息。(3)我国科研院所成为承接政府技术研发和示范项
37、目的主体 示范项目是带动大数据技术应用到交通领域的重要手段, 也是研究机构参与交通大数据研发与建设的主要方式。 中国科学院深圳先进技术研究院与深圳市交 通运输委员会开展合作, 从弹性存储资源管理到交通数据分析挖掘, 多方位多角 度地为公众提供便捷的交通出行服务。 公安部第三研究所与北京市公安局公安交 通管理局合作, 开展基于大数据技术的交通事故规律分析与态势预测研究, 拟最 大限度地降低事故带来的伤害和损失。2010 年,北京交通发展研究中心推出北京市道路交通指数,将复杂的道路大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究11评估用简单的指数形式呈现给政府和市民,
38、交通数据由政府走向民间。 所谓交通 指 数 , 是 北 京 市 独 创 的 交 通 拥 堵 指 数 或 交 通 运 行 指 数 ( Traffic Performance Index( TPI) ) 的简称, 是综 合反映道路网畅通或拥堵的概念性指数值。 交通指数取值 范围为 0 至 10, 每 2 个数一等级, 分别对应 “畅通” 、 “基本畅通” 、 “轻度拥堵” 、 “中度拥堵” 、 “严重拥堵”五个级别,数值越高,表明交通拥堵状况越严重。表 2-1 交 通 指 数 分 级 及 其 含 义交通指数 对应路况 出行时间0-2 基 本 没 有 道 路 拥 堵 可 以 按 道 路 限 速 标
39、准 行 驶2-4 有 少 量 道 路 拥 堵 比 畅 通 时 多 耗 时 0.2 至 0.5 倍4-6 部 分 环 路 , 主 干 路 拥 堵 比 畅 通 时 多 耗 时 0.5 至 0.8 倍6-8 大 量 环 路 , 主 干 路 拥 堵 比 畅 通 时 多 耗 时 0.8 至 1.1 倍8-10 全 市 大 部 分 道 路 拥 堵 比 畅 通 时 多 耗 时 1.1 倍 以 上2.2 领 先 企业 成为交 通大 数据 技术 研发 和应 用的 引领 者在市场前景预期看好的背景下, 各大企业正在一步一步脚踏实地地从大数据 交通细分化领域开始探索, 在寻找突破口和不断尝试的同时提升技术研发实力和
40、 行业竞争力,在交通大数据技术研发和应用中扮演着重要角色。(1)汽车厂商向乘车服务领域进军 面对交通大数据广阔的市场前景, 在国内汽车厂商悄无声息之际, 传统汽车厂商巨头正凭借产业链的前端优势, 着手挖掘数据背后的含义和蕴藏的机会, 进 军乘车服务领域。 方式一, 通过并购市场领先的交通信息服务企业开展乘车服务。 如德国戴姆勒奔驰收购了打车应用 Mytaxi, 美国的奔驰子公司 Moovel 收购移动 交通 APP 市场领先者 Ridescout, 其 目 标 是 整 合 乘 车 信 息 服 务 , 包 括 交 通 方 式 的 预 订 和 在 线 支 付 。 方 式 二 , 利 用 厂 商 优
41、 势 探 索 车 载 前 端 交 通 大 数 据 应 用 。 福 特 Energi 插 电 式 混 合 动 力 的 测 试 车 型 , 通 过 各 种 车 载 仪 器 , 记 录 了 电 池 的 使 用 寿 命、 汽车的性能、 充电站信息等, 福特经过分析和处理, 通过智能手机应用实时 回馈给车主。 沃尔沃汽车集团在车上加装多种传感仪器, 记录各零件发出的噪音 和震动情况, 用于车辆检修或保养时的诊断。 方式三, 整合后端信息提供综合交 通信息服务。丰田开发了大数据交通信息服务系统 T-Probe, 使 用 车 辆 定 位 、 道 路情况、 车速和其他多种参数向当地政府和企业提供数据以缓解交通
42、拥堵。 通用 的安吉星和宝马的互联系统, 记录了车辆的准确位置和细化到车的型号及颜色的 数据, 可迅速定位车辆, 通过呼叫中心实时指导驾驶员自己先行进行简单的检查大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究12或者是自救。(2)软件及数据供应商以新产品抢占新兴市场 发达国家交通大数据企业产品应用不局限于实时交通服务, 在多领域积累优势。 谷歌公司基于交通大数据研发的无人驾驶汽车独占业内翘楚, 即将上路测试。 英国政府曾应用实时交通数据公司产品 Inrix 确保奥运会期间交通顺畅。美国已 有超过 25 个 州 的 交 通 部 使 用 了 Inrix 交 通 速 度
43、数 据 技 术 来 辅 助 交 通 管 理 。 Inrix 交通大数据应用还涉及停车导航、 房地产业务。 在公共交通领域, 苹果公司把公 共 交 通 导 航 深 度 集 成 到 最 新 的 地 图 应 用 上 。 在 非 机 动 车 领 域 , 英 国 公 司 的 Collideoscope 应用能协助分析自行车事故, 找出造成自行车事故的关键因素 。 在 汽车保险领域, 美国和欧洲的保险公司已经开始提供能够收集交通数据的后市场 解决方案,如美国 Progressive 公司的 Snapshot, 以 及 英 国 的 insurethebox。我国交通大数据应用提供实时交通信息和整合生活服务并
44、举。 相对于发达国 家, 我国比较突出的是互联网企业正成为出行服务的主体 , 以腾讯、 高德为代表 的互联网公司, 普遍集中于整合与分享基于位置信息的交通大数据资源, 作为其 市场应用的重要领域。 一方面为公众出行提供实时交通信息, 一方面整合生活服 务,起到 O2O 总入口平台的作用,通过商家服务信息与地理信息的数据融合, 通过地图服务将给用户带来更便捷的使用体验。 如高德与阿里巴巴宣布战略合作 后, 将共同致力于海量基础地图和生活服务数据库的建设, 更好地提升交通数据 和生活服务的融合和应用体验。2014 年,百度推出春运迁徙地图,依托强大的地图和移动终端用户数据为 用户提供及时、 全面的
45、春运出行信息, 帮助用户更好的规划行程 。 百度迁徙以区 域和时间为两个维度,通过 LBS 开放平台分析手机用户的定位信息,能够映射 出手机用户的迁徙轨迹,可用于观察当前及过往时间段内,全国总体迁徙情况, 以及各省、市、区的迁徙情况,直观地确定迁入人口的来源和迁出人口的去向。大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用 研 究13图 2-1 百度春运迁徙地图2014 年,高德交通季度分析报告基于海量历史路况数据,分析出不同区域 在不同时段内的拥堵延时指数, 首次推出主要城市拥堵延时指数排名 。 据首席交 通 数 据 分 析 师 高 德 副 总 裁 董 振 宁 介 绍 ,
46、基 于 高 德 十 余 年 LBS 领域的积累, 打通数据采集、 生产、 发布再到用户反馈的闭环, 使得高德相较于同类产品能够 通过众包采集这一模式实现海量数据的采集, 进而统计出这一报告 。 据高德发布 的 2014 年 第 四 季 度 中 国 主 要 城 市 交 通 分 析 报 告 暨 春 运 出 行 指 南 , 报 告 显 示 2014 年第四季度全国重点城市拥堵排名哈尔滨居首,北京、上海、杭州等传统 “堵城”紧随其后。图 2-2 2014 年 第 四 季 度 拥 堵 城 市 TOP10(3)通信运营商积极变身信息运营商大 数 据 在 城 市 交 通 规 划 及 管 理 中 的 应 用
47、研 究14目前全球 120 家运营商中, 已经有 48%的企业 正在实施大数据战略。 从曾经 的 “管道” 到大数据战略融合 , 智能交通是其重要发展方向之一 。 发达国家通信 运营商研发应用交通大数据培育新增长点。美国电信公司 AT&T 宣布将和 IBM 展开合作,通过收集民众的活动数据来优化交通管理。德国电信旗下 T-Systems 开发了车载互联网导航系统和交通意外自动呼叫系统。 法国电信旗下企业 Orange 承建了法国高速公路数据监测项目, 为行驶于高速公路上的车辆提供准确及时的 信息, 有效提高道路通畅率。 我国通信运营商开创价值蓝海增强自身实力 。 我国 通信运营商面临互联网 O
48、TT 业务的蚕食, 积 极转变发展模式 , 利用大数据技术, 中国联通的视频监控应用已经覆盖上千万辆车, 中国电信布局推进交通海量数据 为基础的综合应用, 中国移动建立位置服务基地 , 三大运营商通过开创新的价值 蓝海, 改变传统的经营模式 , 提高客户的感知质量, 增强运营商自身的实力 , 来 应对来自于虚拟运营和 OTT 的业务冲击。2.3 各 城 市 相 继 建 立 交 通 信 息 中 心 , 实 现 交 通 数 据 汇 集在 大 数 据 时 代 , 应 用 云 计 算 、 无 线 移 动 、 物 联 网 、 车 联 网 等 各 种 新 技 术 , 建 设新一代智慧交通体系是国际国内特大
49、城市应对交通问题的重要手段, 也是数字 城市向智慧城市发展的必然方向。 在国家GB 50688城市道路交通设施设计规范 中 还提出了 “每座城市均宜设置一座交通监控中心作为城市交通智能化管理的基 础平台 ”的建议。 近几年来, 许多城市也已重视交通大数据的作用 , 相继建成了 现代化的交通综合管制系统或交通管理中心, 实现交通数据汇集 , 用信息化技术 辅助政府决策和管理, 获取交通状况、 研究交通规律、 制定交通措施、 评估建设 方案,理论与实际相结合科学指导城市建设,效果良好。北京市交通运行监测调度中心整合 2800 多项数据,接入 6000 多路视频和13 个应用系统,已初步建成集轨道交通、地面公交、出租车等综合运输方式和 城市道路 、 高速公路监控调度、 统计分析、 气象保障和应急指挥为一体的新一代 综 合 交 通 运 输 管 理 系 统 。 主 要 应 用 系 统 包 括 路 网 、 地 铁 、 地 面 公 交 、 综 合 运 输 4 个监测板块, 为交通运行协调指挥中心与各分中心间的协调联动、 数据共享和全 市交通应急指挥等提供保障, 将交通指数形成专报上报给各级部门支持决策。 另 外, 在节假日高速公路免费通行、 春运等重要时间, 供市领导、 交警等部门结合 现场监测情况决策交通管理方案。大 数 据 在 城