1、网络数据可视化 计算机系 胡事民 清华大学“大数据”系列课程大纲 网络关系数据 网络关系数据的可视化 节点链接布局 相邻矩阵 混合布局 图的简化 网络关系数据的交互 工具与应用有向图 无向图 加权图 非连通图 顶点的度 回路 无回路图 无回路连通图 (树) 具有根结点 的树 节点的深度 回顾:树 vs. 图网络关系数据 相较于树型数据中明显的层次结构,网络数据 并不具有自底向上或自顶向下的层次结构,表 达的关系更加自由和复杂 社交网络 电话网络 邮件网络 合作网络网络理论的应用 疾病传播分析 路由器网络的设计 搜索引擎的设计 演员的协作关系分析 科研人员的研究协作分析 社交网络 . . Typ
2、hoid Mary AIDS Mary美国议会关系移动专利诉讼关系 基于D3.js http:/bl.ocks.org/1153292 http:/ p/mobile-patent-suits-graphic-of-the-day/网络的重要性质 关系的复杂性 方向性、权重 关系的中心性(centrality) Degree Closeness Betweenness 该边在图中所有最短路径中出现的总次数和 Eigenvector大纲 网络关系数据 网络关系数据的可视化 节点链接布局 相邻矩阵 混合布局 图的简化 网络关系数据的交互 工具与应用需要解决的问题 网络关系结构的图形化展示 和层次数
3、据相比更加复杂 节点的排布 视图的视觉复杂度 与网络视图的交互网站图 Google 图的可视化 节点链式显示 分层显示/Sugiyama 力引导布局 相邻矩阵 基于属性的显示Sugiyama 类显示 非常适用于显示具有原生顺序的树,图的“深度” 映射到某一坐标轴上 这张Unix族谱的“原生顺序”是什么? 还有什么比较典型的有 “原生顺序”的图关系? UNIX 族谱Sugiyama:层次建立 创建图的层次 原生顺序 领域知识 如果都没有 一个好的Sugiyama布局应当满足: 尽量少的回边(所有边尽可能统一方向) 寻找最大无环子图(Minimum feedback arc set problem
4、, 多项式时间内不可解) 将所有回边反向(并记录)后进行下一步处理 最终渲染时再将被反向的边恢复。Sugiyama:层次建立(cont.) Eades, 1993 没有入度或没有出度的节点不可能参与到任何回路 中。 另一方面,一张图如果所有节点都有出度有入度, 则其中一定含有环。(反证法) 设计贪心算法实现(并不保证得到最优解)Sugiyama:层次建立(cont.) 对于一个图G通过贪心法求解其最大(?)无环子图 构造一个空图G 如果G不为空: 将G中所有无出度或者无入度的节点(以及其所有连 接的边)移至G 。 此时图中一定有回路 统计所有节点出、入度之差,取差值最大的节点。 如果出入,将该
5、节点与所有出边移至G,删去所有入边。 如果入出,将该节点与所有入边移至G,删去所有出边。 循环该过程。 G即为所求解的最大(?)无环子图。Sugiyama:层次建立(cont.) 完成上一算法之后,我们得到了一张有向无环图。 之后在这张有向无环图内对每个节点确定其层次, 有若干不同的方案: 最长路层次化: 将所有汇节点(无出度的节点)置于底层(第0 层) 每个非汇节点的高度为它到汇节点集合的最长距离。 优点:快速(线性时间) 缺点:宽度控制Sugiyama:层次建立(cont.) Coffman-Graham 层次化: 算法原本用于多CPU 系统调度(任务依赖性由有向 无环图确认) 拓扑排序
6、保留拓扑排序同时满足层次化,使得每一层最多含 w个节点(限制了宽度),从汇节点开始贪心排布。 O(n2)Sugiyama:层次建立(cont.) 单纯形层次化(Network Simplex Layering, AT&T,1993 ) Integer Linear Progamming(ILP) 可以自由添加约束 高度约束(避免“高到不知道哪里去”) 宽度约束Sugiyama:层次建立(cont.) 同一个结构在最长路、 Coffman-Graham、单 纯形下的层次建立结果: 最长路 Coffman-Graham 单纯形Sugiyama:交叉约简 以上仅仅从图结构上讨论了层次化问题,然而 以
7、上述方法直接建立的图会存在交叉。 交叉点的数量与实际坐标无关,而只与节点的 排序相关。 即便是在只有两层的情形(二分图)下,寻找 交叉最少的布局方案也是多项式时间内不可解 的问题。Sugiyama:交叉约简(cont.) 启发式算法:每次只在两层之间,锁定其中一层,对 另一层的相对位置进行调整。具体调整算法? 快速排序 先随机确定一个点p,之后对于每个点c通过最少交点的 原则确定它应当在p左侧还是右侧,之后对p两侧的节点 依此类推。 均值(中位数)法: 对于每一个点p,计算其所有邻接节点x 坐标的均值(中 位数),最终对所有节点的计算结果进行排序。 ILP 法Sugiyama 美观、可读性好、自然的自上而下排列 相对快速(依赖于启发式算法) 不适用于明显不具有原生自顶向下顺序的图 难以实现图的可视化 节点链式显示 分层显示/Sugiyama 力引导布局 相邻矩阵 基于属性的显示基于力引导的算法 没有原生的顺序,怎么办? 使用物理模型:边=弹簧;节点=互斥质点力引导结果示例 High school dating network力引导结果示例 悲惨世界的人物图谱 http:/hci.stanford.edu/jheer/files/zoo/