1、基于加权距离成本的最优学区划分算法 栗敏光 董琳琳 国家测绘地理信息局重庆测绘院 林同棪国际工程咨询(中国)有限公司 摘 要: 学区划分的科学性与合理性始终是我国教育领域的一个热点课题。最优学区划分算法研究具有重要的现实意义。本文以就近入学为基本原则, 以区域学生总体上学距离成本最小化为核心目标, 提出了一种基于学生数量加权距离成本的最优学区划分算法, 通过 FME 软件平台设计程序加以实现, 利用模拟数据试验验证了算法和程序的可行性与有效性。关键词: 学区; 学区划分; 距离成本; 加权距离成本; 作者简介:栗敏光 (1984-) , 男, 山西阳城人, 工程师, 硕士, 2010 年毕业于
2、中国矿业大学摄影测量与遥感专业, 主要从事航测遥感与 GIS 数据处理与应用工作。收稿日期:2016-12-19An Algorithm for Optimal School District Zoning Based on Weighted Distance CostLI Min-guang DONG Lin-lin Chongqing Institute of Surveying and Mapping, NASMG; TYLI Engineering Consulting ( China) Co., Ltd.; Abstract: The scientificity and ration
3、ality of school district zoning has always been a hot topic in our countrys education field. Research on algorithms for optimal school district zoning is of important realistic significance. On the principle of nearby enrollment and the objective of minimizing overall costs of distance from pupils h
4、ome to school, an algorithm for optimal school district zoning based on pupil number weighted distance cost is proposed. A corresponding program is designed based on FME platform. The result of the experiment with simulated data shows the algorithm proposed and the program designed are feasible and
5、effective.Keyword: school district; school district zoning; distance cost; weighted distance cost; Received: 2016-12-190 引言我国在 1986 年通过的中华人民共和国义务教育法和 1992 年颁布的中华人民共和国义务教育法实施细则中即已明确了义务教育阶段适龄儿童、少年就近入学的原则。然而由于区域、学校之间教育资源存在差异, 就近入学政策在现实中遭遇诸多挑战, 其中矛盾的焦点落在学区的划分上1。时至今日, 网络、报刊等媒体仍不时出现学生和家长对现行学区划分方案提出质疑甚至提起诉
6、讼的新闻报道2-4。由此可见, 学区划分的科学性与合理性始终是我国教育领域的一个热点课题, 研究最大限度地体现就近原则的最优学区划分算法具有重要的现实意义。国内外学者运用 Voronoi 图等计算几何理论、线性规划等运筹学原理以及叠加分析、网络分析等 GIS 空间分析技术开展了相关研究并取得了一定成果5-9。而国内已有学区划分方法要么未做定量分析, 要么仅从学校学生容量角度进行了简单的数量差别化分析7,9, 要么采用的空间距离与数量关系综合分析模型过于复杂6。本文以就近入学为基本原则, 以区域学生总体上学距离成本最小化为核心目标, 提出了一种基于学生数量加权距离成本的最优学区划分算法, 基于
7、FME 软件平台设计程序加以实现, 利用模拟数据试验验证了算法和程序的可行性与有效性。1 算法设计与程序实现1.1 算法设计综合国家法律法规文件精神和各地教育部门实践情况以及相关学者研究成果, 可以将学区划分所要体现的就近原则具体分解为 3 点要求:1) 将街区作为划分学区的最小单元, 一个街区内的学生只能被整体划入某一学区而不能被分散划入多个学区;2) 被划入某一学区的各个街区学生数量总和不应超过对应学校学生容量;3) 区域学生总体上学距离成本最小, 亦即区域内所有学生所属街区到对应学校的总体距离成本最小6。其中, 前两点是设计学区划分算法的硬性约束条件, 第 3 点则是学区划分算法的优化目
8、标, 也是衡量算法优越性的重要指标。学区划分的概念可以直观地理解为依据其间学校的位置分布将整个行政区域划分为与各个学校相对应的各个学区。所划学区的范围和形状显然受到学校位置分布的直接影响, 不过却并非是学校辐射的自然边界, 而是需要首先满足以街区为最小单元的前提条件。于是, 学区划分从另一个角度也可理解为每个街区配置对应的学校, 被配置同一学校的街区自然聚合为同一学区。根据就近原则, 配置的基本目标自然是基于空间距离就近乃至最近配置。因此, 学区划分的第一步即以每个街区为基准要素, 以整个行政区域跨度为最大搜索距离, 计算其到每个学校的空间距离, 获取距离从小到大的候选学校序列, 并将候选学校
9、序列中的首位学校作为目标学校。所有街区被贴上目标学校的标签即意味着初始学区划分结果的形成。初始学区划分结果仅是距离最近方案, 接下来需要在此基础上引入街区学生数量与对应学校学生容量的关系约束条件, 基于加权距离成本最小化准则进行调配。具体地, 学区划分的第二步是分组统计被赋予同一学校 (亦即划入同一学区) 的各街区的学生数量总和, 进而与对应学校学生容量进行比较。根据比较的结果, 第三步对其中学生数量总和超过对应学校学生容量的街区分别计算其到候选学校序列中下一位次学校的加权距离成本 (亦即学生数量与其到下一位次学校距离的乘积) , 进而将其中加权距离成本最小的街区的目标学校替换为其候选学校序列
10、中的下一位次学校, 继而重新进行分组统计比较, 并完成具有最小下一位次加权距离成本街区的目标学校的替换。以此循环迭代, 直至所有学区的各个街区学生数量总和与对应学校学生容量均满足关系约束条件为止, 从而形成最终学区划分结果。算法流程如图 1 所示。图 1 算法流程图 Fig.1 Algorithm flow chart 下载原图1.2 程序实现基于 FME 软件平台, 调用其函数库提供的丰富的转换器, 定制可视化工作流实现上述算法。首先从函数库中搜索恰当的转换器匹配算法流程中的每一项操作 (其中关键转换器功能对照表见表 1) , 然后运用固有转换器构建自定义转换器, 通过循环迭代实现学区调配子
11、过程 (如图 2 所示) , 最后综合运用固有转换器和学区调配自定义转换器设计整体程序, 实现以基于距离排序的初始学区划分、学区学生数量与学校学生容量关系判断、基于学生数量加权距离成本最小化准则的学区调配及最终学区划分结果生成为主线的学区划分全过程 (如图 3 所示) 。表 1 程序涉及关键 FME 转换器及其功能对照表 Tab.1 Mapping table of the key FME transformers in the program and their functions 下载原表 图 2 学区调配子过程 Fig.2 Subprocess of school district pr
12、ogramming 下载原图图 3 学区划分全过程 Fig.3 Process of school district zoning 下载原图2 模拟试验模拟数据源包括街区数据和学校数据, 前者为面状要素, 包含学生数量属性;后者为点状要素, 包含学生容量属性。试验所得学区划分结果与学校叠加图 (学区按目标学校分类设色, 学校按学生容量分级设置尺寸) 如图 4 所示 (左图为初始学区划分结果, 右图为最终学区划分结果) 。由图可见, 单纯基于空间位置分布因素形成的初始学区划分结果中, 每个街区均被划入与之距离最近的学校辐射的学区范围;根据学区学生数量与学校学生容量关系约束条件加以调配形成的最终学
13、区划分结果中, 出现了部分街区被划入与之距离次近或者更远的学校辐射的学区范围甚至个别学校 (C 校) 所坐落街区被划入其他学校 (B 校) 辐射的学区范围等貌似不合理的情况, 然而在实施学区划分的整个行政区域的宏观层面上却是合理且总体距离成本最小的方案。图 4 学区划分结果与学校叠加图 Fig.4 Overlay of the zoned school districts and the schools 下载原图3 结束语本文算法将最优学区划分为初始划分和调配划分两大过程。单纯基于空间位置分布因素形成的初始学区划分结果是距离最近方案 (同时也是加权距离成本最小方案) , 系就近原则理想化的极限
14、;以此为基础根据实际的数量关系约束条件进行的每一次调配均以由此所增加的加权距离成本最小为准则, 最终形成的学区划分结果是满足数量约束条件的加权距离成本最小方案, 最大限度地体现了就近原则。算法的逻辑思想和原理流程是科学而合理的。模拟试验结果亦表明本文算法及程序是可行而有效的。与相关研究的学区划分方法比较, 本文算法和程序考虑因素全面, 简洁实用, 可为相关部门制订学区划分方案工作提供支持。同时不难发现, 作为学区划分方案的影响因子, 即使街区与学校的数量和位置分布以及学校容纳学生的数量保持恒定, 各个街区输出学生数量的动态变化也将形成不同的最优学区划分结果。这就需要在实践中每隔一定周期从相关部
15、门收集现势统计数据输入算法模型动态, 更新和优化先前的学区划分方案。参考文献1廖德凯.学区划分应提升社会参与度N.中国教育报, 2015-05-07. 2李腾.北京西城教改:“牛校”给谁EB/OL.2015-05-29.http:/ 3李劭强.“就近入学索赔一元”背后的诉求表达N.天津政法报, 2015-11-23. 4许朝军.“就近入学”诉讼拷问教育资源配置N.江苏教育报, 2015-12-16. 5Hite S J.School Mapping and GIS in Education MicroplanningC/Directions in Educational Planning:A Symposium to Honour the Work of Francoise Caillods.Paris:France, 2008. 6孔云峰.利用 GIS 与线性规划学校最优学区划分J.武汉大学学报:信息科学报, 2012, 37 (5) :513-515. 7薛姣.基于加权 Voronoi 图的小学优化配置模型D.石家庄:河北师范大学, 2013. 8周子懿.学区划分背景下的小学布点规划评价与优化研究D.杭州:浙江大学, 2015. 9佟耕, 李鹏飞, 刘治国, 等.GIS 技术支持下的沈阳市中小学布局规划研究J.规划师, 2014, 30 (S1) :68-74.