1、最短聚类法分析自然对数变换 标准差标准化省、自治区首位城市规模(万人) 城市首位度四城市指数基尼系数城市规模中位值(万人)首位城市规模(万人) 城市首位度四城市指数基尼系数城市规模中位值(万人)京津冀6.5506516720.362627194-0.065712543-0.247948672.3869262411.557229197-1.1123420450.4752642911.773909089-1.30247943山西5.1899523420.6409060690.00059982-0.5327304592.466403178-0.5697782380.3794549670.630849
2、7770.233481708-1.08198916内蒙古4.7107006870.349247428-0.389788629-0.6620361862.877792976-1.318931126-1.184068277-0.285099731-0.4659523460.059316123辽宁5.9651205720.651387246-0.157706996-0.5513004563.2703291060.6419432290.435642450.2594221620.133033811.148316294吉林5.3534682110.5810976770.076775839-0.783290
3、732.980872411-0.3141747690.0588342210.80957788-1.1218363540.345286034黑龙江5.5568280620.835471056-1.07382212-0.6780615433.1561489950.0037117071.422478685-1.890014379-0.5526359080.831550139第一步:将原始数据经标准化处理后,以欧氏距离作为分类统计量,得初始距离矩证图,如图所示京津冀(G1) 山西(G2)内蒙古(G3) 辽宁(G4) 吉林(G5)山西(G2)1.356123761内蒙古(G3)1.773531093 1
4、.061751782辽宁(G4)1.547867151 1.1483672421.289162593吉林(G5) 1.79365799 0.9026711540.9235392410.845975663黑龙江(G6)2.209079887 1.5524921151.5312141.1464507351.400629739第 2 步:在初始距离矩证图中,最小元素为 G45=0.8460,将 G4 和 G5 合为一新类 G7,然后再计算新类 G7 与其他各类间的距离D7,1=min(1.547867151,1.79365799)=1.547867151G7,2=min(1.148367242,0.
5、902671154)=0.902671154G7,3=min(1.289162593,0.923539241)=0.923539241G7,6=min(1.146450735,1.400629739)=1.146450735经过第一步得到下表,删掉了 G4,G5 所在行列的元素。然后再把新计算出来的与其他各类的距离填到初始距离矩证图中,得下表从上表得知,最小元素为 G2,7=0.9026,再将 G2 和 G7 合并为 G8,然后再计算 G8 与其他类间的距离。G8,1=min(1.356123761,1.547867151)1.356123761G8,3=min(0.923539241,1.0
6、61751782)0.923539241G8,6=min(1.552492115,1.14645073)1.14645073京津冀(G1) 山西(G2) 内蒙古(G3) 黑龙江(G6)山西(G2) 1.356123761内蒙古(G3) 1.773531093 1.061751782黑龙江(G6) 2.209079887 1.552492115 1.531214G7 1.547867151 0.902671154 0.923539241 1.14645073经过第二步计算,合并了 G2 和 G7,于是再把 G2 和 G7 删掉,增加了 G8,得到了下表京津冀(G1) 内蒙古(G3) 黑龙江(G6
7、)内蒙古(G3) 1.773531093黑龙江(G6) 2.209079887 1.531214G8 1.356123761 0.923539241 1.14645073最小元素为 G3,8=0.9235,再将 G3 和 G8 合并为 G9 然后再计算 G与其他类间的距离。G9,1=min(1.773531093,1.356123761)1.356123761G9,=min(1.14645073)1.14645073经过第三步计算,增加了 G9京津冀(G1) 黑龙江(G6)黑龙江(G6) 2.209079887G9 1.356123761 1.14645073最小元素为 G9,1.14645073 合并 G6 和 G9 为 G10,计算 G与其他类间的距离。G10,1=min(2.209079887,1.356123761)1.356123761经过第四步计算,得到下表。京津冀(G1)G10 1.356123761G10 和 G1 合并为 G11,得到最后结果画出联结表和聚类图联结表联结方法联结顺序新类 类别 距离系数1 G7 G4 G5 0.8462 G8 G2 G4 G5 0.90283 G9 G2 G3 G4 G5 0.92354 G10 G6 G2 G3 G4 G5 1.14655 G11 G1 G2 G3 G4 G5 G6 1.3561聚类图