1、 基于因子分析的老年男性肺活量与地理因素作者:何进伟 葛淼 徐军昶 曹利霞 王欣 闫艳春 何地平【摘要】 目的 为制定中国老年男性肺活量参考值的统一标准提供科学依据。方法 搜集了中国用肺量计测定的 85 个单匣的 12 405例健康老年男性肺活量参考值。运用相关分析的方法研究了其与海拔高度(X1),年日照时数(X2),年平均相对湿度 (X3),年平均气温(X4) ,年降水量(X5)和气温年较差(X6)的关系。结果 发现年平均相对湿度是影响老年男性肺活量最主要的因素(r3=-0.414),随着年平均相对湿度的增加而老年男性肺活量参考值在减小。运用因子分析将 6 个地理因素综合为 2 个公共因子
2、F1,F2 ,用其得分值代替推导出的回归方程:=3.247+0.000 749F10.103,用该方程计算出中国 4 383 个观测点的参考值,应用 GIS 空间分析精确内插出中国老年男性肺活量参考值地理分布图。结论 若已知中国某地的海拔高度(X1),年日照时数(X2),年平均气温(X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6),可用该方程计算出该地肺一氧化碳弥散量参考值,从空间趋势分布图也可得到中国任何地方的肺一氧化碳弥散量参考值。 【关键词】 肺活量;地理因素;因子分析;空间分析【Abstract】 Objective To supply a basis for un
3、iting the reference value of Chinese old mens vital capacity (VC). Methods Factor analysis was made about the relationship between the reference values of 12 405 cases of Chinese old health mens VC and six geographical factors in Chinese areas, which were determined by spirometer. Results Annual mea
4、n relative humidity was the main factor affecting the reference value of Chinese old mens VC(r3=-0.414). As the annual mean relative humidity was increased gradually, the reference value of VC was decreased gradually. Six geographical factors had been changed into public factor F1 and F2 by factor a
5、nalysis, a regression equation had been referred with its values instead of the original data points: =3.247+0.000 749F10.103. The normal reference values of Chinese old mens VC at 4 383 observation points had been calculated in China by this equation, and the distribution map which based on these n
6、ormal reference values had been made by spatial analysis of GIS.Conclusions If geographical values are obtained in some areas, the reference value of Chinese old mens VC of this area can be reckoned using the regression equation, the distribution map also shows the reference value of Chinese old men
7、s diffusion capacity for carbon monoxide of lung in China. 【Key words】 Vital capacity; Geographical factors; Factor analysis; Spatial analysis肺活量(VC)参考值是肺功能一项重要测定指标。目前,国内外缺乏肺活量参考值的统一标准,严重影响了临床诊断的准确性。为制定中国老年男性肺活量参考值的统一标准提供科学依据,很多人测定了本地区的老年男性肺活量参考值119。但是,对老年男性肺活量参考值与地理因素的因子分析,国内外未见报道。本文用相关分析和因子分析的方法研究
8、了中国各地用肺量计一次测量法测定的老年男性肺活量参考值与地理因素的关系,发现有一定的规律性。1 材料与方法1.1 肺活量参考值 收集中国各地市(县)级医院和有关研究单位及高等院校测定健康老年男性肺活量参考值 85 个单位 12 405 例肺一氧化碳弥散量参考值;年龄 6089 岁的老年男性。这些单位分布在中国 31 个省、市、自治区,缺乏台湾省、香港特别行政区、澳门特别行政区的资料,东部平原地区的资料多于西部高原地区的资料。测定肺活量参考值的方法20有多种,本文收集的是用肺量计一次测量法测定的肺活量参考值,其方法是:受检者取坐位或立位,加鼻夹、含咬嘴,与肺量计相连,平静呼吸 5 次后测定肺活量
9、,平静呼吸末做最大吸气后进行最大缓慢呼气至 RV 位。1.2 地理资料 地理资料取材于有关地理著作和辞典2123以及中国气象科学数据共享服务网(http:/ ,年平均气温(X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6 )等六项指标。2 结果2.1 相关分析 应用 SPSS 15.0 统计软件,运用相关分析24,25计算出老年男性肺活量参考值与海拔高度(X1),年日照时数(X2),年平均气温(X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6)的单相关系数 r 和 P 值如下:r1=0.137(P1=0.406),r2=0.339(P2=0.035) ,r3
10、=-0.269(P3=0.098),r4=-0.414(P4=0.009),r5=-0.361(P5=0.024),r6=0.234(P6=0.152)。 从单相关系数可以看出,年平均相对湿度(X4)是影响老年男性肺活量最主要的因素,随着年平均相对湿度的增加而老年男性肺活量参考值反而在减小。年日照时数(X2),年降水量(X5)也与男性肺活量参考值有着显著相关性。表 1 老年男性肺活量与地理指标相关系数矩阵(略)2.2 因子分析 从相关系数矩阵(表 1)中,可以发现各地理因素之间存在着显著的相关性,所以在进行预测模型之前取消较为严重的共线性,并把一些错综复杂的变量总结为少数几个综合因子的多元分析
11、方法。2.2.1 因子分析适用性判断 在进行因子分析26之前,有一个默认的前提条件就是各变量间必须有相关性,具体在该条件上的判断上,可以使用 KMO 统计量和 Bartletts 球形检验加以判断。当 KMO 统计量大于 0.5,或者 Bartletts 球形假设被拒绝,则说明各指标间并非独立,取值是有关系的。因此用 SPSS15.0 计算各地理变量海拔高度(X1),年日照时数(X2),年平均气温 (X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6 )的 KMO 统计量和Bartletts 球形检验。 KMO 统计量为 0.6430.5,因此各变量间的相关程度无太大差异,数据
12、适合做因子分析;并由 Bartletts 球形检验,P=0.0000.01,球形假设被拒绝,因此 6 个地理变量间并非独立,与表 1 的相关系数矩阵一致,有必要进行因子分析。表 2 方差分解累积表(略)图 1 特征根碎石图(略)2.2.2 公因子提取 对选取的地理变量海拔高度(X1),年日照时数(X2),年平均气温(X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6)进行公因子的提取,由表 2 可知,前 3 个因子的累计贡献率已达 95.207%,说明已经包含了各地理变量的 95.207%的信息,效果较好。又由特征根碎石图(图 1)可以看出,当取第 3 个特征根时,曲线明显呈下
13、降的趋势,所以选取二个公共因子代替原始的 6 个地理变量来研究对老年男性肺活量参考值的影响。2.2.3 因子载荷与因子旋转 既然已提取出两个公共因子,则相应的因子模型及因子载荷矩阵 A 为:x1=a11F1+a12F2+1x2=a21F1+a22F2+2x3=a31F1+a32F2+3x4=a41F1+a42F2+4x5=a51F1+a52F2+5x6=a61F1+a62F2+6 A=a11 a12a21 a22a31 a32a41 a42a51 a52a61 a62其中,F1,F2 相互独立且不可测的的公共因子 i(i=1,2,3,4,5,6),特殊因子内,aij(i=1,2,3,4,5,6
14、;j=1,2),因子载荷的绝对值越大 (|aij |1),表明 xi 与 Fj 的相依程度越大,或称公共因子 Fj 对 xi 的载荷量越大。在实际当中,为了知道每个公共因子的明确意义,有必要进行因子旋转,使得新的因子载荷要么尽可能地接近 0,要么尽可能地远离 0。对已得到的 2 个公共因子采取斜交旋转(Varimax) 方法,得到 2 个新的公共因子,其因子载荷矩阵如表 3 所示。表 3 因子负荷矩阵(略)通过旋转前后的因子负荷矩阵,F1 公因子对年日照时数,年平均气温,年平均相对湿度,年降水量和气温年较差的载荷量较大(|aij |0.5),基本上反映了五者的信息。又由相关分析知,年日照时数、
15、年平均相对湿度、年降水量与男性肺活量参考值的相关性显著,因此反映的是地理因素对男性肺活量参考值的直接作用。公因子 F2 对海拔高度的载荷量较大,它与男性肺活量参考值的相关性不显著,因此F2 反映的是地理因素对男性肺活量参考值的间接作用。2.2.4 因子得分与回归预测 既然公共因子是由原始变量综合而来的,那么也可以用原始变量的线性表达式来表示公共因子一旦表达式给定,就能够把原始变量的取值代入到表达式中求出各个因子的得分值,从而用因子得分值代替原始变量值进行回归分析。用SPSS15.0 软件求得的 F1,F2 的表达式为:F1=0.072X1-0.230X2+0.224X3+0.203X4+0.2
16、11X5-0.262X6F2=0.831X1-0.075X2-0.019X3-0.174X4-0.138X5-0.329X6(1) 将原始变量 X1,X2,X3,X4 ,X5,X6,的值代人上式中,求得 F1,F2 值后,以 F1,F2 为自变量,男性肺活量参考值为因变量进行回归分析,得到如下回归方程: =3.247+0.000749F10.103(2) F=5.377,在显著性水平 =0.05下,查表得 F0.05(1,85-2-1)=4.00,则 FF0.05(3,68-2-1)。P=0.027=0.05,也说明该模型较显著。由(1),(2)两式可以最终代回为与海拔高度(X1),年日照时数
17、(X2) ,年平均气温(X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6 )的回归方程: =3.247+0.000 053 93X1-0.000 172 3X2+0.000 167 8X3+0.000 152 0X4+0.000 158 0X5-0.000 196 2X60.103(3) 如果知道了中国某地的海拔高度(X1),年日照时数(X2) ,年平均气温(X3) ,年平均相对湿度(X4),年降水量(X5)和气温年较差(X6)等地理因素,就可以估算出这一地区的男性肺活量参考值。例如:北京的海拔高度(X1)是 31.30 m,年日照时数(X2)是 2 763.70 h,年平均
18、气温(X3)是 12.30,年平均相对湿度(X4)是 57.00%,年降水量(X5) 是 571.90 mm,气温年较差(X6)是 30.80,则北京的老年男性肺活量参考值为(2.8680.103 )L 。2.3 绘制肺活量参考值范围空间趋势图 为了准确揭示出中国老年男性肺活量正常参考值的地理分布规律,本文选取了全国 4 383个市县作为观测点,将各个观测点的海拔高度(X1),年日照时数(X2),年平均气温(X3),年平均相对湿度(X4),年降水量(X5)和气温年较差(X6)等 6 项指标代入回归方程,计算出这 4 383 个市县老年男性肺活量正常参考值的预测值,在已矢量化好的地图上准确定位这
19、些市县。应用 GIS 软件中的地统计分析模块( Geostatistical Analyst)进行克里格(Kriging)插值27,28。精确地拟合出中国老年男性肺活量正常参考值的空间分布规律图(图 2)。 由图 2 可以查出中国大部分地区中国老年男性肺活量正常参考值,位于同一等值线上的区域肺活量正常参考值相等,同一等值线附近的区域参考值范围相近,等值线越密的区域,表示肺活量正常参考值变化较快,反之变化缓慢。位于西南部和长江中下游以南地区等值线密度较密,大于中部和北部。表明西南部和长江中下游以南地区肺活量正常参考值变化较快,中部和北部较为缓慢。图 2 中国老年男性肺活量正常参考值空间趋势图(略
20、) 中国老年男性肺活量正常参考值的分布趋势为南高北低,青藏高原、昆仑山及川滇地区参考值范围在 3.100 L 以上,而中部大多数为2.9003.100 L 之间,长江中下游区大部分在 2.7002.900 L 之间。3 讨论 单相关系数可以看出,随着海拔高度,年日照时数和气温年较差的增加,中国老年男性肺活量参考值也在增加。随着年平均相对湿度,年平均气温,年降水量的增加,中国老年男性肺活量参考值反而在减小。年平均相对湿度是影响老年男性肺活量最主要的因素。 如果知道了中国某地的海拔高度、年日照时数、年平均气温、年平均相对湿度、年降水量、气温年较差等地理因素指标,就可以用建立的神经网络来估算这一地区的老年男性肺活量参考值。 以上述空间区域为研究对象,应用回归方程对 4 383个观测点的地理因素进行老年男性肺活量参考值预测,借助 GIS 软件,应用空间分析的方法,精确的插值出本地区老年男性肺活量参考值的空间趋势图。由图可以宏观的估计中国大部地区老年男性肺活量参考值,为该区域的临床诊断提供科学依据。【