1、1研究领域:劳动经济学 中国农村劳动力外出就业选择与人力资本状况相关性研究提要:本项研究依据的数据资料是 “中国人力资本投资与城乡就业相关性研究”课题组(国家社科基金课题)在2002年7月至2003年1月对全国16省市进行的问卷调查。在对数据进行分析的基础上,使用选用logistic 回归模型及Multinomial Logistic Regression估计模型,利用SPSS11. 5 统计软件,估计了中国农村劳动力不同就业阶段的外出就业行为与人力资本状况的相关性,并对估计结果进行了讨论,文章最后给出了相关的政策建议。关键词:人力资本 外出就业 logistic 模型 Multinomial
2、 Logistic Regression 模型Abstract: The data for this article is from the questionnaires which the research group got among 16 provinces of China from July in 2002 to January in 2003.Based on the analysis of the data, using Logistic Regression model and Multinomial Logistic Regression model, the author
3、 estimates the relativity between the out for employment of rural labors and their human capital conditions with SPSS11.5 software. Relative polices and suggestions are given after discussions on the estimated results. Key words: Human capital, Out for employment, Logistic Regression model, Multinom
4、ial Logistic Regression model1文献综述外出行为影响因素分析在对农村劳动力的外出就业选择的研究中,人们关注的重点,多是对影响农村劳动力外出的因素进行考察,一部分研究对外出就业的后果进行了考察。 “中国农村劳动力流动”课题组(1997)利用 1994 年四川省农调队有关资料,采用多因素分析模型,即因素分析法(factor analysis),对中国农村劳动力外出就业的决策行为及其影响因素进行了实证研究, 分别建立了农村劳动力外出就业的家庭决策模型和劳动力外出就业个人特征模型。在农村劳动力外出就业的家庭决策模型中,引入了 8 个变量,包括人均耕地面积,家庭劳动力,家庭外
5、出劳动力人数,乡镇企业从业人数,劳动力人均收入,家庭类型,村外出人数,村外出人员平均收入。在劳动力外出就业个人特征模型中,进一步引入了劳动力文化程度、年龄、婚姻状况、性别等 4 个变量。实证分析了在其它条件一定的情况下,影响家庭内部某一劳动力是否外出就业决策的因素,其中最重要的是劳动力素质;其次是外出就业的外部环境,这一结果表明,只要存在着城乡经济收入的不平衡,农村劳动力的流动就不可避免;第三是家庭的资源和经济条件,分析表明,劳动力在其家庭经济活动中,具有一定的分工差异,而这种分工的差异是家庭劳动力是否外出的一个重要影响因素。美国加州大学洛杉矶分校教授 Donald.J.Treiman 等人(
6、张照新,宋洪远,2002)将父母受教育程度因素加以考虑,运用 1996 年的一个样本容量为 6030 个中国成人的抽样调查数据,对农村劳动力流动的决定性因素和后果进行了研究。他们发现,对于男性来说,父母受教育程度越高,其离开农村的机会就越大。如果某个人的父亲从事非农工作,或者他自己是中共党员,或者曾经在军队服役,或者读过高中,尤其是大专以上,他离开农村获得城市户口的机会就会增加。英国牛津大学 JohnKnight 和诺丁汉大学宋丽娜(张照新,宋洪远,2002)强调了务工者在进入非农产业就业时受到的种种限制,如不充分的信息、风险2和交易成本以及需求方面的约束对农村劳动力外出决策的影响。而且通过对
7、邯郸 1000 多个农户和 700 多个民工的调查资料的研究发现社会网络(social-network)在劳动力外出方面所起的作用。与国外或城市移民不同,我国农村劳动力的外出决策更多的是建立在特定信息基础上。社会网络在潜在外出者获得特定就业信息方面有更为重要的作用。但是与通过官方组织的介绍获得就业机会相比,通过家庭成员或亲戚介绍工作,外出成本提高 2.5%;而通过朋友、同乡、或者从中介获取信息外出,外出成本要增加 4%。教育程度高的人有更多机会获得迁移地点的一般信息和特定信息。美国经济学家托达罗(迈克尔P托达罗,1992,中译本,第 243 页)曾提出了期望收入差额的概念。他将一般用于项目评估
8、上的“收益成本”分析法创造性地用于城乡人口迁移的个体决策分析上,提出城乡之间人口迁移的决策主要取决于城乡期望收入的差额。从而论述了预期收入对农村劳动力外出选择的影响。预期收入是按农村和城市工作之间的实际收入差别和一个新移民得到城市工作的可能性来衡量的。迁移决策是依赖于“预期的” ,而不是现实的城市农村的实际工资差额。托达罗模型的基本前提就是移民们考虑在农村和城市部门中他们能在各种劳动力市场获得就业的机会以及选择从迁移中使他们的预期收人最大化的机会。周其仁(1997)强调外部环境对于农民外出就业机会的巨大影响,认为农民的就业机会首先并不是由他们本人的就业意愿和劳动技能所能决定的。国家的经济发展策
9、略和经济体制选择,外生地决定着农民就业空间的容量,从而深刻地影响着普通劳动者及其家庭的经济命运。广大研究者提出的城市政府对农村劳动力的限制政策构成劳动力外出选择的外部环境因素,是影响劳动力外出就业选择的重要因素。这些因素包括首先是从经济上卡民工的脖子,对其征收各种税费,人为地提高其劳动力成本;其次,政府利用职业歧视政策,把民工排斥在某些行业之外;再就是政府利用行政手段其中最常见的是户籍的限制,以此加大农村劳动力的外出直接成本、降低收入、降低就业概率从而达到限制农村劳动力进城,以缓解城市就业压力。蔡昉将这些政策称之为“保护性就业”政策,而且认为城市政府用限制劳动力流入的方法企图实行保护性就业造成
10、巨大的效率损失,不仅限制了城乡劳动力的公平竞争,更导致用工企业的成本上升,利润下降,比如在上海,企业每年要替其所雇用的每名农民工交 890 元费用,约占民工工资的 20%(北京大学中国经济研究中心城市劳动力市场课题组,1998) ,更严重的甚至会导致劳动力的流动减少。谭文兵,黄凌翔(2002)等从城乡生态系统的比较中推出农村劳动力外出就业的行为选择。认为城市生态系统和农村生态系统内在各构成要素之间相互作用、相互依存,都存在一个比例适当的问题,人口过多,必然会在生态系统内部产生一种对过剩人口的排斥力。中国的现实是 70%的人口在农村,大大超出了目前农村经济、生活水平下的人口承载力,本文作者估计
11、1999 年中国农村劳动力的剩余规模为 13772.4 万人(侯风云,2004 中国农村劳动力剩余规模估计及外流规模影响因素的实证分析, 中国农村经济 ,第 3 期) ,这一规模占农村总人口的 15%左右,对农业生态系统构成了一种强大的压力,并不断地影响着农业生态系统的良性运转。而由于城市化的不断加速,城市建设的迅速发展,文化、交通、生活等设施不断完善,城市的人口承载力有不断提高的趋势,城市生态系统所受到的压力相对要小。因此无论是由于农业生态系统自身运行的规律性所产生的排斥力,还是人类所具有的追求更好生活环境的内在动力,都决定了农村剩余人口流向城市,这实际上也是人口城市化的生态学动力。在性别变
12、量对于劳动力外出就业的影响分析中,中国人口信息研究中心娄彬彬通过在安徽、四川两省的调查发现,外出妇女呈现低龄化倾向,29 岁以下的占近 90%;文化程度低,外出女性的受教育程度绝大多数为小学、初中文化,但与未外出女性相比,其文化程度相对要高;外出动因复杂,尽管初次外出的主要原因是为了获得较高3的经济收入,但也有很多女性外出是“为了增长才干”或“为了更好的前途”,还有一些女性外出是为了“逃避不幸的婚姻”或是“还债”。对于我国学者在分析农村劳动力外出动机时,往往用“家庭策略”来解释性别差异的现象。蔡昉(1997)讨论了迁移距离对外出就业选择的影响。在济南市打工的外地劳动力中,外省流入的只占 6.7
13、%,而且这部分人只有 30.4%事先找好了工作,较之本省流动劳动力低了 43.6 个百分点。美国的一项研究表明,美国国内地区的迁移距离每增加 1 英里所造成的迁移成本,需要 5 美元的预期收入差别才能予以补偿。另一项研究(MamermeshandRess,1993)也十分有趣 ,在其他因素不变的条件下,对一个想要迁移到瑞典的北欧国家居民来说,到迁移目的地的距离每增加 1 倍,他选择迁移到该地区的可能性就降低 50%。该研究表明,在劳动力市场上,对于寻找合适的就业机会者来说,谁的人力资本和社会资源更具有优势,谁获得的机会越多,谁选择的范围就越广泛,从而最可能突破距离的障碍。这里的所谓人力资本和社
14、会资源主要包括获取和理解信息的能力,更为广泛的社会关系,较强的承担风险能力,以及对于各种职业的适应性等。赵耀辉(1997)在讨论教育在中国农村劳动力流动中的作用时,涉及到了家庭拥有的耕地面积、教育和家庭中学龄前儿童的数量对劳动力流动的影响,土地拥有量对外出的影响在统计上是显著的。土地比较少的家庭劳动力外出概率比较大。如果把家庭人均占有耕地减少一亩,该户劳动力外出的概率就增加4 .6个百分点。因为土地是影响家庭农业收入的重要因素,减少土地对外出的影响应该来自农业的预期收入的降低。文化程度对外出的影响很小,这是出乎意料之外的。同没有受过正规教育的人相比,受过小学和初中教育的人的外出概率比较高,但是
15、高出不多(分别为2 0%和2 4%,5% 的显著度)。高中文化程度的人与没上过学的相比,外出的概率差不多(差别在统计上不显著) 。我们在对农村劳动力素质对外出流动的解释中发现,初中毕业生人数与外出规模正相关,但相关系数不大,仅为0.254,而高中毕业生人数则与外出打工规模呈负相关(侯风云,2004中国农村劳动力剩余规模估计及外流规模影响因素的实证分析, 中国农村经济 ,第3期) 。赵耀辉的数据显示,家庭中学龄前儿童的数量对外出的影响不显著。这可能是由于儿童的祖父母帮助抚养的原因。住户访谈的资料显示,儿童的父亲一般不会因为家里有年幼的孩子而放弃外出,如果家里有老人帮助,很多母亲也不会因为孩子而不
16、外出。父母亲把孩子带出去的情况虽然有,但是不普遍。另外,蔡昉(1997)曾就济南市的抽样调查对农民工的就业理性行为进行过探讨,进一步论证了组织化程度对农村劳动力外出选择的影响,认为农民工的社会资源对于外出找工作具有重要作用。李实(2001)利用1996年山西省10个村的调查数据对农村妇女劳动力的外出打工行为进行了经验分析。结果证实在影响女性劳动力外出打工的因素中,年龄是一个主要的解释因素,农村妇女外出打工者大多是年轻人。同时,文化程度也是不可忽视的因素,因为较高的文化程度更加有助于增加她们的外出打工机会。 谭深(张照新,宋洪远,2002)通过分析女性外出的动机以及在不同家庭的角色期待的差异,对
17、于“家庭策略”和“家庭成员利益一致性”假设和判断提出了质疑。她通过对四川省和湖南省 200 位回流人员的访谈发现,有 2/3 的外出劳动力第一次外出的动机是为了自己,性别之间没有差异。但在外出是否得到家庭的支持问题上,不被支持的主要是女性。也就是说,女性的个人独立意识在外出动机中占有相当大的比重,这至少对“家庭策略”的判断提出了质疑。对于“家庭成员利益一致性”假设,谭深认为,家庭女性的角色期待取决于家庭的经济状况和家庭成员之间的感情联系。当两者处于最佳状态时,父母往往从女儿的角度考虑。但如果感情联系较好而家庭经4济状况不好时,女儿就要为家庭作出“牺牲”;如果感情联系不好,外出就成为逃避的借口。
18、女性一旦结婚,她的角色和责任就基本定型,丈夫对她外出的支持几乎完全是从家庭考虑的,女性外出的动机中为自己的成分也就大大下降。如果女性还存在为自己的动机,就会引发家庭冲突。因此“家庭成员利益高度一致”的假设可能被推翻。国家统计局农村社会经济调查总队社区处(2000)的资料显示,农村劳动力外出就业的性别和年龄变量特征为,农村剩余劳动力转移仍以男性、轻壮年劳动力为主。在1999年转移的农村剩余劳动力中,男劳动力所占比重达67 .1%;18岁以下的比重为5. 5%,18 40岁的比重为 77. 4%,40岁以上的比重为16. 8%。劳动力的文化素质特征为,当年转移农村劳动力的文化素质又有提高,而且流动
19、劳动力文化素质的高低与流向地的发达程度成正比。1999年转移的农村剩余劳动力中,文盲或半文盲占1. 6%,与上年持平;小学程度占19. 1%,比上年下降1 .5个百分点;初中文化程度的占62 .9%,比上年下降1.1个百分点;高中及高中以上文化程度的已经达到16. 4%,比上年增加0 .4个百分点;受过专业技能培训的占28. 2%,比上年略有减少。阳俊雄(1998)考察了农村转移劳动力的人力资本状况及转移劳动力的人力资本状况对就业结构的影响:(1)转移劳动力以男劳力、整劳力为主。在当年由农业向非农行业上转移的劳动力中,男劳动力占70.2%,女劳动力仅占29.8%;整劳动力占94.5%,半劳动力
20、占5.5% ,说明农村劳动力向非农行业转移仍然具有明显的体力型特征。 ()转移劳动力的文化素质高于平均水平。调查资料表明,当年转移劳动力的文化程度指数为8.72年,比农村劳动力的文化程度指数高0.55年。从具有不同文化程度的劳动力分布来看,在转移劳动力中,文盲或半文盲仅占2.4% ,小学文化程度占25.2%,初中文化程度占57.1%,高中文化程度占14.3%,中专程度及以上占 1.0%,具有初中以上文化程度的劳动力占 72.4%,转移劳动力明显具有较高文化素质。 ()转移劳动力中有较多人受过专业培训。在当年转移的劳动力中,接受过专业培训的劳动力占25.5%,比农村中受过专业培训的劳动力所占比重
21、高10个百分点。具备小学以上文化水平对转移劳动力的就业产生重大影响。转移劳动力的文化程度是否小学毕业对劳动力就业产生很大影响,就业结构差异较大。当转移劳动力文化程度在小学以下时,他们的就业受到一定的限制,当劳动力文化程度在小学以上时,不同文化程度指数分组的劳动力就业结构基本相似,说明转移劳动力比较能够适应各个行业对劳动力文化程度的需求,劳动力就业选择的空间较大。就转移到不同行业中的劳动力文化状况进行了分析。从按劳动力文化程度分组的转移劳动力的行业分布情况看,转移到工业行业的劳动力一般需具备小学以上文化程度;建筑业较易接纳低文化素质的劳动力;低文化素质劳动力较易进入交通运输邮电业和社会服务业;转
22、移到商业饮食业的劳动力具有一定的文化水平。从回流状况上看,国家统计局农村社会经济调查总队社区处(2000)资料显示出,近几年,农村劳动力在流动过程中返回的比重逐年降低,由1996年的1. 6%下降为1999年的0 .5% ,如果扣除返回到本地仍然从事二三产业部分,返回劳动力的比重则更低。返回的比例降低,说明转移劳动力的目的性增强,稳定性提高。刘建进(张照新,宋洪远,2002)通过国家统计局抽样调查数据发现,2000年外出劳动力回流仅为转移劳动力的2.31%,比1999年的2.44%又有所下降。受过专业培训劳动力的回流比例低于未受专业培训劳动力的回流比例。这可能意味着回流劳动力的主体不是为了回乡
23、创业主动回流的,而更多是被迫或失业而回流的。外出就业后接受过专门的培训对于农村劳动力长期在外就业起着重要的影响。以上我们就中国农村劳动力流动的影响因素进行文献总结。一方面研究者对一个因素或多个因素,使用不同的方法对影响中国农村劳动力就业的因素进行了考察;另一方面对5农村外出劳动力的人力资本状况的一个因素或多个因素进行了考察。从文献部分看,大部分研究没有将劳动力的外出就业行为当作一个过程,一个连续的过程来研究。而且有些研究 “大多停留在对农村劳动力外出意向和外出原因的直接询问和分析上,没有根据农户及劳动力所拥有的客观经济和社会条件对外出就业的影响进行实证分析” (“中国农村劳动力流动”课题组,1
24、997) 。我们认为,农村劳动力的外出就业选择包括两个阶段:第一阶段,农村劳动力的第一次就业选择即在外出就业与在家就业之间选择。第二阶段,农村劳动力的第二次就业选择,该阶段分为两个方面:一是农村劳动力中没有外出的劳动力进一步的就业意愿即外出意愿,是外出还是继续留在当地就业?二是已经在外工作的劳动力的回家就业意愿:是留下来还是回家?在以往的文献中,我们发现对第一阶段关注的较多,而对第二阶段的研究则关注较少。在第一方面的分析中,多是就已经外出的劳动力与不外出的劳动力选择行为进行分析,由于许多尚未外出但有外出意愿的劳动力已经构成了农村潜在剩余劳动力,因此分析这一部分劳动力可能的外出意愿的影响因素对于
25、进一步了解农村劳动力的就业行为具有重要意义。关于第二阶段,外出劳动力的回流已经构成了农村劳动力就业行为的一个重要组成部分,需要加以关注。我们在本文的研究中,将对这两个阶段分别考察。考察涉及的因变量是中国农村劳动力就业行为,在这里我们不只是考察影响农村劳动力外出选择的因素,而且从各个角度全面考察农村劳动力的外出就业行为包括外出行为,外出就业区域选择、外出意愿、外出后的进一步就业选择等,在同一项研究中从不同角度对中国农村劳动力的就业行为进行实证分析。在该项研究中,考察所涉及的自变量是人力资本各要素和其它特征变量。在这些自变量中,有些变量与文献中涉及的变量相同,例如教育水平、工龄、性别、婚姻状况等,
26、但有些变量则有明显差异,如培训状况、健康状况、劳均耕地面积、是否家庭中的最主要劳动力、家庭中是否有外出劳动力等。我们的研究重点在于考察农村劳动力的人力资本状况对于外出就业行为的影响,因此不论在哪一过程的就业选择都要综合考察人力资本各要素对就业行为的影响,而对于其它影响因素,则视本项研究在不同方面的侧重点而有所区别。本项研究主要着眼于在现行制度下的劳动力个人特征变量,而对于其它环境变量则关注较少。2数据分析在本节中我们专门就农村人力资本状况对于农村劳动力外出就业行为的影响进行研究,使用的数据分为三部分:第一部分数据取自“农村劳动力外出打工意愿调查”,调查对象是现在仍在农村就业的劳动力,主要考察该
27、部分劳动力外出就业意愿的影响因素,即研究他们外出打工的意愿与相关的人力资本状况的关系;第二部分数据主要由以下两项调查数据合并而成,一是“农村劳动力外出打工意愿调查”,二是“农村劳动力外出就业收益与人力资本状况调查”,后者的调查对象是已经外出(乡外)就业的劳动力,在这里,将第一部分数据的所有样本当作未选择外出就业的样本,将第二部分数据的所有样本当作选择外出就业的样本,将二者放在一起,一是考察外出与否与人力资本状况及相关变量的关系;二是考察外出(包括意愿外出)的区域选择与人力资本及其它相关变量的关系;第三部分数据来源于“农村劳动力外出就业收益与人力资本状况调查”考察已经选择外出劳动力的进一步就业选
28、择:是留在城市还是回农村就业,侧重于考察外出农村劳动力的进一步就业选择与人力资本状况及某些制度性因素的相关性。该研究所需的全部数据均来自课题组在2002年7月至2003年1月对全国15个省市自治区进行的典型调研,样本范围既有沿海发达地区,也有内地较不发达的地区,样本分布较多的省份为山东省,江西省,河北省,甘肃省,河南省,浙江省,四川省,重庆市等。 6在该项研究中,第一部分数据取自题目为“农村劳动力外出打工意愿调查”的样本,该项调查的对象是仍在农村从业的劳动力,收回有效样本4858个,调查涉及的就业选择变量为是否愿意外出打工(外出意愿)、外出打工选择的区域、外出的目的、外出打工愿意接受的收入、未
29、外出的原因;影响变量既涉及有关人力资本变量,如年龄、教育年限、健康状况、培训状况等,同时也涉及了其它的可能引起劳动力外出就业选择的其它因素,如性别、婚姻状况、家庭劳动力数量、家庭已经外出劳动力数量、本人在家庭中是否为主力、本人在家庭中的位置(是父亲、母亲还是子女)、劳动均耕地面积、当地年收入(务农收入和其它收入)、农闲时间等。相关变量说明及样本分布情况见表2-1表 2-1: “农村劳动力外出打工意愿调查”具体变量说明及样本分布: 变量 定义 编码 % 样本数一、就业选择变量:是否愿意外出:否 0 30.83% 1498是 1 69.17% 3360愿意外出的区域:乡外县内 0 29.6% 14
30、38省内县外 1 28.94% 1406省外 2 41.46% 2014外出的目的:收入 1 55.93% 2717改变生活方式 2 16.28% 791进一步发展 3 18.46% 897其它 4 5.48% 266复杂目的 5 3.85% 187外出愿意接受的月收入: 200-500 元 1 24.38% 1118501-1000 元 2 59.21% 27151001-1500 元 3 10.88% 4991501-2000 元 4 16.30% 526未外出的原因:没机会 1 31.00% 1506不了解而担心 2 12.06% 586收入低 3 6.30% 306家庭牵挂 4 20.
31、71% 1006没人种地 5 6.96% 338怕被城里人歧视 6 1.30% 63以上复杂原因(两个原因及以上) 7 10.77% 523其它原因 7 7.96% 530二、人力资本变量:年龄:16-34 岁 1 61.40% 298335-49 岁 2 30.51% 148250 岁以上 3 8.09% 3937教育水平:小学及以下 0 21.59% 1049初中 1 57.88% 2812高中及以上 2 26.53% 997技能培训:是否接受过某种专业技能培训没有 0 69.60% 3381接受 1 30.40% 1477培训内容:农业科技 1 20.51% 303法制 2 2.98%
32、44扫盲 3 0 0工业技能 4 21.51% 303就业技能 5 42.32% 625其它 6 6.03% 89两种以上培训 0 7.65% 113健康状况:很好 3 64.18% 3118一般 2 32.26% 1567较差 1 3.29% 160经常生病 0 0.27% 13三、其它相关变量:性别:女性 0 20.85% 1013男性 1 79.15% 3845婚姻状况:未婚 0 42.88% 2083已婚 1 57.12% 2775家庭中是否有外出劳动力:没有 0 42.14% 2047有 1 57.86% 2818是否主力:否 0 17.91% 870是 1 82.08% 3988劳
33、均耕地面积:1 亩以下 1 29.11% 14141-3 亩 2 55.25% 26843 亩以上 3 15.64% 760农闲时间:10 天以下 1 0.80% 3911-50 天 2 7.16% 34851-100 天 3 18.16% 882100-150 天 4 65.40% 31778151-200 天以上 5 8.48% 412当地年收入(指每一劳动力年末务农收入和其它收入):200-2999 元 0 42.05% 20433000-5999 元 1 31.45% 15286000 元以上 2 18.71% 909其余缺省值 3 7.78% 378在“农村劳动力外出打工意愿调查”中
34、,我们发现,大量的农村劳动力虽然没有外出行为,但69%的劳动力还是愿意选择外出就业,说明农村存在着大量的潜在剩余劳动力,而且从意愿外出的目的看,55.93%的劳动力选择外出是为了增加收入,这说明用收入差额做为衡量农村劳动力的剩余程度是有现实依据的(侯风云,2004c)。如果外出打工,近60%的农村劳动力愿意选择在省内就业,选择外出到省外的就业比例为41%。从被调查者接受培训的状况看,接受过培训的劳动力仅为30.40%,近70%的劳动力没有接受过技能培训,可见农村劳动力的技能培训状况不佳。但是从农村劳动力的“农闲时间”看,70%以上的劳动力农闲时间在 100天以上,可见,大量外出劳动力如果没有在
35、农业外做工,则可能在一年有大量空闲。如果在这些空闲时间中进行专业技能培训,不仅会增进他们的人力资本存量,而且会提升原有的人力资本,因为人力资本的一个重要特性是在使用中升值,在闲置中贬值。在这些未外出的劳动力中,绝大部分是家庭收入的主力,但由于他们没有机会到外面(30%样本) 以及不了解外面的情况而担心外出会有风险(12%样本) ,所以不能外出赚取更高的收入,这可能会影响农民收入的提高。在该项调查中,82% 的样本是家庭的主力,年收入在 3000元以下的样本高达42% ,证明农村劳动力在家收入严重偏低,而且没有外出机会,大量的家庭主要劳动力滞留家中, “享受清闲” 。本项研究中使用的第二部分数据
36、取自第一部分数据与第三部分数据之和,即将第一部分数据中的有关变量和第三部分数据(农村外出劳动力收益与人力资本状况调查)中的有关变量进行合并,主要考察相关变量对外出与否及外出区域选择的影响。关于第一部分数据的情况我们已给出,第三部分数据的基本情况已在“农村劳动力外出就业收入与人力资本状况相关性研究”(参见侯风云,2004a)中给出,因此在这里,第二部分数据和第三部分数据我们不再做总结和分析。另外相关数据的一些说明在 “中国农村劳动力收入与人力资本状况相关性研究”中也做过相应的叙述(参见侯风云,2004b)。3 变量选择、模型设定及估计结果Kangqing Zhang 和Don DeVoretz(
37、2002)在“人力资本投资和流动:一个中国的多阶段模型。 ”中构建了一个中国劳动力流动的多阶段复合模型,提出了一个人力资本从出生国向外流动的复合模型,介绍了人力资本不同阶段的流动选择行为。我们依据这一复合模型构成,结合中国农村劳动力的就业选择行为和过程,对农村劳动力的就业行为进行具体考察,得出以下阶段的就业选择过程。而且在不同阶段,我们给予关注的重点不同:第一阶段,农村劳动力选择外出就业,还是在家就业;对于事实外出和意愿外出劳动力,则选择就业区域。第二阶段,对于选择在家的农村劳动力的进一步选择是继续留在家中,还是准备外出;对于已经外出劳动力的进一步选择是回乡还是留下。我们依据理论及相关的经验判
38、断,对各变量之间的关系做以下两层次假设:第一层次假设:(1)外出打工比在农村就业有更高的收益;9(2)在外打工比在农村就业需要有更高的成本和训练费用;(3)在外打工比在农村就业更容易使个体人力资本存量增加。第二层次假设:(1) 婚姻状况对于劳动力的外出行为有很大影响,结婚使外出就业的概率下降;(2) 年龄对于劳动力外出就业的影响很大,年龄越小,外出概率越大;(3) 教育对于外出就业的影响是正的,教育水平越高,越容易选择外出就业;(4) 劳均耕地越多,越不易选择外出就业;(5) 外出前如果接受技能培训,可能的外出概率就大;(6) 身体健康状况好的劳动力,外出概率大;(7) 在家收入多,外出概率小
39、,回乡可能性增大;(8) 外出收入多,则回乡就业概率小。模型的使用依据于我们所要估计的问题的性质。本章所讨论的是具有二分类和多分类因变量的模型,因此我们将采用logistic回归模型进行估计。不同阶段所估计的内容和涉及的变量不同,因此需要针对不同阶段的性质进行模型和变量的设计,并对此进行估计。3.1 第一时期就业选择:模型设定及影响因素估计第一时期的就业选择行为包括两个方面的内容,一是外出与否;二是外出意愿和外出事实中的区域选择。就第一方面而言,主要对影响农村劳动力外出与否的因素进行考察,所需要估计的内容包括人力资本状况对外出就业选择(外出就业与否)的影响以及其它相关变量对外出就业选择的影响。
40、在这里我们选用logistic 回归模型进行估计。logistic 回归模型探索影响因变量的因素,研究在某一定条件下个体呈现某种状态的概率;比较在不同自变量取值组合下个体呈现某种状态的相对可能性等(田考聪,曾庆,王润华等 1995)。从我们所估计内容的性质看,因变量是一个二元选择变量,即“外出”还是“不外出”,自变量则是人力资本各要素及其它相关变量,因此可以使用logistic回归模型进行估计。通过对各种要素的分类和筛选,引入影响农村劳动力外出还是不外出的因素分为人力资本变量,包括教育年限、工龄、身体健康状况、培训状况;个人特征变量,包括性别和婚姻状况;其它相关变量,劳均耕地、在家收入。模型的
41、具体形式及相关的估计变量如下: (1)iiii iiiiiiii uLncMXTrDESP 1098 7635241320l1ln 表3-1 模型(1) 变量说明i农村劳动力外出就业的概率iS样本的受教育年限(年)iE样本的工作年限(年)iTr如果样本接受过培训,则为1,否则为0。10iX如果是男性则为1,否则为0。iM如果样本处于已婚,则为1,未婚,则为0。incl在家一年农业收入和其它收入总和的对数值(元)iL样本拥有的劳均耕地面Logistic回归是一种针对定性数据的分析方法,因此需要对连续型变量和多分类变量进行特殊处理。在本项研究中,教育年限、工龄、收入及劳均耕地面积等都是连续型变量,
42、但我们的分析样本量很大,因此使用连续型变量一般不会出现空单元(Zero Cell Count)和过离散(Over-dispersion)等问题,也不会导致估计系数的标准误过大问题,并且优点在于不会损失统计信息。所以我们没有对连续变量进行特殊处理,而是以原始数据进入。身体健康状况是多分类变量,因此需要对数据进行处理。在这里我们对身体健康状况进行离差编码 (indicator coding)引入虚拟变量。其中身体健康状况分为:很好、一般、较差、经常生病,这是一个四分变量,对此引入3个虚拟变量,并进行离差编码。表3-2 身体健康状况的离差编码身体健康状况 D 1 D2 D3很好 1 0 0一般 0
43、1 0较差 0 0 1经常生病 0 0 0我们将“农村劳动力外出就业收益与人力资本状况调查”和“农村劳动力外出打工意愿调查”两部分数据进行合并作为我们估计模型(8.1)的样本基础。前一部分数据代表选择外出的农村劳动力样本,后一部分数据代表不选择外出的农村劳动力样本。我们使用SPSS11.5软件进行估计,其中logistic模型是用极大似然估计法进行估计的。我们默认强迫引入法(Enter),即所有自变量强制进入回归方程, 模型(1)估计结果为:(2)123ln7.280.-.240.75-.48-.09-.76-0.85+0.5-ln+6i iiiiiiiiiiPSEDTrXMcL下面将通过模型
44、 检验和Cox & Snell R Square 以及Nagelkerke R Square来检验样本方2程(2)的显著性及拟合的优劣。表3-3 模型系数的综合检验(Omnibus Tests of Model Coefficients)Chi-square df Sig.Step 1185.906 10 .000Block 1185.906 10 .000Step 1Model 1185.906 10 .000模型 检验是回归模型的显著性检验。目的检验是全体自变量与因变量的线性关系是否显著,是否2可以用线性模型拟合。零假设H 0是各系数同时为零,全体自变量与因变量的线性关系不显著。在该项检验
45、11中,模型 值显著性概率为0(Sig)远远小于5%的显著性水平(参见表3-2,则应拒绝零假设。因此该2模型中的所有回归系数不同时为零,全体自变量与因变量的线性关系显著。表3-4 模型总体参数表(Model Summary)Step-2 Log likelihoodCox & Snell R SquareNagelkerke R Square1 6606.322 .163 .236Cox & Snell R Square 以及Nagelkerke R Square检验是回归方程的拟合优度检验。Cox & Snell R Square与一般线性回归分析中的R 2有相似之处,也是方程对被解释变量变差解释程度的反映。Nagelkerke R Square是修正的Cox & Snell R Square,也反映了方程对被解释变量变差解释的程度。一般情况是,Nagelkerke R Square的取值范围在0-1之间,越接近于1,说明方程的拟合度越高。越接近于零,说明方程的拟合优度太低,但由于本项研究是大样本,一般情况下,该值都偏小,本结果(参见表3-3)已经相当不错。表3-5 回归系数及显著性检验用表B S.E. Wald df Sig. Exp(B) 95.0% C.I.for EXP(B)Lower U