内容摘要:本研究采用中国健康与营养调查1989-2009年的追踪数据,使用多层线性交互分类模型估计了全国教育收益率的总体变化趋势,并通过引入宏观经济发展指标来考察教育收益率变化的影响因素。结果表明,21世纪以来全国教育收益率并没有延续以往快速稳定增长的势头,中国市场转型过程中的制度变革和经济结构变化对教育收益率的变动都有显著影响。由于我国城乡分割的二元经济结构,本研究还比较了城镇和农村地区教育收益率变动趋势的差异,农村地区教育收益率先高后低反映了我国先农村后城市的改革开放进程。
关键词:教育收益率;趋势分析;追踪数据
作者简介:
内容提要:本研究采用中国健康与营养调查1989-2009年的追踪数据,使用多层线性交互分类模型估计了全国教育收益率的总体变化趋势,并通过引入宏观经济发展指标来考察教育收益率变化的影响因素。结果表明,21世纪以来全国教育收益率并没有延续以往快速稳定增长的势头,中国市场转型过程中的制度变革和经济结构变化对教育收益率的变动都有显著影响。由于我国城乡分割的二元经济结构,本研究还比较了城镇和农村地区教育收益率变动趋势的差异,农村地区教育收益率先高后低反映了我国先农村后城市的改革开放进程。
关 键 词:教育收益率 趋势分析 追踪数据
作者简介:邓峰(1980- ),男,山东省荣成市人,北京理工大学教育研究院讲师,研究方向为教育政策的量化分析;丁小浩(1959- ),女,北京市人,北京大学教育经济研究所教授,博士生导师,研究方向为教育经济学。
教育与收入的关系始终是教育经济研究领域内的关注热点。个人收入因受教育水平的提高而获得增加的部分被用来反映教育的个人经济收益。教育收益率的估计与度量对研究教育对经济的贡献、个体教育投资决策行为、教育资源分配等诸多问题都具有重要意义。对正处于经济体制改革和社会变迁的中国来说,教育收益率的变化还可以作为判断劳动力市场建设和经济转型程度的一个重要指标。要对中国教育收益率长期变动趋势进行准确描述,需要高质量、有全国代表性、长期相同变量的数据,并在此基础上分析教育收益率随时间变化的内在机制。追踪研究的设计是考察教育收益率变化趋势及其影响因素的有效工具。“中国健康与营养调查”(China Health and Nutrition Survey, CHNS)可以提供1989-2009年间8个年份的城乡居民收入追踪数据,时间跨度达20年,具有较好的连续性,且调查范围较广,样本量较大,能基本满足对教育收益率趋势研究的需要。本研究通过使用多层线性交互分类模型来充分利用CHNS这一追踪数据所提供的个体和年份两个维度的丰富信息,从而对我国20年来教育收益率的变动趋势及其原因做出很好的解释。
一、文献综述
在中国社会,劳动者的受教育水平与个人收入之间的关系较为复杂,不同年代的教育收益率差异很大。随着中国各级教育规模经历了引人瞩目的快速扩张,进一步考察教育收益率随时间变化的趋势具有重要的学术和政策意义。
(一)教育收益率的变动趋势
1.城镇居民教育收益率的变动趋势
我国学者对于教育收益率的研究从20世纪80年代末开始,大部分文献集中在对城镇私人教育收益率的研究上。利用“中国家庭收入调查(CHIP)”数据的分析结果表明,中国城镇居民的教育收益率从1988年的3.8%(李实、李文彬,1994),1995年的5.73%(赖德胜,1998),上升到2002年的11.4%(李春玲,2003)。使用国家统计局城调队数据的研究表明,教育的明瑟收益率从1991年的2.95%,1995年的4.66%,2000年的8.53%(陈晓宇等,2003),升至2004年的10.46%(王明进、岳昌君,2009)。李实、丁赛(2003)利用中国社会科学院收入分配课题组和城镇贫困研究课题组开展的两次住户抽样调查,发现城镇居民的教育收益率从1990年的2.43%,1995年的4.81%,上升到1999年的8.1%[1]。张俊森等(Zhang et al., 2005)利用全国六省市1988-2001年的连续数据,发现城镇教育收益率从1988年的4.0%,1995年的6.7%,1998年的8.1%,上升到了2001年的10.2%[2]。
丁小浩等(2012)利用国家统计局2002年、2004年、2006年、2008年和2009年城镇住户调查数据对我国城镇教育收益率变化趋势进行了分析,研究发现,近年来中国城镇教育收益率的变化没有延续1990年代初至2000年间的快速上升趋势,而是逐渐趋于平稳。在控制了行业、单位类型、地区等变量以后,城镇教育收益率变化的趋势还出现了某种下降的迹象[3]。
2.城乡划分与城乡教育收益率的比较
仅仅用城镇居民的教育收益率代表中国的教育收益率进行国际对比,不符合中国农村人口比例大的基本国情。中国存在着复杂的城乡二元结构,传统的城乡二元结构包括城乡二元经济结构和城乡二元社会结构两个方面,因此以往教育收益率研究中对于城乡样本的划分也存在相应不同的取向,第一类研究依据样本的居住地来划分城乡,关注的是城乡二元经济结构下农村地区常住人口的教育收益率。第二类研究依据户籍状态作为城乡划分的基础,关注的是城乡二元社会结构下农业户籍人口的教育收益率,而不管其在城镇还是农村工作。
1958年《中华人民共和国户口登记条例》的通过标志着城乡二元的户籍制度正式确立,严格的户籍制度限制了农村居民迁入城市,此时农村地区常住人口和农业户籍人口这两个群体是高度重合的。改革开放后,由于城镇化的推进以及户籍制度改革的滞后,“人户分离”的情况越来越普遍。国家统计局提供的城镇化率指标的城乡划分依据的是居住地,2009年我国的城镇化率为46.6%。据《中国流动人口发展状况报告》提供的信息,2009年中国流动人口已达到2.11亿,其中78.7%为农业户口。换言之,当年中国城镇常住人口中包含有1.66亿左右具有农业户籍的进城务工人员。按照居住地和按照户籍状态划分城乡所得的样本会存在较大的差异,因而农村地区常住人口的教育收益率和农业户籍人口的教育收益率的大小可能并不一致。以按照户籍划分的城乡教育收益率为例,基于CHIP项目的数据表明,城镇户籍人口的教育收益率从1988年3.8%提高到2002年的11.4%,而农业户籍人口的教育率则只从2.5%提高到4.3%,城镇人口和农业人口之间教育收益率的差距随时间扩大的趋势非常明显(李实、李文彬,1994;李春玲,2003)。与之相对的是,依照劳动者居住地划分的城镇地区和农村地区教育收率却表现出了不同的变动趋势。Johnson & Chow(1997)利用CHIP项目1988年的数据发现,中国农村地区的教育收益率大约为4.02%,城镇地区大约为3.29%,农村地区的教育收益率要高于城镇地区[4]。如果将其他对中国农村地区教育收益率的研究结果做一个粗略的罗列,1991年、1996年、2004年、2005年农村地区的教育收益率分别为4.8%(Wei et al., 1999)、6.3%(赵力涛,2006)、7.5%(国务院发展研究中心农村经济研究部,2007)和8.2%(娄世艳,2009)。
以往一些研究者(梁润,2011)在使用CHNS数据分析按居住地划分的城乡教育收益率的差异时,将工资性收入作为衡量城乡居民收入的统一指标,研究显示农村地区教育收益率较低[5]。在中国农村地区就业人口的多数是从事家庭生产性劳动的,他们的人均收入比工薪阶层往往低得多,而且许多收入是实物性的(丁小浩,1998)[6]。把从事农业产业的个体排除在外而用少部分在正规部门工作的人所得到的工资收入作为分析样本的研究将使得计算出来的农村地区教育收益率受抽样偏差的影响。陈玉宇等(2004)使用CHNS数据发现教育在农村工业部门中对工资收入的影响不显著。研究者认为在农业部门和工业部门之间的收入水平存在着显著差异的情况下,农村地区受教育程度高的劳动者可以从低收入的农业部门往高收入的非农业部门流动可能是农村地区教育回报的主要来源[7]。也就是说,农村地区教育对收入增长的作用主要通过配置作用来实现,基于工资性收入的农村地区教育收益率较低只是说明农村地区非农部门中劳动分工的细化程度不及城镇地区,教育对收入增长的作用较弱。
(二)教育收益率变动的原因
教育收益率的变化机制也备受关注,大多数研究者都认同从计划到市场的经济转型是主要动力,但对如何理解和测量市场转型存在两种不同的取向,其中之一强调转型的制度方面。20世纪80年代末, Nee(1989)结合对东欧转轨国家的研究提出了市场转型理论[8]。从“再分配经济”到“市场经济”的转型过程中,私营和混合经济等非国有部门与企业会不断壮大,经济活动逐渐通过市场机制调节,政府的控制则逐渐弱化。再分配经济偏重于奖励政治资本,而市场经济则偏重于奖励人力资本,因此非国有部门内的教育收益率一般高于国有部门。随着非国有部门的不断扩大,一个合理的推论就是教育收益率会上升。20世纪90年代中东欧国家经过10年的经济转轨后,教育收益率从2%~4%上升到10%左右。在我国从计划经济向市场经济转型的过程中,魏新等(Wei et al.,1999)的研究结果也支持了市场化改革程度越深的地区收益率越高,教育与收入的关系越强的假设[9]。
市场转型既是一个制度不断变化的过程,也是一个经济增长的过程,另外一个取向强调经济发展和经济结构转型对教育收益率变动的影响。中国经济正处在一个由农业占主导的经济向工业和服务业占主导的经济过渡的过程中,这种经济结构的变化会对教育收益率产生影响。经济发展会创造新的具有较高收入的非农就业机会,而受过更高教育的人一般能够更好地获得这些就业机会,这就导致了教育收益率的升高。Meng(1995)的研究认为,随着经济的不断发展和技术变革,教育在促进生产力方面的作用会越来越明显,因而决定工资差异方面的作用也越来越大[10]。对于我国农村教育收益变动的原因,以往研究也大多从农村经济结构转型的角度进行解释。农村地区教育收益率的提高需要一定的结构条件,这就是非农经济的发展。农民收入提高的主要原因在于工资性收入的获得,而工资性收入的获得又与非农就业机会有关,这种非农就业机会的大小取决于农民的教育状况(邹薇等,2006)[11]。
综合以往的研究可知,单纯的城镇教育收益率或者农村教育收益率都无法很好地反映全国的整体情况;而关于城镇和农村地区教育收益率变化趋势的比较研究则更加鲜见。本研究实证分析的主要目的包括:用城乡的混合样本估计全国教育收益率的总体情况并分析其变化趋势;根据《中国统计年鉴》提供的数据建构一系列衡量中国市场转型过程中制度变化和经济结构变化的指标,并考察这些指标如何影响教育收益率的变动;按照居住地分别估计农村地区和城镇地区教育收益率并比较其变化趋势。
二、数据和变量
本研究使用了中国健康与营养调查(CHNS)成人调查问卷中个人基本特征、就业特征、个人收入状况等信息。CHNS调查于1989年、1991年、1993年、1997年、2000年、2004年、2006年、2009年共进行了8轮数据收集,采用多阶段整群随机抽样方法,调查范围包括辽宁、江苏、山东、河南、湖北、湖南、广西、贵州、黑龙江共计9个省区。本研究所用的数据是卡罗莱纳人口中心于2011年初发布的经过整合的1989-2009年的追踪数据。
国家统计局在2013年以前是分别进行城乡住户调查的,农村居民纯收入和城镇居民可支配收入的指标含义和形态构成上都有较大差异,城乡居民收入统计口径的不一致会对城乡教育收益率的比较产生一定影响。本研究尝试将城乡居民的收入指标进行统一处理。本研究的主要目的是考察教育通过配置效应和生产效应对增加个体收入的作用,因此收入构成并不包括转移性收入和财产性收入,如健康、独生子女补助、食物补助,以及礼物、租金收入等。考虑到中国农村地区个人收入来源的多样性,本研究的收入指标包括工资性收入以及务农、经商等劳动经营性收入,具体的个人收入变量包括:非退休工资性收入、家庭果菜园收入、家庭农业收入、家庭养殖收入、家庭渔业收入、小商业收入。由于农村地区的务农或务工的经营性收入很多都是家庭多人共同经营所获,需要通过一定的方法近似地分解到个人。CHNS课题组将家庭的务农以及经商的劳动经营性收入通过个体所花费的时间除以家庭成员所花费的总时间分解成为个体的务农以及经营性收入。该方法比简单地将家庭经营性收入按照家庭劳动人口数进行平分要更加精确,因此本研究采用了课题组对家庭经营性收入的分解方法。收入变量的原始问卷和收入的计算方法详见CHNS课题组提供的《成人和住户问卷》、《个人收入指标建构》手册和《住户收入指标建构》手册。
本研究中受教育年限是在参考中国学制的基础上,依照劳动者接受的最高教育水平进行换算:文盲=0年,小学=6年,初中=9年,高中=12年,职高技校中专=12年,大学专科=15年,成人本科=15年,大学本科=16年,研究生=19年。教育的测量误差可能造成对教育收益率的偏估。由于CHNS是一个追踪数据,受访者在每轮都会报告自己的教育水平,我们依照被访者相邻轮次的受教育情况进行对照,并对不正常的变动进行修正,从而最大程度降低教育测量误差的影响。工龄依据惯例,由被访者的年龄减去受教育年限再减去入学年龄。
个体特征包括性别(男性=1,女性=0),民族(少数民族=1,汉族=0),婚姻状况(未婚、结婚、离婚或丧偶),居住社区类型(农村地区=1,城镇地区=0),户口性质(农业户口=1,非农业户口=0)。样本所在省份按照国家统计局2003年发布的标准划分为东部、中部和西部。就业特征包括部门性质和职业层次。部门特征分为公共部门、国有集体企业、私有企业和个体经营。劳动者所从事的职业则分为机关党组企业事业负责人、专业技术人员、办事和有关人员、商业服务业人员、产业工人阶层、灵活自由就业者以及农业劳动者阶层。
对于年份相关变量,本研究包括一组代表调查年份的虚拟变量,以及一组表示市场转型程度的指标。对于市场转型中的制度变化,我们采用国有集体企业职工就业比来表示,该比例越低,经济活动中市场的作用越强。对于经济发展水平的测量,我们选取人均GDP来表示。对于市场转型中经济结构的变化,我们选取了第三产业就业比,第三产业增加值占GDP比重以及城镇化率来表示。上述衡量市场转型程度的变量数据均从《中国统计年鉴》中获得。
三、研究方法和模型设定
追踪研究指的是对同一组对象在多个不同的时间点上进行调查,收集资料,然后通过对前后几次调查所得资料的统计分析来探索社会现象随时间变化而发生的变化及其不同现象之间因果关系的一种研究方式。CHNS作为一个追踪研究,在20年间共有8轮数据收集。本研究选取CHNS数据中在劳动力市场具有工作或者在农村务农的年龄在16岁到60岁之间,并且具有收入信息的样本,最终获得的样本中共有16390个劳动者,49004个观测值。
对于基于CHNS数据的教育收益率变动趋势的研究,最简单的思路是利用OLS方法分别计算每年的教育收益率并进行跨年比较。式(1)是在明瑟收入方程的基础上加入一组表示年份的虚拟变量
表示教育收益率在各年份的变动趋势。使用OLS方法分年估计教育收益率得出的结果与式(1)得出的结果相同,但是式(1)可以对教育收益率的变动趋势进行显著性检验。

上述两种估计教育收益率变动趋势的方法都将同一劳动者在不同时点的多个观测值处理为不同个体,将8个截面数据堆积起来变成49004个案例。CHNS数据是一个追踪数据,要使用CHNS数据估计教育收益率的变动趋势,必须了解追踪数据的特点。追踪数据所包含的信息可以分解为两个基本的维度:时间维度和个体维度。从时间维度看,可以将CHNS数据看成8个截面数据,每个截面都包含着个体之间的差异。从个体维度来看,可以将CHNS数据看成16390个时间序列的汇合。由于追踪数据是截面数据和时间序列数据的综合,因此适用于横截面数据的研究方法通常难以满足分析追踪数据的要求,需要进行一定的调整。
将式(1)应用于CHNS数据会产生三方面的问题。首先,该方法忽略了16390个劳动者具有的个体特殊效应(individual-specific effect),可能会产生遗漏变量偏误。要捕捉个体特征产生的特殊效应,不但每个劳动者都可以有一个自己的截距系数来表示样本的个体效应,再进一步,还可以允许斜率参数随个体的不同而变化。其次,追踪数据是对样本进行重复的测量,对于同一个体而言,其误差项往往存在一定程度的相关,因此式(1)并不满足线性回归模型所要求的误差项相互独立。样本损耗或流失问题也会对追踪数据的分析提出严重挑战。由表1可知,CHNS数据每轮样本的损耗率并不相等,每轮重复观测样本所占的比例也就不等。由此可见,样本损耗造成了CHNS相邻轮次调查间的样本相关性不等,从而使得无法将教育收益率的实际变动趋势同样本变动造成的影响区分开来。再次,对于同一年份的样本,他们也不是互相独立的,受相同年份变量的影响,在回归中由于有些变量不可观察而进入误差项,从而违背了OLS方法关于残差无序列相关的假设。在关于教育收益率变动的纵向研究中,收入水平随时间的推移而发生有规律的增减变化,方差也容易发生相应的增减,使方差齐性假设受到威胁。关于追踪数据的分析可参阅谢宇(2010)书中的章节[12]。







