中国户籍制度的深入解析:现状、影响与改革路径
上QQ阅读APP看书,第一时间看更新

3.4 数据描述和计量结果

本章使用2008年中国城乡劳动力流动调查(RUMIC)数据来分析提出的问题。中国城乡劳动力流动调查(RUMIC)由城市居民调查、农村居民调查和移民住户调查三部分组成[1]。这项调查涵盖三类中国家庭:在九个省或大都市地区的15个指定城市工作的5000个移民家庭(移民调查);相同城市中5000个城市本地家庭(城市居民调查);8000个农村家庭(农村居民调查)。大多数移民有农村户口,而城市样本主要是城镇户口。这项数据特征保证了城镇户口和农村户口的样本数量是足够大的。出于本章的研究目的,我们仅使用了2008年移民调查中的城市样本和移民样本。

无论是在地理上还是在经济上,样本中的九个省份涵盖了中国广泛的地区,因此用它们可以代表整个国家。具体来说,位于中国东部的上海、广东、江苏、浙江相对较为富裕,位于中国西部的四川和重庆地区相对贫穷,位于中国中部的安徽、湖北、河南处于收入水平分布的中间位置。据我们所知,对城市移民工人的RUMIC调查是中国移民工人的唯一随机样本。这项调查记录了详细的个人信息,例如每月收入、工作时数、人口特征和其他工作相关信息。本章中使用的每个变量的详细定义见本章附录2。

样本仅限于城市地区18~60岁的员工。此外,在外资企业和个体经济中工作的人员不包括在样本中。筛选后的样本由5012个城镇户口持有者和3795个农村户口持有者组成。样本总数为8807。数据关键变量的描述性统计汇总结果如表3-1所示。

表3-1 主要变量的描述性统计

注:本表中的主要数据为各变量的样本均值,括号中数据分别为中位数和标准差。变量的具体含义详见附录2。

从表3-1中可以看出,在5012个城镇户口持有者中,其中一半以上(3198人)在国有部门工作,而只有一小部分农村户口持有人在国有部门这个高工资部门工作。另外,在国有部门中工作的城镇户口持有者和农村户口持有者平均月收入分别为2294.63元和1529.76元,收入相差50%。私营部门中城镇户口持有者和农村户口持有者平均月收入相差30%。同样,国有部门中城市职工和农村职工中位数工资差距也大于私营部门。

表3-1显示,平均而言,城镇户口持有者比农村户口持有者年龄大,这表明城市中大多数农村移民是30岁左右的年轻人。此外,60%以上的农村户口持有者是男性,而城镇户口持有者的性别比例更为均衡。在人力资本变量方面,城镇户口持有者受教育程度高于农村户口持有者,国有部门职工平均上学年限略高于私营部门职工。数据集还包含一个社会资本变量,以在过去的中国春节中发送的祝福短信数量来衡量[2]。从表3-1可以看出,在国有部门工作的城镇户口持有者社会资本最多,在每一个部门中城镇户口持有者的人均社会资本都比农村户口持有者更多。最后,就工作相关特点而言,城镇户口职工往往比农村户口职工选择规模更大的企业工作。

用于识别部门选择方程的排除变量是一个虚拟变量,含义是个人是否由政府推荐到某一工作。表3-1显示,国有部门的城镇户口持有者中有近一半是政府推荐工作的,而这一比例在私营部门中要小得多。此外,在每个部门中,城镇户口持有者在过去一年中从父母那里获得的收入都比农村户口持有者多,这可以部分地验证有必要在户籍决定方程中使用这个识别变量。

正如Giulietti等人(2012)所指出的,在RUMIC数据库中,小时工资率更容易出现测量误差(通过结合每月工资和每周工作时数计算)。所以每月工资被选为主要的因变量。在稳健性检验中,工资方程是使用小时工资估算的,结果将在下一节中给出。

3.4.1 没有选择性校正的结果

首先在每个所有制部门分别估计城镇户口持有者和农村户口持有者的四个工资方程,先不考虑自选择问题。估计结果报告在表3-2中。所有工资方程中的因变量是以中国2007年名义货币(元)衡量的月收入的自然对数。自变量包括潜在的劳动力市场经验及其平方、受教育年限、社会资本、公司任职年限、健康状况、体重、身高、学习成绩、性别、婚姻状况、表示职业培训的虚拟变量、企业规模,以及一系列虚拟变量,包括职业、行业和省份虚拟变量,来控制不同地区的生活成本差异。

表3-2 不考虑自选择的工资回归方程

续前表

注:***表示在1%水平上显著,**表示在5%水平上显著,*表示在10%水平上显著。括号中是标准误差。回归的因变量为2007年月工资的对数,所有回归都控制了孩子数量、健康状况、身高、体重、学习成绩、性别、婚姻状况、是否接受职业培训、企业规模以及行业、职业、省份虚拟变量。

表3-2列出了主要人力资本变量的系数。如表所示,接受教育的回报比例约为3%,这在所有回归中都非常相似。在这里,接受教育的回报大小与近些年的研究一致(Song,2012;Demurger,et al.,2012)。另外,其他人力资本变量的系数对农村户口持有者来说都是统计上显著的,并且在两个部门中大部分都大于城镇户口持有者的系数,而社会资本的系数则相反,这可能表明农村户口持有者的工资结构更为市场化,而社会网络在城镇户口劳动者工资确定方面发挥更大的作用。将国有部门与私营部门进行比较,我们可以看出,这两个部门的农村户口持有者的工资结构相当。对于城镇户口持有者,私营部门的主要人力资本变量回报率高于国有部门,包括受教育年限和工作年限,但值得注意的是,国有部门的社会资本和公司任职年限的回报率高于私营部门。

分析表3-2的另一个发现是,对于城镇户口持有者,具有相同观察特征的男性收入比女性多出30%,这表明存在性别歧视。对农村户口持有者而言,性别工资差距约为10%。我们可以得出结论,城镇户口居民中的性别歧视比农村户口更严重。

表3-3报告了以对数差异的形式将总体工资差异分解为可解释部分和不可解释部分的结果。国有部门中城镇户口持有者和农村户口持有者的原始对数工资差距高于私营部门。请注意,私营部门中城镇户口持有者和农村户口持有者的全部工资差距是人们的生产率相关特征所导致的,这意味着私营部门没有歧视。相比之下,在国有部门存在着一定比例的不能由可观察的特征解释的工资差异,尽管并不是很大。

表3-3 不考虑自选择问题时的工资分解结果

注:表中的主要结果为对数月工资差异的分解值,括号中为标准误差。

3.4.2 具有双重选择性校正的结果

表3-4报告了具有双重选择性校正的分解结果[3]。如表3-4所示,不论非歧视性工资结构采用哪种加权方式,国有部门的工资歧视都明显比私营部门更严重。例如,如果把城镇户口持有者的工资结构作为非歧视性的工资结构,国有部门中不可解释的对数工资差距为0.384,私营部门中只有0.049。如果我们将对数差异转化为百分点,结果表明,对于观察性相当的工人,城镇户口持有者在国有部门中的收入比农村户口持有者多出50%,而私营部门则只有5%。

表3-4 双重选择校正后的工资分解结果

注:表中的主要结果为经过选择性修正后对数月工资差异的分解值,括号中为标准误差。

与表3-3的结果相比,选择性调整加剧了工资歧视,特别是在国有部门。这是因为农村户口持有者被正向选择进入国有部门。换句话说,在国企工作的农村户口持有者人力资本比平均的农村户口人群更高。

3.4.3 工资歧视的稳健性检验

除了通过使用不同的非歧视性工资结构进行稳健性检验外,本节将使用小时工资率作为因变量来进行另一种稳健性检验,结果如表3-5所示。与预期一致,我们仍然观察到国有部门在工资方面比私营部门的歧视程度更严重。国有部门中城镇户口持有者和农村户口持有者不可解释的工资差距大于私营部门。在少数情况下,这两个部门之间城镇户口持有者和农村户口持有者不可解释的工资差距是相近的,但并没有发现私营部门的歧视程度明显高于国有部门的情况。总的来说,如果我们以小时工资率代替月收入来做检验的话,国有部门和私营部门之间的工资歧视程度差异较小。

表3-5 双重选择校正后小时工资分解结果

注:表中的主要结果为经过选择性修正后对数小时工资差异的分解值,括号中为标准误差。

3.4.4 基于分位数回归的进一步分析

表3-6报告了基于分位数回归和分解技术的结果。这些分析是针对男性和女性分别进行的[4]。首先处理男性劳动者数据。估计显示,以户口为主的歧视主要存在于中等收入阶层,特别是工资分布中的50%分位数和75%分位数。此外,在中等收入附近对劳动者的歧视在国有部门中也比在私营部门中更严重,这与我们的主要结果一致。分析表3-6的另一个有趣发现是,对于收入非常高的群体(90%分位数),私营部门对农村户口的歧视比国有部门更严重,这需要进一步的研究和探索。

表3-6 不同分位数下的工资分解

续前表

注:表中的主要结果为以城镇户口持有者的工资结构为准在各分位数上对数月工资差异的分解值。

表3-6的下半部分显示了女性劳动者的结果。由于私营部门对于所有分位数的不可解释的工资差异都是负的,所以在私营部门中没有对农村户口的歧视。对于在国有部门工作的女性来说,随着工资收入的增加,歧视变得越来越严重。结合男性和女性的结果,我们可以得出结论,以户口为基础的工资歧视主要是针对中高收入劳动者,特别是在国有部门。而且,就歧视的程度而言,国有部门中女性劳动者遭受的歧视比男性劳动者更多。


[1]这项调查由澳大利亚国立大学、昆士兰大学和北京师范大学的一些研究人员发起,并得到了提供科学使用文件的劳动研究所(IZA)的支持。RUMIC调查的财政支持来自澳大利亚研究委员会、澳大利亚国际开发署(AusAID)、福特基金会、IZA和中国社会科学基金会。

[2]Zhang和Zhao(2011)对中国的社会资本变量采取了同样的度量方法。

[3]由于篇幅的限制,二元概率回归和增加工资回归的中间结果没有在文中报告。这些中间结果如有需要可请作者提供。

[4]为了简单起见,我们报告分位数回归和分解的结果时没有处理选择问题。此外,我们使用城镇户口持有者的工资结构进行工资分解,使用其他权重进行工资分解的结果可联系作者获得。