中国户籍制度的深入解析:现状、影响与改革路径
上QQ阅读APP看书,第一时间看更新

3.3 研究方法和模型

这一部分采用基于回归的分解技术,检验不同所有制部门对农村户口的工资歧视程度。我们按照所有制部门(国有或私营)和户口状况(农村或城镇)两个维度将工人分为四组。相应地,考虑到每组工人不同的工资结构,还需要进行四组独立的工资回归。

另外,由于不同户口状态及在不同所有制部门中的工人并不是随机分布的,因此还需要分别建立两个确定部门分配和户口状态的选择方程以保证对四个工资方程的一致性估计。总之,我们建立了一共包括六个方程在内的系统,两个选择方程和四个工资方程如下所示:假设S*i和U*i分别表示决定个人所在所有制部门和户口状态的潜在连续的不可观测变量,其中i表示个人;让Wij(其中,i或者R,j=S或者P)分别表示国有部门和私营部门的城乡户口工资,上标表示户口状态,下标表示个人所在的所有制部门。

假设上述六个方程中的误差项具有以下方差-协方差矩阵:

3.3.1 无选择性修正

在不考虑自选择问题的情况下,我们就可以用最小二乘法来估计方程(3-3)~(3-6)中的四个工资回归。这种简单的情况要求方程(3-7)中所有的对角线项均为0。给定了最小二乘法的回归结果,工资对数的差异就可以被分解为可以用与生产率相关的特征解释的禀赋效应和可以用来估计工资歧视的不可解释变量的效应。具体而言,给定所属的所有制部门,农村户口与城镇户口劳动者之间的工资差异可以用下面的公式来进行分解:

与Oaxaca-Blinder方法相关的现实问题被称为指数问题(index number problem),这意味着分解结果依赖于非歧视性工资结构的选择,即γ*的选择是不唯一的。Oaxaca-Blinder方法的原始版本假设γ*在研究中采用与一个参照组的工资结构相同的值。例如,如果,那么在非歧视的情况下,城镇户口工人的工资结构将会被使用(Liu,Meng,Zhang,2000)。优势群体的工资结构通常被认为是无歧视情况下的工资结构,这是一个非常普遍的假设。但是,如果有人认为,农村户口工人的现行工资结构才能代表无歧视的竞争性工资结构,那么。如前所述,大部分关于中国劳动力市场的研究都使用Oaxaca-Blinder分解方法的原始版本(Gagnon,Xenogiani,Xing,2011;Gravemeyer,Gries,Xue,2011;Liu,Meng,Zhang,2000),并采用这两种极端的工资结构来近似估计无歧视的工资结构。

分解工资差异的另一种方法是从混合样本的回归中获得竞争性工资结构(γ*)(Oaxaca and Ransom,1994)。他们认为,如果无歧视就意味着完全停止现有的歧视行为,那么假设混合样本估计出的参数向量代表竞争性工资结构就是合理的。

然而,在目前关于歧视的文献中,对于哪种加权方案显著优于其他方案并没有达成共识(Powers,Yoshioka,Yun,2011)。因此,本章将使用四种非歧视性工资结构,即城镇户口劳动者的工资结构、农村户口劳动者的工资结构、人口加权工资结构,以及混合样本工资结构分别进行分析,并报告分解结果。从下一节所示的结果可以看出,主要结果对于不同的加权方案是稳健的。因此,本章的主要结论将基于歧视文献中最常用的加权方案,即高收入群体(城镇户口劳动者)的工资结构。

3.3.2 双重选择方法

本节考虑两个选择问题,并假设两个选择过程是相关的(也就是说ρ≠0),故采用双重选择的方法来估计方程(3-1)~(3-6)。Tunali(1986)表示,如果误差项服从联合正态分布[1],则可以应用两步估计过程来纠正双选择性问题,这与Heckman的两步法(Heckman,1979)非常相似。具体来说,用双变量概率模型估计两个选择性方程,并且在四个工资方程中导出扩展的选择性修正项作为附加回归自变量。给定扩展的工资回归的估计结果,按照Reimers(1983)的建议,分别分解国有企业和私营企业的城乡户口劳动力之间选择性修正后的平均工资差额。修正后的工资差额可以再次分解为禀赋效应和系数效应,后者是对工资歧视的估计。本章附录1提供了Tunali模型的具体介绍。

虽然选择性方程的非线性原则上可以区别上述系统中的方程式,但是最好在每个选择性方程中加入一些仅与该选择性方程相关,而排除另一个选择性方程和工资方程的变量(Rabe,2011)。识别部门决定方程式的工具变量是一个虚拟变量,即个人是否被政府推荐某一工作。由于中国国有企业与政府有着密切的关系,政府有时会向国有企业推荐人才,但这种政府推荐在私营企业中是非常罕见的。因此,工作安排中是否存在政府推荐成为部门确定的一个很好的指标。此外,由于国有企业通常为不同特征,例如不同学历和经验的劳动者提供不同的工资计划,因此政府推荐也不太可能直接影响到国企部门工人的工资。

此外,户籍决定方程中排除其他工资方程的变量是一个连续变量,代表在过去十二个月内个人从父母处获取的资金总额。如前所述,许多城市将城镇户口给予在该城市有投资,或购买房屋等固定资产的人(Song,2014)。因此,如果一个人在过去的一年中从父母处获得了更多的资金,那么他更有可能达到当地政府规定的标准,从而获得城镇户口。这个变量被排除在工资方程之外,因为雇主不会知道一名工作人员在过去一年中从父母那里收到多少钱,因此也不能根据这一未知信息而支付不同的工资[2]

3.3.3 分位数回归和工资分解

为了更深入地了解中国城市中的户口歧视,本章通过组合分位数回归和分解技术的方法,探讨工资分布中不同分位数处的工资歧视程度。也就是说,我们想知道在中国城市中,是高工资的农村户口持有者还是低工资的农村户口持有者受到了更多的歧视。

众所周知,Koenker和Basset(1978)引入的分位数回归模型将位置模型中普通分位数的概念扩展到条件分位数具有线性形式的更一般的线性模型。几项值得注意的研究已经结合了分位数回归和分解技术来研究私营部门的工资差异(Mueller,1998;Melly,2005)。本章将采取同样的方法来确定在工资分布不同分位数上农村户口持有者遭受工资歧视的程度。


[1]在实证分析中,我们使用由Doornik和Hansen(2008)开发的技术,验证了两个误差项实际上服从联合正态分布的假设。Stata使用的命令是“mvtest normality”,具体结果可从作者处获取。

[2]为了进一步证实两个排除限制的有效性,我们遵循Giulietti等人(2012)采用的方法:计算每个工资方程的残差(在选择校正后),并对每个排除的变量进行回归。估计的系数显示并不存在显著的相关关系。