国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 生育二胎对孩子教育水平的影响研究 黎煦,陶政宇 首都经济贸易大学劳动经济学院,北京100070 【摘要】二胎政策全面放开后并没有出现预期的生育高峰。已有文献主要从教育、收入、家庭、人口特 征等方面分析了生育意愿下降的原因,但是忽略了人们对生育二胎后会降低孩子教育水平的担心。为 了实证检验生育二胎对孩子教育水平的影响,本文根据CFPS基线调查数据,运用工具变量估计等方法 进行经验研究。结果表明生育二胎对个体的教育水平没有统计上的显著影响。该结论通过一系列稳健 性检验。在实证分析中通过数据重组不仅扩大了样本量,还克服了以往研究中仅包括同住同胞的局限 并且控制了同胞的结构效应。相对于已有的双胞胎、计划生育政策等工具变量,用第一胎的性别作为工 具变量,发现第一胎为女性显著增加了第n(n>2)次生育的可能性,有证据表明第一胎的性别并没有受 到人为干预的影响。从内部有效性和外部有效性两方面得出的结果更加可靠,该结论有可能在两个方 面拓展了传统的资源稀释假说。 【关键词】生育二胎;同胞数量;教育水平 【中图分类号】C92424 【文献标识码】A doi:10.16405/cnki.1004-129X.2018.06.002 【文章编号】1004-129X(2018)06-020-11 【收稿日期】2018-04-27 【基金项目】国家社会科学基金一般项目:基于人力资本的我国代际收入流动机制与公共政策研究 (14BSH023);首都经济贸易大学研究生2018年科技创新学术型项目:我国教育代际流动性的效应估 与传递机制研究一—基于经济学和社会学学科交叉的分析 【作者简介】黎煦(1973-),男,湖南岳阳人,首都经济贸易大学劳动经济学院副教授; 陶政宇(1994-),男,北京人,首都经济贸易大学劳动经济学院硕士研究生。 引言 随着我国人口结构的变化,国家对20世纪70年代末制定的计划生育政策开始做出调整。2016 年全面放开二胎政策后并没有出现预计的生育高峰,表明现在家庭的生育意愿并没有预计的那么强 烈。口学术界已经开始关注这一现象并做了深入的分析。养育成本高、社会竞争压力大是人们不愿 意生育二胎的主要原因。2一些研究进一步发现父母的教育程度、收入水平、养育观念、健康等都会 影响人们的生育意愿,父母和家庭的人口学特征对生育意愿也有显著影响,比如单独(尤其是丈夫 为独生子)、已育一女的居民二胎生育意愿强于双独和双非、已育一子的居民。这些研究为我们了 ①有学者认为,二胎政策的实施在3-5年后才会导致潜在的生育增量释放,但在初始阶段不会有太大的影响 POPULATION 20 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 生育二胎对孩子教育水平的影响研究 黎 煦,陶政宇 (首都经济贸易大学 劳动经济学院,北京 100070) 【摘 要】二胎政策全面放开后并没有出现预期的生育高峰。已有文献主要从教育、收入、家庭、人口特 征等方面分析了生育意愿下降的原因,但是忽略了人们对生育二胎后会降低孩子教育水平的担心。为 了实证检验生育二胎对孩子教育水平的影响,本文根据CFPS基线调查数据,运用工具变量估计等方法 进行经验研究。结果表明生育二胎对个体的教育水平没有统计上的显著影响。该结论通过一系列稳健 性检验。在实证分析中通过数据重组不仅扩大了样本量,还克服了以往研究中仅包括同住同胞的局限 并且控制了同胞的结构效应。相对于已有的双胞胎、计划生育政策等工具变量,用第一胎的性别作为工 具变量,发现第一胎为女性显著增加了第 n(n >2)次生育的可能性,有证据表明第一胎的性别并没有受 到人为干预的影响。从内部有效性和外部有效性两方面得出的结果更加可靠,该结论有可能在两个方 面拓展了传统的资源稀释假说。 【关键词】生育二胎;同胞数量;教育水平 【中图分类号】C924.24 【文献标识码】 A doi:10.16405/j.cnki.1004-129X.2018.06.002 【文章编号】1004-129X(2018)06-0020-11 【收稿日期】2018-04-27 【基金项目】国家社会科学基金一般项目:基于人力资本的我国代际收入流动机制与公共政策研究 (14BSH023);首都经济贸易大学研究生2018年科技创新学术型项目:我国教育代际流动性的效应估计 与传递机制研究——基于经济学和社会学学科交叉的分析 【作者简介】黎 煦(1973-),男,湖南岳阳人,首都经济贸易大学劳动经济学院副教授; 陶政宇(1994-),男,北京人,首都经济贸易大学劳动经济学院硕士研究生。 一、引言 随着我国人口结构的变化,国家对20世纪70年代末制定的计划生育政策开始做出调整。2016 年全面放开二胎政策后并没有出现预计的生育高峰,表明现在家庭的生育意愿并没有预计的那么强 烈①。[1] 学术界已经开始关注这一现象并做了深入的分析。养育成本高、社会竞争压力大是人们不愿 意生育二胎的主要原因。[2] 一些研究进一步发现父母的教育程度、收入水平、养育观念、健康等都会 影响人们的生育意愿,[3] 父母和家庭的人口学特征对生育意愿也有显著影响,比如单独(尤其是丈夫 为独生子)、已育一女的居民二胎生育意愿强于双独和双非、已育一子的居民。[4] 这些研究为我们了 ① 有学者认为,二胎政策的实施在3-5年后才会导致潜在的生育增量释放,但在初始阶段不会有太大的影响。 20
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 解影响二胎生育意愿的因素提供了有益的参考。但是这些硏究没有回答人们普遍关心的一个问题 即生育二胎对孩子的质量到底有没有影响。特别是对孩子未来的教育水平有没有影响 孩子未来的教育水平是多个投入要素的产出函数。现代人力资本理论发现,从家庭的角度来 看,除了父母的教育水平、家庭收入等要素外,家庭当中子女的数量和结构也对其教育水平有重要影 响。二者的关系如何,理论上并没有给出一个明确的解释。主流的解释是社会学中的资源稀释假 说。该假说认为,家庭资源包括非物质资源和物质资源,前者主要指父母的时间、与子女的情感交流 等,物质资源主要包括父母在子女教育上的投资和提供的学习环境。随着子女数量的增加,每个孩 子能够获得的资源就会减少,从而影响他们的教育水平。此外,群聚理论假说认为,某个特定的儿童 所处的家庭智商环境是父母和兄弟姐妹人数的平均水平,因此兄弟姐妹人数越多,对个人教育水平 的负面影响就越大。这两个理论假说都表明个人的教育水平和同胞的数量呈现出负相关关系。另 外也有其他理论假说认为家庭中子女的数量越多,父母的婚姻就越稳定,并且孩子之间可以相互帮 助等,有益于孩子的成长,从而孩子的教育水平越高。但实证研究的结果差异也很大,比如有研究发 现同胞的数量对孩子的教育水平没有影响,甚至有正向影响;有研究则发现有负面影响,对于相同 的国家,由于所用的数据和方法不同,有时得出的结论也不一致 中国的国情与其他发达国家不同。一是我国还是一个发展中国家,绝大多数家庭在对孩子进行 教育投资时会受到经济条件的约束;二是受到传统文化和经济动机的影响,父母的男孩偏好导致家 庭资源分配时偏向男孩,导致子女的数量对男孩和女孩的影响不对称;三是由于重男轻女思想的影 响,我国农村一些家庭往往牺牲第一个孩子(特别是女孩)的教育水平,要求她们给家庭提供经济支 持等。这些因素表明同胞的数量和结构都会对孩子的教育水平产生影响,从而呈现出有别于发达国 家的特点。国内外学者对我国子女数量和孩子教育水平之间的关系做了大量的实证研究。 Yao lu 等发现在我国不同时期的国家政策背景下,同胞的数量对其教育水平的影响不同,意味着国家政策 可以缓解家庭资源不足的不利影响。 Xiao lei等发现在控制了同胞的性别构成和出生顺序后,同胞 数量对孩子教育水平的影响消失,表明主要是同胞的结构而不是数量影响了孩子的教育水平。郑 磊发现子女的性别结构会影响家庭资源的内部分配,从而影响到个人的教育水平,拥有兄弟不利于 个人的教育水平,而同胞中女性比例越高越有利于个人的教育获得,这种影响对不同性别也存在不 对称性。这些研究虽然区分了子女数量和子女结构对个人教育水平的不同影响,但是没有考虑内 生性问题。由于不同家庭的父母在子女数量和质量之间的偏好不同,因此在估计中就可能存在无法 观测的“父母偏好”这一遗漏变量,从而导致估计的结果不一致。为了处理遗漏变量偏误,一般的解 决办法是用工具变量估计,现在用到的主要工具是双胞胎和计划生育政策的实施。李宏彬、张俊森 利用1990年中国人口普查1%的样本,使用第n次生育时候是否为双胞胎作为工具变量,发现孩子 的数量显著地减少了孩子的平均受教育水平。杨娟认为我国计划生育政策在70年代末开始实施 通过控制孩子的出生年份可以很好地使用计划生育政策作为工具变量,该文运用2005年1%人口抽 样调查数据和CHIP2007两套数据,估计的结果都显示子女的数量和子女受教育程度呈现出显著的 替代关系,即家庭中孩子数量越少,其接受的教育年限越多。 Nancy Qian同样使用计划生育政策作 为工具变量,发现在中国农村地区生育第二胎能提高第一个孩子的入学率。运用双胞胎或计划生 育政策作为工具变量虽然在很大程度上解决了内生性问题,但是双胞胎估计的结果只是对生育了双 胞胎的家庭有效,对没有生育双胞胎的家庭缺少外部有效性,在总体中双胞胎家庭所占的比例很小, POPULATION Page JOURNAL 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 解影响二胎生育意愿的因素提供了有益的参考。但是这些研究没有回答人们普遍关心的一个问题, 即生育二胎对孩子的质量到底有没有影响。特别是对孩子未来的教育水平有没有影响。 孩子未来的教育水平是多个投入要素的产出函数。现代人力资本理论发现,从家庭的角度来 看,除了父母的教育水平、家庭收入等要素外,家庭当中子女的数量和结构也对其教育水平有重要影 响。二者的关系如何,理论上并没有给出一个明确的解释。主流的解释是社会学中的资源稀释假 说。该假说认为,家庭资源包括非物质资源和物质资源,前者主要指父母的时间、与子女的情感交流 等,物质资源主要包括父母在子女教育上的投资和提供的学习环境。随着子女数量的增加,每个孩 子能够获得的资源就会减少,从而影响他们的教育水平。此外,群聚理论假说认为,某个特定的儿童 所处的家庭智商环境是父母和兄弟姐妹人数的平均水平,因此兄弟姐妹人数越多,对个人教育水平 的负面影响就越大。这两个理论假说都表明个人的教育水平和同胞的数量呈现出负相关关系。另 外也有其他理论假说认为家庭中子女的数量越多,父母的婚姻就越稳定,并且孩子之间可以相互帮 助等,有益于孩子的成长,从而孩子的教育水平越高。但实证研究的结果差异也很大,比如有研究发 现同胞的数量对孩子的教育水平没有影响,甚至有正向影响;[5] 有研究则发现有负面影响,对于相同 的国家,由于所用的数据和方法不同,有时得出的结论也不一致。 中国的国情与其他发达国家不同。一是我国还是一个发展中国家,绝大多数家庭在对孩子进行 教育投资时会受到经济条件的约束;二是受到传统文化和经济动机的影响,父母的男孩偏好导致家 庭资源分配时偏向男孩,导致子女的数量对男孩和女孩的影响不对称;三是由于重男轻女思想的影 响,我国农村一些家庭往往牺牲第一个孩子(特别是女孩)的教育水平,要求她们给家庭提供经济支 持等。这些因素表明同胞的数量和结构都会对孩子的教育水平产生影响,从而呈现出有别于发达国 家的特点。国内外学者对我国子女数量和孩子教育水平之间的关系做了大量的实证研究。Yao Lu 等发现在我国不同时期的国家政策背景下,同胞的数量对其教育水平的影响不同,意味着国家政策 可以缓解家庭资源不足的不利影响。[6] Xiao Lei等发现在控制了同胞的性别构成和出生顺序后,同胞 数量对孩子教育水平的影响消失,表明主要是同胞的结构而不是数量影响了孩子的教育水平。[7] 郑 磊发现子女的性别结构会影响家庭资源的内部分配,从而影响到个人的教育水平,拥有兄弟不利于 个人的教育水平,而同胞中女性比例越高越有利于个人的教育获得,这种影响对不同性别也存在不 对称性。[8] 这些研究虽然区分了子女数量和子女结构对个人教育水平的不同影响,但是没有考虑内 生性问题。由于不同家庭的父母在子女数量和质量之间的偏好不同,因此在估计中就可能存在无法 观测的“父母偏好”这一遗漏变量,从而导致估计的结果不一致。为了处理遗漏变量偏误,一般的解 决办法是用工具变量估计,现在用到的主要工具是双胞胎和计划生育政策的实施。李宏彬、张俊森 利用1990年中国人口普查1%的样本,使用第 n 次生育时候是否为双胞胎作为工具变量,发现孩子 的数量显著地减少了孩子的平均受教育水平。[9] 杨娟认为我国计划生育政策在70年代末开始实施, 通过控制孩子的出生年份可以很好地使用计划生育政策作为工具变量,该文运用2005年1%人口抽 样调查数据和CHIP2007两套数据,估计的结果都显示子女的数量和子女受教育程度呈现出显著的 替代关系,即家庭中孩子数量越少,其接受的教育年限越多。[10] Nancy Qian同样使用计划生育政策作 为工具变量,发现在中国农村地区生育第二胎能提高第一个孩子的入学率。[5] 运用双胞胎或计划生 育政策作为工具变量虽然在很大程度上解决了内生性问题,但是双胞胎估计的结果只是对生育了双 胞胎的家庭有效,对没有生育双胞胎的家庭缺少外部有效性,在总体中双胞胎家庭所占的比例很小, 21
国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 因此该估计结果很难推广到总体当中。计划生育政策作为工具变量,从有效性和外部性的角度来看 都能满足条件,但我国计划生育政策的执行在不同地区和不同年份存在较大的差异,在缺乏准确的 执行信息的情况下,使用政策实施的时间作为工具估计出的效应只是一个分配效应(T)而不是处 理效应(TOT),这也影响了我们对估计结果的解释。 本文的主旨在于从经验上回答,在二胎政策全面放开的背景下,多生育一个孩子对所有孩子的 平均教育水平有没有影响。在已有研究基础上,本文主要做了两个方面的拓展。第一,根据大量已 有文献的结论,我国父母普遍存在“重男轻女”的思想,据此本文提出一个新的工具变量,即第一胎 的性别作为工具来进行因果关系的识别。第二,在估计家庭子女数量对孩子教育水平的影响时控制 了性别结构和出生顺序,从而排除了家庭结构对教育水平的影响 、数据和变量的说明 (一)数据 本文使用的数据是CFP(2010)的基线调查数据。该数据使用多阶段概率抽样方式,覆盖了25 个省份和全国95%的人口,因此可以把它近似看作是一个接近全国总体的样本。本文使用了成人问 卷库、家庭关系库和家庭库。由于成人问卷中调查的是访谈对象的非同住同胞的信息,为了解该成 人所有同胞的信息,我们首先根据成人的母亲(或父亲)的编码和家庭关系库进行匹配,这样就找到 访谈对象完整的同胞信息。为扩大使用 表1主要变量定义(年,岁) 的样本数量,我们对匹配后的数据库进 变量定义 数值定义 行了数据重组,把一个家庭中所有的同 受访者教育年限 文盲岸半文盲=0;小学=6;初中=9 高中冲专技校/职高=12;大专=15; 胞信息都作为研究对象,这样无论是进 本科=16;硕士=19;博士=22 入了成人问卷(同住家庭成员)的子女 受访者同胞数量 1-7,包括受访者本人 还是没有进入成人问卷的子女(非同住 受访者性别 0=男;1=女 家庭成员),只要是兄弟姐妹的关系,都 受访者年龄 25-80 成为分析的样本对象。根据 Black和 受访者户口性质 0=农业户口;1=非农户口 受访者民族 0=少数民族;1=汉族 Xiao lei等学者的研究,我们假定一 受访者出生顺序 个人25岁时才最终完成教育,因此我们 同胞中性别比例 同胞中女孩占同胞数量的比例 仅保留了25岁及以上的样本。根据父 同胞中第一胎的性别0=男;1=女 母的相关信息,对调查对象的一些变量 父亲教育年限 盲岸半文盲=0;小学=6;初中=9; 的缺失值进行了填补,对于缺少关键信 高中中专技校职高=12;大专=15; 息的观测值进行了删除(见表1)。 本科=16;硕士=19;博士=22 母亲教育年限 (二)变量说明 父亲年龄 6-103 本研究的因变量是被访者的受教育 母亲年龄 32-105 年数。问卷中报告了被访者和其父母回 家庭所在地区 =东部;2=中部;3=西部 答的已完成的最高学历,我们根据该问 ① Jungmin Lee(2008)用第一胎的性别研究了韩国同胞数量对父母教育支出的影响,本文借鉴了该文的思路,首次用第一胎的 性别分析中国情景中的这个问题 POPULATION 22 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 因此该估计结果很难推广到总体当中。计划生育政策作为工具变量,从有效性和外部性的角度来看 都能满足条件,但我国计划生育政策的执行在不同地区和不同年份存在较大的差异,在缺乏准确的 执行信息的情况下,使用政策实施的时间作为工具估计出的效应只是一个分配效应(ITT)而不是处 理效应(TOT),这也影响了我们对估计结果的解释。 本文的主旨在于从经验上回答,在二胎政策全面放开的背景下,多生育一个孩子对所有孩子的 平均教育水平有没有影响。在已有研究基础上,本文主要做了两个方面的拓展。第一,根据大量已 有文献的结论,我国父母普遍存在“重男轻女”的思想,据此本文提出一个新的工具变量①,即第一胎 的性别作为工具来进行因果关系的识别。第二,在估计家庭子女数量对孩子教育水平的影响时控制 了性别结构和出生顺序,从而排除了家庭结构对教育水平的影响。 二、数据和变量的说明 (一)数据 本文使用的数据是CFPS(2010)的基线调查数据。该数据使用多阶段概率抽样方式,覆盖了25 个省份和全国95%的人口,因此可以把它近似看作是一个接近全国总体的样本。本文使用了成人问 卷库、家庭关系库和家庭库。由于成人问卷中调查的是访谈对象的非同住同胞的信息,为了解该成 人所有同胞的信息,我们首先根据成人的母亲(或父亲)的编码和家庭关系库进行匹配,这样就找到 访谈对象完整的同胞信息。为扩大使用 的样本数量,我们对匹配后的数据库进 行了数据重组,把一个家庭中所有的同 胞信息都作为研究对象,这样无论是进 入了成人问卷(同住家庭成员)的子女, 还是没有进入成人问卷的子女(非同住 家庭成员),只要是兄弟姐妹的关系,都 成为分析的样本对象。根据 Black 和 Xiao Lei等学者的研究,[7][11] 我们假定一 个人25岁时才最终完成教育,因此我们 仅保留了 25 岁及以上的样本。根据父 母的相关信息,对调查对象的一些变量 的缺失值进行了填补,对于缺少关键信 息的观测值进行了删除(见表1)。 (二)变量说明 本研究的因变量是被访者的受教育 年数。问卷中报告了被访者和其父母回 答的已完成的最高学历,我们根据该问 ① Jungmin Lee(2008)用第一胎的性别研究了韩国同胞数量对父母教育支出的影响,本文借鉴了该文的思路,首次用第一胎的 性别分析中国情景中的这个问题。 表1 主要变量定义(年,岁) 变量定义 受访者教育年限 受访者同胞数量 受访者性别 受访者年龄 受访者户口性质 受访者民族 受访者出生顺序 同胞中性别比例 同胞中第一胎的性别 父亲教育年限 母亲教育年限 父亲年龄 母亲年龄 家庭所在地区 数值定义 文盲/半文盲=0;小学=6;初中=9; 高中/中专/技校/职高=12;大专=15; 本科=16;硕士=19;博士=22 1-7,包括受访者本人 0=男;1=女 25-80 0=农业户口;1=非农户口 0=少数民族;1=汉族 1-7 同胞中女孩占同胞数量的比例 0=男;1=女 文盲/半文盲=0;小学=6;初中=9; 高中/中专/技校/职高=12;大专=15; 本科=16;硕士=19;博士=22 同上 36-103 32-105 1=东部;2=中部;3=西部 22
国家哲学社会科学学术期刊数据 National social sciences ataba 总第232期2018.6 VoL 40 N 项统一换算成教育年数。 本文关注的核心自变量是同胞的数量,包括受访者本人,当受访者没有兄弟姐妹时,该变量取值 为1。控制变量包括受访者的性别、出生顺序,即当受访者是第一胎出生时取值为1,第二胎出生时 取值为2,以此类推,在回归中将该变量处理成虚拟变量,把第一胎出生作为对照组。为了使该变量 的含义明确,我们删除了双胞胎的样本。受访者的户籍分为城镇户口和农村户口,由于户籍对受访 者教育水平的影响主要是人力资本投资的早期阶段,而调查时点拥有城镇户口的部分受访者出生时 是农村户口,因此我们根据受访者3岁和12岁时的户口信息来确定受访者的户籍状况。年龄是为了 控制由于教育扩张带来的年份趋势效应;为更好地控制性别构成效应,除加人出生顺序外,还加入 个性别比例变量,该变量表示在所有的同胞中女性所占的比例。第一胎的性别是本文用到的工具变 量。除此之外,依据研究的惯例,还包括了父母的教育程度、父母的年龄和所在地区等变量(见表2)。 表2主要变量的描述性统计 全部样本(N=22191) 农村(N=18787)城镇(N=3404) 变量定义 均值标准差最小值最大值均值标准差均值标准差 受访者教育年限 6.600 4.655 0.000 22.000 5.923 10.338 3.833 受访者同胞数量 4.066 1.774 7.000 463.531 1.831 受访者性别 0.5000.000 1000 0.522 0.516 受访者年龄 49.66011.9822500080.000494881198250.61211.935 受访者年龄平方2609.70712387676250006400.00025926211237.88527040051239.572 受访者户口性质 0.360 1.000 受访者民族 1000 0.916 0.277 受访者出生顺序 2.373 1478 7.000 2.402 2.215 1425 同胞中性别比例 0.289 0.000 1500 0.324 父亲教育年限 3.517 3.870 0.00022.000 3.175 4.507 母亲教育年限 1.6373.0200.00022.0001.302 4.290 父亲年龄 690295.30336000103.000689645.19669.386 5.851 母亲年龄 69.254 6.59332.000105.000 6.54 6.847 家庭所在地区 1.8180.8161.0003.0001.8750.8261.503 0.672 第一胎是女孩(ⅣV)0.4940.5000000 0.4940.500 0.500 (三)主要变量的描述性统计 由表2可以看出,全部样本的平均年龄是50岁,最小的是25岁,最大的是80岁。其中农村户口 的样本占比是85%,城镇户口的样本占比是15%。总样本的平均受教育水平是6.6年,其中农村样本 的平均受教育水平是59年,城镇样本是10.3年,反映出我国城乡教育水平的巨大差异。受访者所在 家庭平均有4个孩子,农村户籍样本所在家庭平均有4.2个孩子,而城镇户籍样本有3.5个孩子,城镇 居民家庭的规模比农村家庭要小。表3根据户籍状况和家庭规模进一步报告了受访者教育年限的 相关信息。可以看出,二孩家庭出生的孩子的平均受教育年限要高于独生子女家庭的孩子,但随着 ①根据文盲/半文盲=0年,小学=6年,初中=9年,高中中专技校职高=12年,大专=15年,本科=16年,硕士=19年,博士=22年 进行换算。 ②删除的双胞胎样本占总样本的比重不到1%,因此不会影响估计的结果 POPULATION Page JOURNAL 国家哲学社会科学学术期刊数据库 National social sciences Datab
总第 232 期 2018.6 vol.40 POPULATION JOURNAL page 项统一换算成教育年数①。 本文关注的核心自变量是同胞的数量,包括受访者本人,当受访者没有兄弟姐妹时,该变量取值 为1。控制变量包括受访者的性别、出生顺序,即当受访者是第一胎出生时取值为1,第二胎出生时 取值为2,以此类推,在回归中将该变量处理成虚拟变量,把第一胎出生作为对照组。为了使该变量 的含义明确,我们删除了双胞胎的样本②。受访者的户籍分为城镇户口和农村户口,由于户籍对受访 者教育水平的影响主要是人力资本投资的早期阶段,而调查时点拥有城镇户口的部分受访者出生时 是农村户口,因此我们根据受访者3岁和12岁时的户口信息来确定受访者的户籍状况。年龄是为了 控制由于教育扩张带来的年份趋势效应;为更好地控制性别构成效应,除加入出生顺序外,还加入一 个性别比例变量,该变量表示在所有的同胞中女性所占的比例。第一胎的性别是本文用到的工具变 量。除此之外,依据研究的惯例,还包括了父母的教育程度、父母的年龄和所在地区等变量(见表2)。 表2 主要变量的描述性统计 变量定义 受访者教育年限 受访者同胞数量 受访者性别 受访者年龄 受访者年龄平方 受访者户口性质 受访者民族 受访者出生顺序 同胞中性别比例 父亲教育年限 母亲教育年限 父亲年龄 母亲年龄 家庭所在地区 第一胎是女孩(IV) 全部样本(N =22 191) 均值 6.600 4.066 0.521 49.660 2 609.707 0.153 0.924 2.373 0.449 3.517 1.637 69.029 69.254 1.818 0.494 标准差 4.655 1.774 0.500 11.982 1 238.767 0.360 0.265 1.478 0.289 3.870 3.020 5.303 6.593 0.816 0.500 最小值 0.000 1.000 0.000 25.000 625.000 0.000 0.000 1.000 0.000 0.000 0.000 36.000 32.000 1.000 0.000 最大值 22.000 7.000 1.000 80.000 6 400.000 1.000 1.000 7.000 1.500 22.000 22.000 103.000 105.000 3.000 1.000 农村(N =18 787) 均值 5.923 4.163 0.522 49.488 2 592.621 — 0.916 2.402 0.446 3.175 1.302 68.964 69.169 1.875 0.494 标准差 4.466 1.746 0.500 11.982 1 237.885 — 0.277 1.485 0.282 3.640 2.591 5.196 6.542 0.826 0.500 城镇(N =3 404) 均值 10.338 3.531 0.516 50.612 2 704.005 — 0.967 2.215 0.466 5.400 3.485 69.386 69.722 1.503 0.496 标准差 3.833 1.831 0.500 11.935 1 239.572 — 0.179 1.425 0.324 4.507 4.290 5.851 6.847 0.672 0.500 (三)主要变量的描述性统计 由表2可以看出,全部样本的平均年龄是50岁,最小的是25岁,最大的是80岁。其中农村户口 的样本占比是85%,城镇户口的样本占比是15%。总样本的平均受教育水平是6.6年,其中农村样本 的平均受教育水平是5.9年,城镇样本是10.3年,反映出我国城乡教育水平的巨大差异。受访者所在 家庭平均有4个孩子,农村户籍样本所在家庭平均有4.2个孩子,而城镇户籍样本有3.5个孩子,城镇 居民家庭的规模比农村家庭要小。表3根据户籍状况和家庭规模进一步报告了受访者教育年限的 相关信息。可以看出,二孩家庭出生的孩子的平均受教育年限要高于独生子女家庭的孩子,但随着 ① 根据文盲/半文盲=0年,小学=6年,初中=9年,高中/中专/技校/职高=12年,大专=15年,本科=16年,硕士=19年,博士=22年 进行换算。 ② 删除的双胞胎样本占总样本的比重不到1%,因此不会影响估计的结果。 23
国家哲学社会科学学术期刊数据 National social sciences Datab 人塔刊 POPULATION JOURNAL 同胞数量的增加,受访者的平均受教育年限逐渐减少;在各种家庭类型中,男性的平均受教育年限都 比女性高,在相同子女的家庭当中,城镇户籍人口的平均受教育年限都高于相应的农村户籍人口 农村户籍人口教育年限的性别差异要大于城镇户籍人口的教育年限的性别差异。 表3按同胞数量、户口性质划分的个体平均受教育年限 农村 城镇 同胞数量总体 女 男 女 7.946 6.427 6.610 11.275 10.307 7.547 6.963 5.885 11.881 11.517 7.924 7.432 10.379 6.159 6.820 10.103 9.428 6.600 10.641 0.054 三、模型的设定与基准估计 (一)计量模型设定 本文预计同胞的数量对教育水平产生影响,但影响的符号存在不确定性。我们根据 Black、 Nancy 等学者的研究,设定如下基准回归方程: eduyi=Bo+Brsiblingi + B2chi; +B fam; +u, 其中,edgy表示受访者的教育水平, sibling表示受访者同胞的数量(包括受访者本人),chi表 示受访者的人口学特征,包括性别、年龄、户籍、民族、出生顺序,am表示受访者的家庭背景,包括 父母的教育程度、父母的年龄、同胞中女性所占的比例、家庭所在地区等。本文关注的核心自变量是 同胞的数量,即在控制其他条件不变情况下,新增一个同胞对个体教育水平的影响。 (二)基准回归结果 表4是依据前述基准模型估计的全样本和分城乡子样本的估计结果。在总样本中,在控制了其 他因素的影响后,同胞数量变量的估计系数在1%的水平上显著为负,初步表明同胞数量对个人的教 育水平存在显著的负面影响。从控制变量的估计结果可以发现不同个体特征和家庭背景的个人在 教育水平上有明显差异。相对女性,男性的平均教育年限更高;年龄越大,平均受教育水平越低,表 明过去几十年我国的教育发展取得了明显的成绩;城镇户籍人口比农村户籍人口的教育年限平均超 过3年,反映了我国教育发展巨大的城乡地区差异;父母的教育程度越高,子女的教育年限也越高; 相比于西部地区,东部和中部地区人口的教育水平更高;出生顺序的联合F检验在1%的水平上显 著不为0,表明出生顺序对个体的教育水平有显著的影响,并且同胞中性别的比例也对受教育水平有 显著的影响,女性的比例越高,同胞的数量越多。分农村和城市样本回归的结果也表明,在两个子样 本中同胞数量的系数都为负,并且在1%的水平上显著。上述结果表明,即使控制了同胞的结构,同 胞的数量也对个体的教育水平有显著的影响,家庭中同胞的数量越多,个体的教育水平越低 四、工具变量估计和稳健性检验 (一)工具变量的有效性 上述OLS估计结果只是揭示了同胞数量和个体教育水平的相关关系,不能做因果关系方向上的 POPULATION 24 JOURNAL 国家哲|社会科学学术期刊数据库 Nation social sciences Datab
POPULATION JOURNAL page 同胞数量的增加,受访者的平均受教育年限逐渐减少;在各种家庭类型中,男性的平均受教育年限都 比女性高,在相同子女的家庭当中,城镇户籍人口的平均受教育年限都高于相应的农村户籍人口。 农村户籍人口教育年限的性别差异要大于城镇户籍人口的教育年限的性别差异。 表3 按同胞数量、户口性质划分的个体平均受教育年限 同胞数量 1 2 3 4+ 总体 总体 7.232 7.547 7.145 6.159 6.600 男 7.946 8.167 7.924 7.219 7.536 女 6.427 6.963 6.406 5.229 5.741 农村 男 6.610 7.287 7.432 6.820 6.967 女 4.658 5.885 5.689 4.643 4.968 城镇 男 11.275 11.881 10.379 10.103 10.641 女 10.307 11.517 10.364 9.428 10.054 三、模型的设定与基准估计 (一)计量模型设定 本文预计同胞的数量对教育水平产生影响,但影响的符号存在不确定性。我们根据Black、Nancy 等学者的研究,[5][11] 设定如下基准回归方程: eduyi = β0 + β1siblingi + β2chii + β3 fami + μi 其中,eduy 表示受访者的教育水平,sibling 表示受访者同胞的数量(包括受访者本人),chi 表 示受访者的人口学特征,包括性别、年龄、户籍、民族、出生顺序,fam 表示受访者的家庭背景,包括 父母的教育程度、父母的年龄、同胞中女性所占的比例、家庭所在地区等。本文关注的核心自变量是 同胞的数量,即在控制其他条件不变情况下,新增一个同胞对个体教育水平的影响。 (二)基准回归结果 表4是依据前述基准模型估计的全样本和分城乡子样本的估计结果。在总样本中,在控制了其 他因素的影响后,同胞数量变量的估计系数在1%的水平上显著为负,初步表明同胞数量对个人的教 育水平存在显著的负面影响。从控制变量的估计结果可以发现不同个体特征和家庭背景的个人在 教育水平上有明显差异。相对女性,男性的平均教育年限更高;年龄越大,平均受教育水平越低,表 明过去几十年我国的教育发展取得了明显的成绩;城镇户籍人口比农村户籍人口的教育年限平均超 过3年,反映了我国教育发展巨大的城乡地区差异;父母的教育程度越高,子女的教育年限也越高; 相比于西部地区,东部和中部地区人口的教育水平更高;出生顺序的联合 F 检验在1%的水平上显 著不为0,表明出生顺序对个体的教育水平有显著的影响,并且同胞中性别的比例也对受教育水平有 显著的影响,女性的比例越高,同胞的数量越多。分农村和城市样本回归的结果也表明,在两个子样 本中同胞数量的系数都为负,并且在1%的水平上显著。上述结果表明,即使控制了同胞的结构,同 胞的数量也对个体的教育水平有显著的影响,家庭中同胞的数量越多,个体的教育水平越低。 四、工具变量估计和稳健性检验 (一)工具变量的有效性 上述OLS估计结果只是揭示了同胞数量和个体教育水平的相关关系,不能做因果关系方向上的 24