1991年,著名的经济学大侦探乔舒亚·安格里斯特(Joshua D. Angrist)和艾伦·克鲁格(Alan B. Krueger)在顶级杂志《经济学季刊》上发表了一篇文章,他们找到了一个神奇的工具变量——一个人的出生季节。
和世界大多数发达国家一样,美国很早就颁布了义务教育法。美国的义务教育法规定:只要当年年满6岁的儿童,都需要在该年9月份入学。也就是说,一个孩子如果生日是12月31日,那么,他和生日是1月1日的孩子一样,都需要在当年9月份入学(这一点与中国的入学规定不同,我们是当年9月1日之前年满6周岁的儿童才能入学。如果你出生在9月1日,你就比出生在8月31日的小孩晚一年入学。而美国是当年只要年满6周岁就可以在该年9月份入学,所以1月1日出生的孩子就比前一年12月31日出生的孩子晚一年入学)。平均而言,出生在第一季度的孩子,入学时大约是6.45岁。而出生在第四季度的孩子,入学时的平均年龄大约是6.07岁。同时,美国的义务教育法还规定,只有年满16岁,青少年才可以离开学校,辍学回家。
这样一来,那些在第一季度出生的孩子,比第四季度出生的孩子,理论上就可以少上将近一年的学。也就是说,如果一个人的生日是1月1日,那么,在他16岁到来那一年,过了1月1日就可以辍学去工作了;而如果他的生日是12月31日,那么,他就需要上完全年的学才能合法地离开学校,离开课堂。
这样一来,美国的义务教育法就创造了一个自然的实验环境。它把在16岁辍学的孩子分成了两组:一组是生日在一年当中比较早的那些孩子,我们把他们称为A组;一组是生日在一年当中比较晚的孩子,我们把他们称为B组。由于B组的孩子比A组要多上一段时间的学,所以,对于我们估计多读一年书所带来的收入差异来说,B组就是干预组或处理组,那么,A组就自然成了对照组或控制组了。
假如有许多人都是1月1日出生的,也有许多人是12月31日出生的,而这些人都在16岁生日到来那天辍学了,那么,我们把这两组人未来的平均收入进行比较,其间的差别就是多读一年书带来的收益了。在这个研究中,一个人的出生季节或生日,为什么是一个好的工具变量呢?
首先,两位大侦探要确定的是,会不会真如我们这里所讲,有一部分孩子在16岁生日到来后就辍学?也就是说,如果一个孩子的生日在1月1日,他会不会真的比那些出生在12月31日的孩子少上一年学?幸运的是,两位大侦探通过数据分析确定,情况确实如此,的确有一部分孩子在16岁辍学,而且他们的生日会对辍学时间的选择有着显著的影响。
那么,两位大侦探接下来要确定的第二件事,就是确定生日与其他那些影响收入的因素不存在什么显著的关联。一个孩子出生在哪个季节或者月份,或许纯粹是一种随机的结果。即便有人选择让孩子在某些季节出生,恐怕也很少有人会出于让孩子长大后赚到更多钱的原因这样做。如果真有哪个季节可以让孩子将来赚取更多收入,我相信家长们一定会扎堆把孩子生在那个季节,这样我们也一定能从数据中观察到这样的现象。但事实是,我们从来没有看到过这样的扎堆现象。
经过对这两点详加验证之后,两位大侦探让我们确信,一个人的出生季节或月份是一个好的工具变量,它可以让我们把多读一年书对未来收入造成的影响,与其他因素对未来收入发挥的作用区分开,从而干净地识别出多读一年书对未来收入的因果效应。
大侦探安格里斯特和克鲁格分别搜集了美国20世纪20年代、30年代、40年代和50年代出生的孩子在1970年、1980年的收入信息。由于20世纪40年代和50年代出生的孩子上高中的比例已经很高,所以,16岁即辍学的人数相对较少,再加上在这代孩子成长的时代遇到了越南战争等外部事件的冲击,同时,收入信息也只到1980年,所以他们主要比较了20世纪20年代和30年代出生的孩子出生季度的差异对收入造成的影响。对于20年代出生的孩子,使用的是1970年的收入信息数据,此时他们正好处在40~49岁之间;而对于30年代出生的孩子,使用的则是1980年的收入信息数据,此时他们也处于40~49岁之间。
两位大侦探发现,对于20世纪20年代出生的孩子来说,第一季度出生的人比其他三个季度出生的人少上了0.126年学,教育回报率要低0.7个百分点。对于20世纪40年代出生的孩子来说,第一季度出生的人比其他三个季度出生的人少上了0.109年学,教育回报率要低1.02个百分点。
安格里斯特和克鲁格真是发现工具变量的天才!他们这个巧妙的研究设计,一下子帮我们破获了多读一年书到底能带来多大收益这个多年的悬案。他们的这篇文章被奉为经典,简称“AK91”(A和K分别是安格里斯特和克鲁格的姓氏首字母,这篇文章发表于1991年),成为后来学习工具变量方法的学子们不断阅读和研究的典范。