历史 > 自媒体 > 正文

【量化历史研究】好的量化需要好的数据：对世界人口数据质量的评估

量化历史研究

下载客户端
独家抢先看

2023年11月25日 12:16:25 来自湖南省

（图片来源于网络）

过去二十多年，一些经济学者的实证工作依赖一项已经发表的研究—McEvedy and Jones’s（以下简称MJ）的《世界人口历史地图集》，该书出版于1978年，报告了世界各国每隔一个世纪或半个世纪的人口总数。它让许多熟悉人口史研究的学者感到惊讶，实际上对多数国家而言，现代人口普查多始于19世纪，1500年以前的人口统计接近空白，也正如书中所题，MJ并没有掩盖他们数据的粗糙本质。那么，使用该数据的一系列研究结论可信么，会不会给研究结论带来较大误差？Guinnane Timothy（2023）结合多篇公开发表、包括一些在主流期刊被高度引用的文章展开深度探讨。

MJ的《世界人口历史地图集》报告了一国（或地区）以半世纪或世纪为单位间隔的人口总数，如图1列举了德国公元1—1975年的人口数据。虽然，他们直言“中世纪晚期之前，几乎没有任何数据可以作为德国人口估计的基础”“对14世纪之前波兰人口的估计只能是基于对可能的人口密度的看法”“在19世纪之前，没有任何计算依据”。然而，MJ事实上报告了德国、波兰等地的人口数据，并且经济学家们利用这些观察结果检验了认为重要的假设。更多的例子普遍存在，如非洲最早的人口证据是17世纪，书中却报告了整整两千年的估计。

图 1 MJ关于德国公元1—1975年人口数据

正如Austin（2008）所说，“如果翻阅MJ的论文，关于原始证据的详细说明以及如何将其转换为可用数据背后的推理，你会感到失望。”但MJ的工作反映了他对远古时期人口的长期关注，并且MJ一个显著不同于先前研究的地方在于——早期估计多对应大区域或大陆，而MJ报告了与现代国家对应地区的人口。

MJ如何得出人口估计的，其基础是什么?作者概括了四点：一是他们从最早的官方人口普查回溯。二是他们认为直至中世纪晚期，人口以恒定的速度增长。三是面对未知，他们觉得应该给相似的地方分配相同的增长率。四是在1500年之前，MJ倾向于从经济的本质中进行推理。直白的说，MJ的数字反映了他们对人口密度的看法与这个国家或地区的经济类型相一致。表1显示了MJ数据集人口百分比变化，在许多情况下，MJ给人口估计设定了整数形式的百分比变化，如在1500—1600年数据的79个国家中，MJ认为30%的国家人口百分比变化是一个整数。

表 1 MJ中不同时期的人口百分比变化

相对于各国的“真实”人口数据，MJ中的人口数据会让实证工作产生什么偏差？一般情况下，人口数据作为因变量（结果变量）时，其自身的经典测量误差不会对估计产生偏倚，后果仅是效率损失。但当作为回归变量（原因变量）时，其测量误差意味着估计存在系统性偏差。MJ采用“取整”（四舍五入）的规则对人口数据进行估计，显然，当一国或地区的人群规模较大时，产生的测量误差也越大，这种非经典性测量误差给依赖它的估计带来了问题。

使用MJ数据的学者常将人口（或人口密度等概念）作为产出等经济总量的代理变量。Caldwell和Schindlmayr（2002）以及Austin（2008）等批评人士指出，MJ经常使用有关经济的概念来推测人口规模，致使人口不能很好地代表经济总量，在人口数据薄弱的地区和时间尤其如此，比如非洲，因非洲大陆的经济史资料相对匮乏。在某种程度上，MJ根据人们对经济表现的看法来分配人口估计。

作者认为，使用MJ数据的研究人员有“软克隆”和“硬克隆”两种方式。其中，MJ他们自己创造了“软克隆”，即他们将他们认为相似的国家分配人口增长率，如阿富汗在20世纪之前没有可用的人口数据资料，“也许最好的方法是将阿富汗与伊朗进行比较”（McEvedy和Jones，1978），故而他们假设在1900年之前，阿富汗每年的人口都是伊朗的一半。从上表1中我们也可以看出一些“软克隆”迹象。

所谓“硬克隆”，是指一些经济学家根据MJ报告的地区人口数据，结合现代国家的组成进行人口数据构建。文中介绍了Nunn and Qian（2011）和Ashraf and Galor（2011，2013）两种构建方式，前者假设每个地区人口相对规模与1950年的报告相同，后者通过假设一个地区内的每个国家每年的人口密度相同来分解地区。那么，“硬克隆”是否会给人口数据带来更多错误？作者使用1900—1970年美国的实际数据进行验证，发现估算出的人口数据与美国各州实际人口情况存在较大误差，且关于区域分解的方法有其局限性，如加利福尼亚这种在20世纪经历快速人口增长的地区。

接着，作者检验了由“硬克隆”构造的人口是否会影响已发表研究的结果，仍以Nunn and Qian（2011）的研究为例，结果如表2所示。

表 2 “硬克隆”的回归表现

表中第1列再现了Nunn and Qian（2011）的结果，变量Potato x post1750寓意马铃薯的引入在1750年及之后增加了人口规模。当舍去非洲“克隆”样本后时，点估计不再显著（第2列），当删除所有“克隆”后变量再呈现出显著特性（第3列），问题似乎出在非洲人口数据的“克隆”身上。如果去掉整个非洲（第4列），点估计变得更小。第5—7列使用Ashraf and Galor的构造方式进行了再检验，可见，结果是否显著在很大程度上取决于是否包括非洲的“克隆”人口数据。

进一步，作者查阅了截至2020年发表在“五大”（AER、QJE、RES、JPE、Econometrica）经济学期刊上的每一篇引用MJ的论文，他提出三处争议：

一是日期。1500年是MJ数据中对大多数欧洲国家人口进行可靠估计的最早年份，这些国家往往拥有最有根据的估计。但有几篇文章在很大程度上依赖于MJ对1500年以前人口的估计，如Nunn（2008）、Ashraf and Galor（2011）和Nunn and Qian（2011）。

二是MJ人口数据是作为因变量（结果变量）还是自变量（原因变量）。作者认为，在经典误差假设下，它对研究的影响最小，如Ashraf and Galor（2011，2013），在其他情况下，计量估计以不可预知的情形存在偏差。

三是学者对MJ数据误差的处理。Acemoğlu, Johnson, and Robinson （2002）和Acemoğlu et al.（2008）使用IV方法应对回归中的测量误差。Nunn and Qian（2011）认为，对于长时间范围和广泛横截面的历史数据来说，准确性是一个问题，但经典测量误差不会使回归估计产生偏差，并且随时间或国家变化的系统测量误差都由固定效应捕获。显然，这种极端的假设不太可能，难以同时为真。

时至今日，多位学者通过将历史估计与一些推理相结合提供了改进估计，MJ人口数据与新近估计的人口差异很大，如1600—1650年MJ估计人口年均增长0.32%，Wrigley and Schofield将这一数值提升至0.5%；1700—1750年MJ人口年均增长0.1%，Wrigley and Schofield估计为0.26%。产生差异的可能原因是MJ忽略了17世纪下半叶的人口停滞，以及低估了18世纪上半叶的人口增长。

也许，有学者秉承有数据总比没有数据好的观点。但本文作者认为，尽量谨慎、小心使用含误差信息较多的数据总是有益的。

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

【量化历史研究】好的量化需要好的数据：对世界人口数据质量的评估

亲爱的凤凰网用户:

第三方浏览器推荐: