深度 | 摸底印度04：官方劳动力市场统计缺失，民营数据应怎么看？

作者：郑潜
来源：南亚研究通讯
原文：微信公众号原文
本文共11678字阅读预计约30分钟

一、概述印度私营的经济监测中心“Centre for Monitoring Indian Economy，CMIE”的劳动力相关调查数据出自该机构自2014年开始经营的付费产品“Consumer Pyramids Household Survey，CPHS/消费者金字塔家庭调查”【注1】。消费者金字塔家庭调查（以下简称“金字塔调查”）由四大模块构成、各大模块分别下设四个小模块；就业与失业相关调查数据属于“People of Indiadx/印度民生概况数据库”大模块之下的“Employment/就业状况”小模块【注2】（图1.4.1）。

【注1】除非另有区别说明，本篇以印度经济监测中心就业与失业调查数据泛指出自消费者金字塔家庭调查的就业与失业调查数据，两者并用。【注2】相对于从2009年开始进行的旧版印度民生概况数据库调查始于2009年（样本根据2001年人口普查制定）。2013年根据2011年人口普查对原有样本进行更新后，新版印度民生概况数据库调查从2014年开始延续至今。就业状况模块始于2016 年。消费者金字塔家庭调查。来源：印度经济监测中心。制图：郑潜。金字塔调查主打三大卖点：（一）大样本调查覆盖面——最新信息显示整体覆盖分布全印度超过 23.7万个家庭单位，其中印度民生概况数据库覆盖128万人、收入金字塔数据库覆盖49.7万人；

（二）纵向调查方法——针对大样本家庭采访组合长时间反复进行追踪回访调查；（三）高频率调查——每年分为3波、每波横跨4个月进行追踪回访（即理论上达到追踪每个样本在每年三波时间点的就业/失业状况变化。每一波调查进行期间根据初步调查结果“实时”对外发布数据（其中头条包括30天滚动平均失业率、消费者信心、消费者展望等指数）。此外，每一波调查结束后其结果在数日之后便向付费订户发布，相比之下突出了全国抽样调查的惯例性滞后发布（加上不时扣押报告不发等不确定性）显得印度官方“效率低下”等争议。

按照适时既有的印度官方全国抽样调查更新规律，继2011-12年五年一轮的“National Sample Survey-Employment and Unemployment Survey，NSS-EUS/全国抽样就业与失业调查”之后（以下简称“抽样调查”），理论上新一轮调查应当最迟在2016-17启动。事实上莫迪政权停止推动新一轮调查，而是迟至2017年4月才以改造的名堂启动新的“Periodic Labour Force Survey，PLFS/定期劳动力调查”（以下简称“定期调查”）；

而且改造后的首份报告迟至2019年5月莫迪政权确认胜选蝉联执政之后才面世发布。同时，由劳工事务局负责执行的年度就业与失业调查（以下简称“年度调查”）也在2016-17年落幕。印度经济监测中心正是在这一段空窗期拓展印度民生概况数据库产品范畴、开始涉入就业状况调查业务继而将该产品发扬光大，颇有以“牝鸡司晨”之势驾临官方调查之上、被商业界和舆论界视为不成文的标杆数据。或许时机纯属巧合、又或许归功于印度经济监测中心经营者的灵敏商机嗅觉，但不能排除或许是幕后势力的暗中运作结果【注3】。

【注3】围绕定期劳动力调查改造操作以及首份报告引发的争议，莫迪铁杆支持者、印度人民党非官方喉舌《Swarajya/自立报》主编R．Jagannathan/贾哥如是评价：“人们不得不责怪莫迪政权在创建正确的就业调查设计和建立必要的基础设施以收集每月（或至少每季度）就业数据方面不够积极主动。如果印度经济监测中心能做到【及时更新和发布就业数据】，以政府机器能力所及范围内可以调动的无限资源和人才，难道还搞不过区区一家私营机构？这显然只能是【莫迪政权】缺乏政治意愿所造成。”（贾哥《The Jobs Crisis in India/印度就业危机》，2018年）。

印度历史学者Nikhil Menon/尼基尔·梅农则如是评价：“由于资金不足，【印度官方】数据统计制度已经衰败，而政治干预使之加剧… ‘good data isn't always good politics /把政治玩溜并不一定是以真实的统计数据为前提’，因此《全国抽样调查报告》被扣押、其他调研如果透露了政治上令人不安的事实时便会被叫停。”（尼基尔·梅农《Planning Democracy: How a Professor, an: How a Professor, an Institute, and an Idea Shaped India/规划民主：一名教授、一家研究所和一个理念如何塑造印度》，2022年）。

卸任印度国家统计委员会（National Statistical Commission，NSC）代理主席的莫哈南（P.C. Mohanan）在其媒体撰文中【注4】提出，金字塔调查数据被外界广为参照引用正是拜官方就业统计系统不足所赐，并相当认可前者以“实时”方式对外发布的优势（即第三个卖点）。2016年末“Demonetization/废钞令 1.0”突击式出台之后，金字塔调查数据因“实时”发布该举措导致的就业和收入影响并一炮而红。【注4】《NDTV Profit/新德里电视台盈利》《Rebuilding India's Employment Statistics System/重建印度的就业统计系统》，2021年7月8日。

此外，新冠疫情高峰期间印度经济监测中心及时调整调查方法、改用电话等非面对面方法继续推进金字塔调查，其不中断的纵向调查方法（即第二个卖点）在印度官方断更一个季度（即2020年10月至12月季度）的衬托之下形成鲜明对比，为金字塔调查加分的效果不言而喻。然而印度官方一再质疑和否定印度经济监测中心的数据可信度。印度统计和计划执行部不点名公开反驳【注5】：“私营组织进行的调查一般既不科学也不基于国际公认的规范。”客观而言，针对印度经济监测中心数据可信度的质疑和批判并非能以简单的亲莫迪或反莫迪作为泾渭分明的政治立场区分，这一点可从下节学术性纵向和横向比较获得印证【注6】。

【注5】印度统计和计划执行部新闻文告，2023年1月4日。【注6】参见《中印梵华》《莫迪经济学鉴赏》《

六、油条经济学就业论》，2023年8月1日。

二、纵向比较以下

根据两份具有代表性的学术性评论，节摘评论中纵向比较部分概要展示金字塔调查可能存在的多个问题：➤ 学者Anmol Somanchi/安莫尔·索曼奇主要针对金字塔调查进行横向比较但在纵向比较方面也着墨颇深【注7】，并批判该调查采用的抽样设计与标准抽样方法截然不同，性质上非常诡异且乖离正统，或许是该调查结果自带偏差的根源；【注7】AnmolSomanchi/安莫尔·索曼奇《Missing the Poor, Big Time: A Critical Assessment of the Consumer Pyramids Household Survey/离谱地忽略了贫困群体：对消费者金字塔家庭调查的批判性评估》，2021年。

Anmol Somanchi 图源：索曼奇推特➤ 学者Jesim Pais/杰西姆·派斯和Vikas Rawal/维卡斯·拉瓦尔联名撰写的评论仅针对印度民生概况数据库进行评论【注8】，并指出该数据库包括调查设计与方法不符合规范、调查结果带有特定偏向因此可信度存疑。【注8】Jesim Pais/杰西姆·派斯和 Vikas Rawal/维卡斯·拉瓦尔（Society for Social and Economic Research/社会经济研究学会）《CMIE's Consumer Pyramids Household Surveys: An Assessment/印度经济监测中心的消费者金字塔家庭调查：评估》，2021年。

Jesim Pais（左），Vikas Rawal（右）与调查报告封面图源：梵华派斯和拉瓦尔的报告中关键点如下：（一）调查设计印度经济监测中心（CMIE）的金字塔调查人员使用装载在智能手机的线上应用程序进行调查，CMIE网站上提供的调查文档——包括：调查人员指导手册、结构式访谈问卷、记录访谈采集数据的格式化表格、等等——不完善、不整全、不断更改（且没有完整系统记录两波调查之间对最新一波调查文档进行的更改）。线上应用程序的记录介面没有完整展示访谈提问或变量描述，在此缺乏完整文档参照的情况下，派斯和拉瓦尔（2021年）推论调查人员实地遇到疑问时或者根据其主管的临时建议解疑、甚至自行拿捏凑合，因此影响采集信息的可信度。

实际上金字塔调查人员没有根据一份格式化调查问卷逐点提问，而是与家庭户主聊家常式把多个问题交织在一起提问。这一点从调查文档显示访谈提问句子构造含糊不清可见一斑。例如：针对“就业状况”，调查文档中用了长达1,400 字的词语描述分别解释四个状况类别（“就业”；“失业、愿意工作并积极寻找工作”；“失业、愿意工作但不积极寻找工作”；“失业、不愿意工作且不积极寻找工作”）的含义。然而调查文档显示具体向受访者提问仅是简单的一句话：“截至今天，家庭成员的就业状况如何？”换言之，该提问不仅使用术语，还假设受访者精准掌握四个状况类别的概念。

派斯和拉瓦尔（2021 年）指出这类提问可能对于受访者而言毫无意义，更遑称能够采集到可信的信息。就“家庭单位”的定义，调查文档并没有清晰的说明指示。派斯和拉瓦尔（2021年）引述印度经济监测中心总裁在某油管频道中的说明——金字塔调查定义所谓“家庭单位”关键条件是“物理结构和设施，如厨房、阳台、或电力连接”【注9】，从而指出该调查实际上是针对“居住单位”进行调查，概念上错误地将之与“家庭单位”混为一谈。此外，该调查以“物理结构和设施”作为定义关键条件意味着流离失所和委身在缺乏无物理结构的临时遮蔽点的所有人口和家庭都自动被排除在该调查范畴之外。

【注9】相对而言，根据印度官方全国抽样调查（以及印度人口普查和许多其他大规模调查）采用的定义，“家庭单位”指“通常在一起居住、一起吃饭的群体（后者通常表述为'eating from a common kitchen/吃同一厨房做的饭'”）。然而，以物理结构存在的厨房并非该定义的必要或关键条件。大样本调查适用多阶段抽样方法以确保随机性。金字塔调查宣称按照这一概念设计但落实到实际执行却走了样。该调查不采用惯用的“probability-proportional-to-size，PPS/概率与规模成正比”方法进行村庄和城镇抽样，而是自行设计了一个新方法：针对村庄，不考虑人口规模，仅仅通过简单的随机抽样选择村庄；

针对城镇抽样，根据人口规模先将所有城镇简单分为四个类型后，再从每一类型中随机抽取一个城镇。索曼奇（2021 年）指出新方法抽取的样本随机性效果不如“概率与规模成正比”方法。在从经抽样选出的村庄和城镇中进一步抽选居住单位样本阶段，因缺乏明确的抽样框架，身处实地的调查人员从村庄/城镇的主要/中心地点为起始点通过所谓“random walk/随机游走”方法认定和选择居住单位采访样本，实质选择过程又因缺乏抽样框架规范，所以严格上并不符合随机意义（即不符合该村庄/城镇街区的每栋居住单位都具有同等的被选概率）【注10】。

该调查的设计忽略了印度老百姓多按照种姓集群而居、上层种姓/富裕家庭通常集聚在村庄/城镇的主要/中心地点的国情，这一不规范导致样本偏向抽选特定种姓群体、忽略特定种姓群体、上层种姓/富裕家庭样本偏多等偏差，整体样本代表性失真【注11】。【注10】全球和印度的多种调查都是在类似消费者金字塔家庭调查所面临的客观限制下灵活变化采用“随机游走”方法进行家庭抽样。其它调查大都非常谨慎地从村庄/城镇随机起始点开始采样以确保随机性，有别于消费者金字塔家庭调查诡异地以村庄/城镇主要/中心地区作为固定的采样起始点。

【注11】学者 Anmol Somanchi/安莫尔·索曼奇和Jean Drèze/约翰·德雷兹也在媒体上撰文提出这一质疑。《Economic Times/经济时报》《New barometer of India's economy fails to refect deprivations of poor households/印度经济的新晴雨表未能反映贫困人口的贫困家庭》，2021年6月21日。索曼奇和德雷兹（2021年）也指出印度经济监测中心与National Family Health Survey，NFHS/全国家庭健康调查等其它国家统计数据之间在识字率和资产所有权等某些指标存在巨大差异。

德雷兹是诺贝尔经济学奖得主Amartya Sen/显老大的学术创作搭档，或许因为面子够大，印度经济监测中心总裁 Mahesh Vyas/马赫什·维亚斯亲自在媒体上撰文进行了解释与答疑。金字塔调查抽样设计导致出现高度倾向城镇样本的偏差。索曼奇（2021年）测算后得出2019年9月至12月波调查中，城镇与村庄样本比重（65%:35%）高度偏向前者，并因调查的设计将这一偏差“植入”随后每一波调查，体现为纵向偏差。由于上述有违随机性的抽样设计（加上部分样本退出、掉队、被遗漏、或因其它原因中途被替换等因素），金字塔调查中所有样本一律被赋予等值比重导致统计估计自带偏差。

此外，由于缺乏明确的抽样框架规范，样本比重是根据人口粗略测算得出，加上对样本比重进行人为随意调整【注12】，进一步导致统计估计偏差的加剧。【注12】消费者金字塔家庭调查人为调整样本比重的情况包括：因应补足/代偿低采访回复率的需要；作为代表/代偿调查覆盖不及的地区，通过针对所谓相似地区样本的比重人为调整。金字塔调查在2015年和2017年针对样本进行重整，加上每一波正常出现新旧样本替换，该调查实际上直到2015年才建立了一个相对稳定的样本。到了2019年第18波调查，从2014年第1波调查开始不间断追踪回访的比例为67%【注13】，因此索曼奇（2021年）指出该调查是否符合纵向调查的定义存疑。

【注13】如果综合从第1波至第18波调查创建一个统计时间跨度上具备“均匀”意义的家庭组合，接受过第1波调查的家庭只占该组合17%比例。（二）调查方法金字塔调查执行团队规模不大，派斯和拉瓦尔（2021年）研究覆盖时间该团队共有约300位调查人员，随时约200位调查人员分布在印度各地进行实地调查。假设工作强度为每月25天、每天8个小时，每位调查人员每天必须采访超过6户家庭（每户家庭采集300个变量），由两名调查员组成的小组每天必须完成走访一个村庄和城镇的“enumeration block/枚举普查区块”，意味平均每分钟必须完成3.75个提问。

派斯和拉瓦尔（2021年）根据以上假设和平均值推论得出的结论是：调查完成度大有水分、调查数据质量高度存疑。派斯和拉瓦尔（2021年）提出一系列值得进一步研究的疑问，质疑印度经济监测中心是否真的有效确保长时间的纵向调查持续不中断，例如：如何抵消受访者的回访疲惫？是否有向受访者提供物资激励以确保他们不厌其烦参与每年三波的千篇一律回访？新冠疫情高峰期间采用的电话采访方法是否真的能够有效针对每户家庭采集300个变量？完成采集300个变量的电话耗时多长？……等等。（三）调查结果金字塔调查结果显示无法采集到超过30%的样本的种姓或宗教信息。

对此印度经济监测中心归咎于部分受访者不愿回复或无法回复种姓或宗教相关提问。派斯和拉瓦尔（2021年）强调印度官方抽样调查、人口普查、种姓社会经济调查的其它大样本调查并没有遇到/没有反馈这一难题。从2017年末开始，金字塔调查数据显示6-21岁群体的就学率骤然上升，尤其6-11岁群体数据一举蹿升超过20%、16-21岁群体数据则截至2021年累积上涨超过20%（图1.4.2）。该段时间印度教育界并没有发生惊天动地的变化，导致异常变化的唯一可能性是该调查从2017年末那一波调查开始加入大量的新样本，但也因此对从2014年开始的整体数据系列可信度造成负面影响【注14】。

【注14】索曼奇（2021年）也指出印度经济监测中心与与其他具有全国代表性的数据集之间也存在其它显着差异，包括：人口的年龄分布、性别比例、和消费支出。消费者金字塔家庭调查数据显示从2017年末开始，6-21岁群体的就学率骤然上升，变化匪夷所思。图源：派斯和拉瓦尔《印度经济监测中心的消费者金字塔家庭调查：评估》，2021年。

三、横向比较除了索曼奇（2021年）、派斯和拉瓦尔（2021年），若干学术性评论也将消费者金字塔调查与定期调查等印度官方调查进行了横向比较分析，以下节摘概要展示：➤ 学者Rosa Abraham/罗莎·亚伯拉罕和Anand Shrivastava/阿南德·施里瓦斯塔瓦重点关注确立定期调查（包括之前的年度调查）和金字塔调查之间的可比性【注15】；

【注15】Rosa Abraham/罗莎·亚伯拉罕和Anand Shrivastava/阿南德·施里瓦斯塔瓦《The Indian Journal of Labour Economics (2022) 65:321–346 /印度劳动经济学杂志（2022）65：321–346》《How Comparable are India's Labour Market Surveys?/印度劳动力市场调查是否具有可比性？》，2022 年。➤ 学者Mrinalini Jha/姆里纳利尼·贾和 Amit Basole/阿米特·巴索莱针对金字塔调查和定期调查的劳动收入估计数据进行横向比较【注16】。

【注16】Mrinalini Jha/姆里纳利尼·贾和 Amit Basole/阿米特·巴索莱（Centre forSustainable Employment，Azim Premji University/阿齐姆·普雷姆吉大学，可持续就业中心）《Labour incomes in India: A comparison of PLFS and CMIE-CPHS data/印度劳动收入：定期调查和金字塔数据的比较》，2022 年。（一）概念框架金字塔调查采用每年三波针对同一个样本进行长期追踪回访调查方法。

定期调查针对城区进行季度调查（即一年4次）和针对乡区进行年度调查（即一年1次），每个样本一年只采访1次，新一年的调查不对上一年覆盖的同一个样本进行回访。金字塔调查和定期调查针对就业和失业状态的参照时间不具备直接可比性，提问方式截然不同：➤ 定期调查设计了多个不同的提问，据此分别采集并得出四种不同的时间段（1年/365 天、1 个月/30 天、1周/7 天和1天）的就业和失业状态【注17】。严格意义来说，前三种时间段指采访对象之的“个人”状态，有别于第四种“1天”时间段是指采访对象之“个人当天（即人-天）”状态【注18】。

【注17】Usual Status，us/正常就业状态，涵盖 Principal Status，ps/主要就业状态（365天）和 Subsidiary Status，ss/附属就业状态（30天）；Current Weekly Status，CWS/当前一周就业状态；Current Daily Activity Status，CDS/当前一天活动状态。【注18】当前一周就业状态（CWS）实际上是综合7天之中每1天的当前一天活动状态（CDS）得出的平均情况。➤ 金字塔调查把整个就业状态的采集浓缩在一个综合提问当中，参照的时间指调查当天或前一天，但对于那些平素就业但在调查当天或前一天没有出勤的采访对象也归类为就业状态。

实际上，金字塔调查的就业和失业状态定义是以较短的“1天”时间段综合了定期调查反映的365天主要就业状态和30天附属就业状态，并且在概念上与定期调查的“1人-天”不具备直接可比性。金字塔调查和定期调查针对就业收入的调查设计也不具备直接可比性：➤ 定期调查针对收入的提问是以就业状况为前提，换言之收入提问采访范畴排除了失业者（即假设失业者没有就业收入）。➤ 如上节图1.4.1所示，金字塔调查收入数据属于“Income Pyramiddx/收入金字塔数据库”模块的范畴，有别于印度民生概况数据库——就业状况模块。

这一范畴划分在实际执行中体现为针对收入进行独立提问，而并非建立在针对就业状况提问的前提之下，因此可能采集到不属于就业收入性质的收入信息。此外，针对收入的提问需要采访对象回忆横跨 4 个月时间段，有别于针对收入的提问仅需要采访对象提供当月（实际上是调查当天或前一天）的回忆，两者参照时间段不一致。（二）分类规范定期调查采用印度官方制定、分类较为细腻的“National Industrial Classification，NIC/印度国家产业分类”（分为21大类、下设一共91小类产业）和“National Classification of Occupations，NCO/印度国家职业分类”（分为9大类、下设一共50小类职业）。

金字塔调查采用印度经济监测中心自行制定的产业分类和职业分类系统，与官方分类比较略显笼统。以“专业人士”职业为例，2015 年印度国家职业分类中专业人士大类分为6个小类（科学与工程专业人士；卫生医疗专业人士；教学专业人士；商业和行政专业人士；信息和通信技术专业人士；法律、社会和文化专业人士）。相比之下印度经济监测中心自行制定的职业分类系统在“受薪雇员”大类之下设了 1 个笼统的“白领专业人士和其它雇员”小类涵盖各种类型的“专业人士”。

（三）调查结果：就业和失业状况亚伯拉罕和施里瓦斯塔瓦（2022年）将原始数据处理转化为具有可比性之后【注19】，发现在男性劳动力群体方面，金字塔调查预测/契合定期调查结果（“CMIE- PLFS”预测方式）准确率超过83%，预测失准率（所谓“LFP 高估”和“LFP 低估”）分布相对平均（图1.4.3）。这意味定量模式无法捕捉的因素造成的偏差没有特定偏向性、和/或偏差随机分布并自我抵消。其它定量分析方法也印证了这一结论。整体而言，尽管概念框架和分类规范等方面不尽相同且不具备直接可比性，定期调查和金字塔调查针对男性劳动力群体就业和失业状况调查结果具有较高的可比性。

【注19】亚伯拉罕和施里瓦斯塔瓦（2022年）筛选了相同时间段的数据，并运用了定量模式将不具备可比性的原始数据转化为具有可比性的模拟抽样调查结果。量化模式处理和比较以双向方式进行：

一、模拟金字塔调查抽样结果并分别与原始金字塔调查抽样结果和原始定时调查抽样结果进行预测/比较；

二、反过来模拟定时调查抽样结果并分别与原始定时调查抽样结果和原始金字塔调查抽样结果进行预测/比较。针对男性劳动力群体，金字塔调查和定期调查具有较高的可比性。图源：亚伯拉罕和施里瓦斯塔瓦《印度劳动力市场调查是否具有可比性？》，2022 年。在女性劳动力群体方面，亚伯拉罕和施里瓦斯塔瓦（2022 年）发现金字塔调查预测/契合定期调查结果（所谓“CMIE-PLFS”预测方式）准确率约77%，然而预测不准确率体现了明显的“LFP 低估”偏差（约 22%）；其它三个预测方式的结论都与“CMIE-PLFS”预测方式的结论类似（图 1.4.4）。

➤ 即便调整分析方式，以定期调查中四种不同时间段就业和失业状态（图1.4.5），以各邦的数据（图1.4.6）切入进行预测，“LFP 低估”偏差依然明显。换言之两个调查针对相当大幅比例的女性劳动力是否属于劳动力群体一份子——定期调查偏向肯定、金字塔调查偏向否定——存在高度分歧、不具备可比性。针对女性劳动力群体，四个预测方式都显示金字塔调查和定期调查不具有可比性。图源：亚伯拉罕和施里瓦斯塔瓦《印度劳动力市场调查是否具有可比性？》，2022年。针对女性劳动力群体，四种不同时间段就业和失业状态一致显示金字塔调查和定期调查不具有可比性。

图源：亚伯拉罕和施里瓦斯塔瓦《印度劳动力市场调查是否具有可比性？》，2022 年。针对女性劳动力群体就业状况，各邦的数据也显示金字塔调查和定期调查不具有可比性。图源：亚伯拉罕和施里瓦斯塔瓦《印度劳动力市场调查是否具有可比性？》，2022年。➤ 进一步针对“CMIE-PLFS”预测方式定量分析显示，出现明显“LFP 低估”偏差的细分群体包括低教育程度和无偿家庭佣工（unpaid family workers）【注20】。由于女性低教育程度比例、无偿家庭佣工比例都较男性高，导致两个调查之间出现特定偏差的原因呼之欲出。

必须指出，定量分析也显示“regular salaried workers/正常受薪佣工”和15岁至20岁青少年群体出现明显“LFP低估”偏差，因此合理推论导致“LFP 低估”偏差的原因不限于女性劳动力群体特有因素。【注20】所谓“无偿家庭佣工”指在“家庭企业”中从事工作但不领取固定薪资或工筹的家庭成员。所谓“家庭企业”并不专指经官方正式注册、具有独立法定身份的实体，而是包括以依附家庭成员个人身份形式存在，构成非正规领域一部分。➤ 导致“LFP 低估”偏差的原因包括上节所述两个调查之间的概念定义、抽样办法、提问方式等调查设计差异。

派斯和拉瓦尔（2021 年）也提出因实地调查工作强度与调查执行团队规模不匹配，怀疑金字塔调查人员当中出现以完成每日调查数量指标为重而敷衍提问的不规范操作，其后续结果是牺牲了调查数据质量。此外，派斯和拉瓦尔（2021年）也指出金字塔家庭调查显示从2014年至2021年期间，城镇男性中，商人、专业人士、和企业家职业的比例显著上升，自雇从事非正规企业（小贩、无固定点的小商贩）和从事临时工的比例急剧下降。另一方面，农村男性中，大型/市场导向型农民【注21】的比例显著上升城镇男性，小型农户的比例没有上升，而农业劳动力和非农业临时工的比例则急剧下降。

派斯和拉瓦尔（2021年）强调该调查这一系列趋势变化——尤其城镇就业所谓“企业家化”和“专业人士化”趋势—— 有违常规认识，并有悖于其他数据所显示的劳动力市场“casualisation ofemployment/就业临工化”趋势【注22】。【注21】消费者金字塔家庭调查中“大型/市场导向型农民”术语等同舆论界普遍使用的“有组织领域（或正规领域）农民”。【注22】人口普查和国家统计局的数据都表明农村劳动力中雇佣体力劳动者/农业劳动力的比例呈上升趋势，自雇农民/耕种者比例下降。同时，大量证据表明城市劳动力市场的“casualisation of employment/就业临工化”程度趋向攀升；

印度经济监测中心把这一现象展示为“城市就业企业家化”恰好与莫迪政权应对“jobless growth/无就业性经济增长困局”的思路不谋而合，莫非莫迪政权是从印度经济监测中心获得灵感而推出油条经济学就业论？（四）调查结果：劳动收入贾和巴索莱（2022年）将原始数据处理调整为具有可比性之后【注23】，发现无论处理方法和假设，金字塔家庭调查之下的劳动收入平均值和中位数始终高于定时调查：在结合就业与收入处理之下，方差在13%至 80%幅度；在纯收入处理之下，方差在5%至 27%幅度（图1.4.7）。

此外，无论处理方法和假设，城镇数据方差都低于乡区数据方差（除外1例【注24】城镇数据方差为30%、乡区数据方差为28%）。【注23】贾和巴索莱（2022年）针对原始金字塔调查数据进行两种处理：

一、结合就业与收入处理（结合就业状况模块和收入模块数据，只针对有申报就业的样本计算劳动收入；采取不排除零收入和排除零收入两种假设）；

二、纯就业处理（忽略就业状况模块数据，只从收入模块中

根据“申报劳动收入大于零”的条件筛选和识别就业的样本）。【注24】例外出现的场景设置为：“结合就业与收入处理”方法，“不排除零收入样本”假设。在纯就业处理之下，城镇劳动收入平均值（金字塔家庭调查：17992 卢比定时调查：17122卢比）的 5%方差是两个调查之间出现最小方差的场景。图源：贾和巴索莱《印度劳动收入：定期调查和金字塔数据的比较》，2022年。上节所述两个调查之间不同的调查设计——尤其是金字塔家庭调查采取的所谓“随机游走”采样方法严格上不符合随机意义并导致偏向抽选上层种姓/富裕家庭样本——应该是两个调查之间劳动收入方差有特定方向偏差的的根本原因。

金字塔家庭调查数据在纯就业处理之下方差较小、表面上与定时调查具有可比性，然而理论上不伦不类：毕竟纯就业处理意味着完全忽略就业状况模块数据（即完全只采用收入模块数据），因此不符合常规就业和失业状况调查的概念。值得注意的一点是两个调查一致显示印度劳动收入分布有两个共同点：➤ 第 95个百分位数：全印度收入分部中的前5%人士每月收入约50,000 卢比（约合4336人民币，2024年5月1日汇率）；【梵华：该数据意味着两个调查都说明印度中产阶级人数规模约为7千万人，该数值与皮尤研究中心（Pew Research Center）2021年的推论数值约8千万人相近，但是依然远高于根据印度莫迪政府2019-20临时预算惠及中产阶级规模所提及的3千万人的数值。

】➤ 中位数：全印度50%的劳动力收入低于全国最低工资标准（城镇：每天 430卢比/每月10,750 卢比（约合每月932人民币，2024年5月1日汇率）、乡区：每天375 卢比/每月9,375 卢比（约合每月813人民币，2024年5月1日汇率））。（五）统计估计印度国有银行领头羊——State Bank ofIndia，SBI/印度国家银行发表的研究分析【注25】发现从 2018年6月至2023年6月期间，两个调查的城镇季度失业率平均值高度相近【注26】：定时调查：9.6%、金字塔调查：9.0%；

然而，金字塔调查数据概率分布的偏度【注27】和峰度都高于定时调查数据概率分布（如下图）。【注25】SBI/印度国家银行《PLFS Survey/定期劳动力调查》，2023年11月14日。【注26】印度国家银行（2023年）并未针对定时调查和金字塔调查城镇季度失业率平均值高度相近的现象提出任何解释。此外，合理猜测印度国家银行（2023年）并未对两个调查的原始数据进行类似亚伯拉罕和施里瓦斯塔瓦（2022年）的量化处理（即确保两者具备统计意义上的可比性）后才进行比较，因此印度国家银行（2023 年）的所谓‘发现’缺乏学术性研究的严谨，其所谓“结论”可信度存疑。

【注27】印度国家银行（2023年）并未针对金字塔调查城镇季度失业率概率分布右偏略高的现象提出任何解释。定时调查和金字塔调查的城镇季度失业率数据概率分布比较。图源：SBI/印度国家银行《PLFS Survey/定期劳动力调查》，2023年11月14日。针对金字塔调查概率分布峰度为定时调查概率分布约双倍之高的现象，印度国家银行（2023年）提出两个解释：➤ 不同社会阶层的抽样概率差异：所谓“随机游走”采样方法严格上不符合随机意义并导致偏向抽选上层种姓/富裕家庭样本；➤ 不同社会阶层的流动率差异：社会上层家庭样本就业和收入较稳定，因居所地址较稳定故大部分样本长期被金字塔调查纵向追踪覆盖；

社会下层家庭样本就业和收入较不稳定，因居所地址变动频率较高而新旧样本替换率较高。

四、结语在莫迪政权重

在宣扬撩人叙事、略于提供数据的背景下，外界单纯依赖印度官方定时调查建立对于印度劳动力市场的正确认知和判断颇有困于瞎子摸象的窘境。印度经济监测中心经营的付费性质金字塔调查为这一窘境提供了一定的疏解。相较于学术性研究整体上偏向于质疑（甚至否定）金字塔调查，印度商业界和舆论界从实用性角度大体上接纳并认可金字塔调查（甚至视之为不成文的标杆数据）。客观而言，学术性研究证实了从符合国际统计优良实践规范的角度，印度官方定时调查绝对优于金字塔调查。

然而，只要莫迪政权始终无法（或不愿意）拿出政治决心建立具有全面覆盖性和及时发布性的就业统计系统（而仅寄望于通过政治语言贬低金字塔调查等“竞争对手”），金字塔调查因其主打的三大卖点（尤其所谓“实时”对外发布数据的卖点）将继续获得外界接纳作为弥补（甚至替代）经改造但尚存诸多不足的印度官方就业统计系统。作者简介：郑潜，东南亚华裔，应用经济学学历，研究兴趣方向包括印度。

本文转载自“中印梵华”微信公众号2024年5月1日文章，原标题为《摸底印度04：劳动力市场篇之印度经济监测中心调查》。本期编辑：杨春雪穆祎璠