辖区规模、地方政府治理与经济发展

《财经研究》
2024第50卷第8期

引用本文

程小萌, 李咚咚, 马光荣. 辖区规模、地方政府治理与经济发展——基于乡镇撤并的研究[J]. 财经研究, 2024, 50(8): 94-108. 复制到剪切板

Cheng Xiaomeng, Li Dongdong, Ma Guangrong. Jurisdiction scale, local governance, and economic development: a study based on township mergers in china[J]. Journal of Finance and Economics, 2024, 50(8): 94-108. 复制到剪切板

辖区规模、地方政府治理与经济发展——基于乡镇撤并的研究

程小萌¹ , 李咚咚² , 马光荣³

1. 首都经济贸易大学财政税务学院，北京 100070;
2. 北京大学马克思主义学院，北京 100871;
3. 中国人民大学财政金融学院，北京 100872

收稿日期: 2023-10-16

基金项目: 国家社会科学基金重大项目（21&ZD095）；教育部人文社会科学研究项目（23YJC790013）；首都经济贸易大学北京市属高校基本科研业务费专项资金（XRZ2023001）；中央高校基本科研业务费专项资金（24XNQZ03）

作者简介: 程小萌（1995− ），女，河北邢台人，首都经济贸易大学财政税务学院讲师;
李咚咚（1996− ）（通讯作者），女，陕西西安人，北京大学马克思主义学院博士研究生;
马光荣（1986−），男，山东泰安人，中国人民大学财政金融学院教授，博士生导师。

摘要: 行政区划调整在国家治理体系和治理能力现代化建设中具有基础性作用，近年来我国实施了乡镇撤并、县区合并等调整行政区划、扩大地方政府辖区规模的改革。文章基于乡镇撤并改革，从政府组织运行成本的角度，研究了地方政府辖区规模的决定因素及其经济效应。文章通过构建地方政府最优辖区规模的理论框架，分析得出上下级政府间沟通成本、政府工作人员知识水平、公共政策推行效果的可预测性、公共品规模经济程度和居民偏好异质性是决定地方辖区规模的重要因素。文章基于1997—2014年我国乡镇撤并数据与县级经济社会数据，发现在沟通成本较低、政府工作人员知识水平较高、公共政策推行效果可预测性较强、公共品规模经济效应需要发挥以及居民偏好异质性较低的地区，乡镇撤并的力度较大。文章进一步评估了乡镇撤并的经济效应，结果显示，乡镇撤并有利于改善当地的就业状况，提高政府的行政效率，节省财政开支和改善地方公共服务，进而促进当地的经济发展。文章认为，行政区划调整改革需要根据当地的经济社会条件，因地制宜，综合考虑辖区过大带来的管理成本上升和辖区过小导致的规模经济损失因素，统筹协调发展。

关键词: 辖区规模乡镇撤并政府治理经济发展

Jurisdiction Scale, Local Governance, and Economic Development: A Study Based on Township Mergers in China

Cheng Xiaomeng¹, Li Dongdong², Ma Guangrong³

1. School of Public Finance and Taxation, Capital University of Economics and Business, Beijing 100070, China;
2. School of Marxism, Peking University, Beijing 100871, China;
3. School of Finance, Renmin University of China, Beijing 100872, China

Summary: The adjustment of administrative divisions plays a fundamental role in modernizing the state governance system and capacity. In recent years, China has implemented a series of reforms to adjust administrative divisions and expand the scale of local jurisdictions, and the township merger reform is the most extensive and intensive among them. Based on the township merger reform, this paper explores key factors of optimizing the scale of local jurisdictions and evaluates whether the reform has achieved the policy goals of improving governance efficiency and promoting economic and social development. From the perspectives of government organization and operating costs, this paper constructs a theoretical framework for the optimal scale of local jurisdictions. It concludes that the scale of local jurisdictions is affected by key factors consisting of the internal communication costs between upper and lower levels of government, the knowledge acquisition level of government staff, the predictability of public policy implementation effect, the degree of economies of scale in providing public goods, as well as the heterogeneity of resident preferences. This theoretical work will not only contribute to the literature to a certain extent, but also provide general enlightenment for optimizing the scale of local jurisdictions. Using data of township mergers through the period 1997-2014, this paper subsequently verifies the conclusions of the theoretical model through empirical analysis. The results confirm that areas with lower communication costs, a higher level of knowledge acquisition, higher predictability of public policy implementation effect, more urgent need for economies of scale of public goods, and lower heterogeneity of resident preferences, have gone through greater extent of township mergers. Furthermore, this paper explores the economic effect of township mergers. The results show that these mergers are conducive to improving local employment conditions and local administrative efficiency, saving fiscal expenditures, improving public services, and promoting local economic development. The enlightenment of this paper is to fully consider the high governance costs brought about by excessively large jurisdictions as well as the loss of economies of scale caused by excessively small jurisdictions, and to implement further reforms based on local economic and social conditions.

Key words: jurisdiction scale township mergers government governance economic development

一、引　言

简约、精干的组织架构是决定地方政府治理效能的重要方面，党的十九届五中全会将优化行政区划设置作为全面深化改革的重要工作部署之一。近年来，我国以政府层级的扁平化改革为方向，在优化政府组织架构上进行了诸多探索，这主要体现在以下两个方面：第一，减少政府管理层级，通过经济管理体制和财政体制方面政府层级的减少来节约行政成本，如“强县扩权”“省直管县”“乡财县管”等改革；第二，不改变管理层级，通过行政区划间的合并，扩大地方政府的辖区规模，如乡镇撤并、县合并、区合并等。¹优化辖区规模是提升地方政府治理效能的重要手段，对促进区域协调发展具有重要意义。

乡镇撤并是我国行政区划优化中覆盖面最广、力度最大的改革。1998年以来，为了精简机构、减少乡镇行政人员、节约财政开支，我国各地区开展了一系列以乡镇撤并、扩大乡镇政府辖区规模为主的乡镇机构改革。根据国家统计局公布的数据，1997年我国乡镇总数为36697个，至2014年已减少至29168个，减少幅度超过20%。在此期间，各地区的乡镇撤并工作一直在持续进行，其中2000—2002年和2004—2007年间乡镇撤并尤为明显。

乡镇撤并改革不仅改变政府层级数量，同时还扩大乡镇政府的地域管理范围。而本文试图回答的两个问题是：第一，优化地方政府辖区规模应该遵循何种原则？第二，乡镇撤并改革是否达到了提高治理效能、促进经济社会发展的政策目标？事实上，不仅是中国，在世界范围内，很多国家都在推进合并行政区划、扩大地方政府辖区规模的改革，³但其原因和效果尚无定论。与此同时，另一些国家则拆分行政区划，缩小地方政府的辖区规模。⁴本文通过研究中国乡镇撤并改革，为优化地方政府辖区规模提供参考。

针对地方政府辖区规模问题的已有研究主要来自于经典财政分权理论。根据财政分权理论，民众对公共品的偏好存在异质性。辖区规模缩小的优势是各地方政府可以因地制宜地制定政策；劣势则是无法充分发挥公共品提供的规模经济效应，而且难以有效协调跨地区外部性政策。因此，地方政府的最优辖区规模是对辖区内民众偏好异质性和公共品规模经济两大因素权衡取舍的结果（Alesina等，2004）。本文认为，这一理论未从组织管理的角度考虑组织运行成本对辖区规模的影响。以乡镇政府为例，其辖区规模缩小将节约乡镇政府与所辖村庄之间的信息采集成本、沟通成本，提高公共品提供的效率，同时乡镇政府也可以更加科学地制定与推行政策。本文在Garicano（2000）构建的组织经济学模型基础上，探究了科层制政府组织中辖区规模的最优化问题，理论模型表明，公共品规模经济越重要，辖区规模可相应扩大；乡镇与村庄间的沟通成本越低、基层工作人员的知识水平越高、公共政策推行效果的可预测性越强，政府管理效率越高，那么乡镇政府的辖区规模也可以扩大。

基于1997—2014年我国乡镇撤并数据与县级经济社会数据，本文对理论假说进行了实证检验。结果显示，沟通成本、基层工作人员知识水平、公共政策效果可预测性和公共品提供的规模经济等因素是影响乡镇撤并力度的重要因素。根据这一结论，我国各地区已经实施了大规模乡镇撤并改革，其原因主要来自两个方面：第一，改革之前，我国乡镇辖区规模普遍太小，不利于发挥公共品提供的规模经济效应；第二，外界条件的变化降低了政府管理成本，提升了公共品提供效率，比如通信和交通基础设施改善使得乡镇政府和所辖村庄之间沟通成本降低，政府工作人员知识水平的不断提升以及公共政策效果可预测性不断增强。这也说明我国乡镇撤并应因地制宜地实施，对于地形复杂、交通和通信成本高、基层工作人员素质参差不齐、政策推行效果不确定性高以及原先乡镇所辖规模已经较大的地区，不宜再大规模推进乡镇撤并。事实上，民政部在2001年就发文指出，⁵各地区开展乡镇撤并工作要科学规划、合理布局，充分考虑行政管理需要、自然地理条件、行政区划历史沿革、群众习惯、民族宗教等方面因素，在撤并标准、力度和进度上不要求完全一致。

本文使用1997—2014年县级面板数据检验了乡镇撤并对县域经济社会发展的影响，结果表明乡镇撤并提高了县域经济发展水平，乡镇撤并幅度较大的地区，县域人均GDP、夜间灯光亮度、规模以上工业企业总产值等经济指标均明显提升。那么，乡镇撤并是否有利于财政资源在地区间更有效、更均衡地配置？本文研究显示，乡镇撤并有效改善了当地的就业状况，在节省财政支出规模的同时，也促进了县域公共品提供的改善。这一结果证明了乡镇撤并改革有利于发挥公共品提供的规模经济和节约财政成本。尽管辖区规模扩大可能会导致基层服务半径扩大,增加信息获取与沟通的难度，也不利于满足居民对公共品的异质性需求，但是规模经济的收益仍然大于这些成本。这从侧面说明各地区因地制宜实施的乡镇撤并总体上是有益于经济发展的。

本文的研究贡献主要体现在以下两个方面：一方面，在理论研究领域，本文研究与经典财政分权理论有所差异，本文考虑了在科层制政府中，政府的知识获取和内部层级间沟通交流对最优辖区规模产生的重要影响。这不仅能够填补已有文献理论模型的不足，还能为我国接下来优化行政区划设置，构建更加简约、精干、高效的政府架构提供参考。另一方面，在实证研究领域，已有文献讨论了政府层级结构中经济管理和财政体制扁平化机制改革的经济效应，而对我国乡镇撤并经济效应的研究较少。本文考察了乡镇撤并对经济社会发展的影响，为我国进一步深化乡镇机构改革提供参考。

本文的结构安排如下：第二部分为文献综述；第三部分介绍乡镇撤并制度背景；第四部分对政府最优辖区规模进行理论建模，分析影响乡镇撤并的重要因素；第五部分实证检验乡镇撤并的原因；第六部分是乡镇撤并对经济发展的实证研究；第七部分是结论与政策启示。

二、文献综述

（一）政府辖区规模改革的原因

已有文献主要从经典的财政分权理论出发，讨论政府辖区的最优规模（Miceli，1993；Alesina和Spolaore，1997；Bolton和Roland，1997；Ellingsen，1998）。这些文献大多认为辖区规模小的地方政府能够更准确、及时地把握当地居民的偏好，更好地满足当地居民对于公共品的异质性需求（Hayek，1945）。但是辖区规模大的地方政府则可以更好地利用公共品提供的规模经济，并且对于环境污染、公共安全等具有外部性的问题，可以在更大区域层面上统筹调度、统一管理，能够更有效地将外部性问题“内部化”，发生“搭便车”现象的可能性更小（Hawkins等，1991）。Alesina等（2004）在上述理论基础上构建模型，论证了地方政府的最优辖区规模是以下两种因素权衡取舍的结果：居民对公共品的偏好异质性越大，数量多而辖区规模小的地方政府更有优势；公共品提供的规模经济越明显，数量少而辖区规模大的地方政府更有优势。

还有一些理论指出了辖区规模扩大的另外两项收益：一方面，辖区规模大的地方政府往往具有更多的人才和更高的专业化程度，从而有更高的管理效率（Denters，2014）；另一方面，辖区规模大的政府更有利于财政资源在地区间更有效、更均衡配置，这对于当地长期经济增长是有利的（Keating，1995；Lowery，2000）。

但是，一些文献也指出，公共品提供的规模经济效应可能并不明显，而且规模经济对地方政府提供的各项公共品的影响并不一致，不同种类的公共品会支持不同的最优辖区规模（Boyne，1992；Miceli，1993；Dollery等，2008）。在提供资本密集型的公共品和基础设施服务时，由于固定成本可以分摊给更多居民，随着人口规模的增加，生产效率将达到更高的水平，从而获得潜在的收益。然而，在提供劳动密集型的公共品或服务时，随着需求规模的扩大，政府为了提供更多的产品或服务需要雇用更多的劳动力。因此，规模经济带来的效率和收益通常是不存在的。Holzer等（2009）认为，超过80％的市政服务是劳动密集型的，因此辖区扩大后规模经济的提升可能并不明显。

（二）政府辖区规模改革的经济影响

近年来世界上很多国家实施了行政区划合并和扩大地方政府辖区规模的改革。在理论方面，政府辖区规模扩大会带来正反两方面影响，其现实效果受到多种因素影响，现实中此类改革是否会提升当地的行政效率和经济效率呢？这还没有定论。在实证方面，有些研究表明政府辖区规模扩大确实能够促进经济增长（Owen，1992；Rusk，1993；Nelson和Foster，1999；Leland和Thurmaier，2010）；另一些研究则认为政府辖区规模扩大并没有影响经济增长（Blair等，1996；Feiock和Carr，1997）；还有一些文献试图探究辖区规模改革影响经济增长的中间传导机制，但并没有得到一致性的结论（Fox和Gurley，2006；Jimenez和Hendrick，2010）。由于地方政府区划合并、辖区规模扩大的改革在不同国家的推行效果不一致，中国开展乡镇撤并的合理性与现实效果还需要进一步检验。

三、乡镇撤并制度背景

1983年，中共中央、国务院提出“当前的首要任务是把政社分开，建立乡政府”，并规定“省、自治区、直辖市的人民政府决定乡、民族乡、镇的建置和区域划分，乡的规模一般以原有公社的管辖范围为基础，如原有公社范围过大的也可以适当划小”。⁶在这样的政策指引以及当时的背景下，新建乡的规模普遍变小，乡镇数量猛增。到1985年，全国政社分开、建立乡镇政府的工作基本结束，成立了约91000个乡镇政府（张新光，2007）。

为了精简机构、减少乡镇行政人员、减轻财政负担，很多省份开展了以乡镇撤并、扩大乡镇辖区规模为主要内容的乡镇行政区划调整工作。根据历年《中国县（市）社会经济统计年鉴》披露的各县下辖乡镇数量，1997—2014年间全国合计减少了7529个乡镇，减少幅度约为20.5%。图1显示，1997年我国县级行政区所辖乡镇的平均数量为18.9个，2014年这一数字减少为14.1个。1997—2014年间有1452个县实施乡镇撤并，其中数量减少幅度达到20%以上的有970个县，减少幅度达到40%以上的有379个县，如图2所示。⁸从图1也可以看出，1997年以来，乡镇撤并改革一直在持续推进。

图 1 各县所辖乡镇平均数量的变化趋势

图选项

图 2 乡镇撤并幅度的分布

图选项

资料来源：历年《中国县（市）社会经济统计年鉴》。

四、理论模型

（一）模型准备

与遵循科层制的企业组织类似，中国各级政府之间也具有明显的科层制属性。上级政府负责制定战略方针和政策，最基层的地方政府则是方针、政策的具体执行者。在科层制组织当中，各级人员的信息沟通是决定组织管理幅度的重要因素。在中国乡镇和村庄治理中，基层工作者的管理能力和知识水平有限，需要经常与上级进行沟通和获取专业的知识，因此各级人员的知识获取能力也是决定组织管理幅度的重要因素。本文借鉴Garicano（2000）的思路，从政府工作人员的知识获取和各层级政府之间沟通成本的角度出发，构建了政府最优辖区规模的理论模型。

考虑如下一个简化的政府组织结构：一国政府体系分为村庄和多级上级政府，其中上级政府自下而上分为乡、县、市、省、中央等共$ L（L=1，2，\dots ，L $）层，不限制$ L $为一个已知的固定数量。村庄是实际开展业务的最基层单位，履行提供公共品、发展当地经济等各类职责。⁹各级上级政府传达战略理念、提供政策指导并帮助其所辖村庄解决问题。本文将全部政府机构的工作人员总数单位化为1，其中村庄工作人员占比为$ {\beta }_{p} $，第$ i $级政府（$ i=1，2，\dots ，L $）的人员占比为$ {\beta }_{i} $，则$ {\beta }_{p}+\sum _{i=1}^{L}{\beta }_{i}=1 $。在此框架下，我们考虑政府组织的最优辖区规模问题。

为了简化分析，本文认为村庄的全部工作将带来可同质化衡量的总效果，称之为总产出。现假设中央政府制定了一套发展战略和方针，各级政府依此对生产生活等出台了一套相应的政策，而各个村庄负责具体实施这套政策。村庄的工作总体上分为两个步骤：村庄工作人员先要需要领会政策精神，了解政策落地的环境情况，在这一步需要投入学习相应知识的成本。然后需要理论与实践结合，将已获取的知识转化为实际工作，在这一步需要投入将知识落于实处的人力与物力。

我们考虑政府获取知识集的最优决策。假设政策推行过程中可能遇到的全部问题集合为$ \Omega \subset {\mathbb{R}}^{+} $，并假设其分布是可观测的。村庄工作人员的知识集为$ {A}_{i}\subset \mathrm{\Omega } $，实际推行政策时遇到的问题为$ Z $。当现实遇到的问题属于村庄工作人员可获得的知识集时，政策才有可能顺利推行，而只要$ Z\in \Omega $，该套政策就能够得以推行。¹⁰

假设政府事前知道$ Z $的分布情况，并会依此进行决策。为简便分析，我们假设$ Z $服从参数$ \mathrm{为}\lambda $的指数分布。¹¹实际上，$ \lambda $是对现实可预测性的一种衡量，反映了政府在落实政策时碰到出乎意料的问题和困难的程度。政府对其辖区的可预测性$ \lambda $越高，政府就能够更好地在政策落实前准备和学习，掌握有用的知识集，从而取得较好的工作成效。

为了更好地独立开展工作，工作人员理应尽可能扩大自己的知识集，以涵盖所有可能遇到的问题，但是知识集的扩大受其学习成本的限制。假设各层级政府的学习成本与所获得的知识集的大小为固定正比关系，即各层级政府获得$ \left[0,Z\right] $这样一个知识集的学习成本都是$ c\mathrm{Z} $。政府需要在获得更大的知识集以更好地开展工作与获取较小的知识集以节约成本之间权衡。于是，村庄的单位投入带来的总产出的期望是：

$ {E}\left(y\right)={P} {r}\left\{Z < {Z}_{a}\right\}-c{Z}_{a}={\int }_{0}^{{Z}_{a}}f\left(\phi \right){\mathrm{d}}\phi -c{Z}_{a} $

(1)

其中，$ {Z}_{a} $为地方政府的知识合集，即$ {Z}_{a}={z}_{p}\cup \mathbb{Z} $，$ {z}_{p} $为村庄的知识集，$ \mathbb{Z} $为各级上级政府知识集的并集，即上级政府掌握的全部知识。由于政府间可以沟通交流，工作人员可以相互询问以获得帮助，这样村庄的工作人员可以侧重掌握基层实际情况，在实际遇到政策相关的问题和困难时逐级向上级政府反馈、询问。为了简便分析，本文用时间的机会成本来衡量政府间上传下达的沟通成本，并假设被询问的政府无论是否能够解决问题都需要付出沟通成本，且第$ i $级政府单位沟通成本为$ {h}_{i} $。因此，第$ i $级政府人员占比$ {\beta }_{i} $是由基层所遇到的问题在询问第$ i $级以下政府均无法得到解决的概率决定的，即$ \left[1-{F}\left({Z}_{i-1}\right)\right]{h}_{i}{\beta }_{p}={\beta }_{i} $。第$ i+1 $级政府的人员占比则为$ {\beta }_{i+1}=\left[1-{F}\left({Z}_{{i}}\right)\right]{h}_{i+1}{\beta }_{p} $，由于$ {Z}_{i}={Z}_{i-1}+{z}_{i} $，则$ {\beta }_{i+1}{＜\beta }_{i} $，即较高层级的政府掌握着更加特殊问题的解决方法，且所需的人员比例较低。在大多数情况下，村庄工作人员自己习得知识比逐次向乡级、县级、市级等上级政府求助的成本更低，即$ {{h}_{1}c}_{c}＞{c}_{p} $，否则村庄可以令自己知识集为空集而只起到上传下达的“通道”作用。

接下来，我们考虑政府将已有的知识集转化为实际工作的情况。假设村庄已经按照上述过程获得了其最优的知识集，为了保证政策落实，政府要求村庄至少能够将$\bar {k} $的部分转化为实际工作。这种实际工作投入的绩效要求类似于固定投入，可以用来衡量提供公共品的规模经济的重要程度。除了政府绩效的最低要求外，村庄还有一部分可变的工作投入k，随着村庄工作人员增多，知识转化为实际工作的总量也更多。可变工作投入一方面与工作人员的数量$ {\beta }_{p} $有关，另一方面也与工作人员将知识转化为实际工作的效率$ {k}_{p} $有关。为了简便分析，我们假设可变工作投入与政府人员规模成比例，即$ k={k}_{p}{\beta }_{p} $。

（二）政府最优辖区规模模型建立

考虑整个政府体系的最优化行为，整个政府系统的目标是最大化单位投入带来总产出的期望，其目标函数为：

$ \underset{{\beta }_{i},{\beta }_{p},{Z}_{i},{z}_{p}}{\mathrm{max}} {F}\left({z}_{p}+\mathbb{Z}\right)(\bar{k}+{k}_{p}{\beta }_{p})-{c}_{p}{\beta }_{p}{z}_{p}-{\sum }_{i=1}^{L}{c}_{c}{\beta }_{i}{Z}_{i} $

(2)

$ \mathrm{s.t.} \quad {\beta }_{p}+{\sum }_{i=1}^{L}{\beta }_{i}=1 $

(3)

$ \left[ 1-\mathrm{F}\left({Z}_{i-1}\right)\right]{h}_{i}{\beta }_{p}={\beta }_{i} $

(4)

假设除了村庄以外的各上级政府均积极开展政策学习并达到了同样的标准，那么上级政府的总知识集等于各上级政府的知识集，即$ \mathbb{Z}={Z}_{i}={z}_{c} $。由于各层级政府人员具有固定的单位学习成本，因此工作人员无论处于上级政府中的哪一个层级，其付出的学习成本也是相同的，从而得到一个更为简洁的目标函数：

$ M={F}\left({z}_{p}+{z}_{c}\right)(\bar{k}+{k}_{p}{\beta }_{p})-c{\beta }_{p}{z}_{p}-c\left(1-{\beta }_{p}\right){z}_{c} $

(5)

求解该最优化问题的一阶条件如下：

$ \frac{\partial M}{\partial {z}_{p}}=f\left({z}_{p}+{z}_{c}\right)(\bar{k}+{k}_{p}{\beta }_{p})-c{\beta }_{p}=0 $

(6)

$ \frac{\partial M}{\partial {z}_{c}}=f\left({z}_{p}+{z}_{c}\right)(\bar{k}+{k}_{p}{\beta }_{p})-c(1-{\beta }_{p})=0 $

(7)

$ \frac{\partial M}{\partial {\beta }_{p}}=\mathrm{F}\left({z}_{p}+{z}_{c}\right){k}_{p}-c{z}_{p}+c{z}_{c}=0 $

(8)

由此可得出以下四个命题：

命题1：当政府间沟通成本下降时，乡级政府的辖区规模可相应增大。

证明1：由上述模型，乡级政府的辖区规模为$ {s}_{1}=\dfrac{{\beta }_{p}}{{\beta }_{1}} $ ，将一阶条件代入可得$ {s}_{1}=\dfrac{{\beta }_{p}}{{\beta }_{1}}=\dfrac{1}{h}{\mathrm{e}}^{\lambda {z}_{p}}= \dfrac{1}{h}{\mathrm{e}}^{k} $ ，其中$ k=\dfrac{1}{2}\left[\mathrm{ln}\lambda +\mathrm{l}\mathrm{n}\left(\bar{k}+{{k}_{p}\beta }_{p}\right)-\mathrm{ln}c-\mathrm{ln}{\beta }_{p}+\left(\dfrac{\lambda }{c}-\dfrac{{\beta }_{p}}{\bar{k}+{{k}_{p}\beta }_{p}}\right){k}_{p}\right] $ ，由此可得$ \dfrac{\partial {s}_{1}}{\partial h}=-\dfrac{1}{{h}^{2}}{\mathrm{e}}^{k} < 0 $。从直觉上看，当沟通成本$ h $下降时，村庄与乡级政府之间上传下达效率提高，乡级政府可以更便利、快捷地了解所辖村庄遇到的问题并为之提供解决方案，即使管辖较多的村庄也能够及时应对，因此其辖区规模可以增大。

命题2：当政府的知识水平上升即学习成本下降时，乡级政府的辖区规模可相应增大。

证明2：由上述模型可知，$ \dfrac{\partial {s}_{1}}{\partial c}=-\dfrac{1}{2h}\left(\dfrac{\lambda {k}_{p}}{{c}^{2}}+\dfrac{1}{c}\right){\mathrm{e}}^{k} < 0 $。当学习成本$ c $下降时，村庄不仅能够更好地了解当地情况，还能够更好地学习政策知识，知识集的扩大使其可以独立解决更多的问题，其所属乡级政府的辖区规模可以增大。与此同时，乡级政府在花费与之前相同的成本时可以了解更多所辖村庄的情况，在不增加其成本的情况下能够帮助更多的村庄解决问题，从而可增大辖区规模。

命题3：政府推行政策的可预测性增强，乡级政府的辖区规模可相应增大。

证明3：由上述模型可知，$ \dfrac{\partial {s}_{1}}{\partial \lambda }=\dfrac{1}{2h}\left(\dfrac{1}{\lambda }+\dfrac{{k}_{p}}{c}\right){\mathrm{e}}^{k} > 0 $，即对所辖村庄的可预测性增强时，乡级政府的辖区规模可以相应增大。如果可预测性较强，政府就能够更好地在政策落实前充分准备、学习，高效地掌握有用的知识集。村庄在实际开展工作的过程中，很少会遇到意料之外的问题，因此在大多数情况下不需要向上级政府寻求帮助即可顺利开展工作。在这样的情况下，增大乡级政府的辖区规模并不会对工作效果有负面的影响。

命题4：当公共品提供的规模经济更为重要时，即公共品提供面临的固定成本更大，乡级政府的最优辖区规模可相应增大。

证明4：$ \dfrac{\partial {s}_{1}}{\partial \bar{k}}=\dfrac{1}{2h}\left[\dfrac{1}{\bar{k}+{{k}_{p}\beta }_{p}}+\dfrac{{\beta }_{p}{k}_{p}}{{\left(\bar{k}+{{k}_{p}\beta }_{p}\right)}^{2}}\right]{\mathrm{e}}^{k} > 0 $，这意味着当村庄公共品提供的固定成本越大时，辖区规模较大乡镇的公共品平均投入越低，规模经济越明显，因此乡级政府的辖区规模也应该越大。

五、乡镇撤并原因的实证研究

（一）实证模型设定

本文的理论模型发现，乡镇撤并的幅度受到乡镇政府与村庄间的沟通成本、政府工作人员的知识水平、公共政策实施效果的可预测性以及公共品规模经济的重要程度等因素的影响。根据经典的地方政府最优辖区规模理论，居民对公共品的偏好异质性也是决定辖区规模的重要因素。基于此，本文采用如下横截面数据的回归模型进行实证检验：

$ \begin{aligned} {ext}_{i}= & {\beta }_{0}+{\beta }_{1}{slope}_{i0}+{\beta }_{2}{tele}_{i0}+{\beta }_{3}{indusp}_{i0}+{\beta }_{4}{vol}_{i0}+{\beta }_{5}\mathrm{l}\mathrm{n}{pop}_{i0}\\ & +{\beta }_{6}{minor}_{i0}+{\beta }_{7}{X}_{i0}+{u}_{i} \end{aligned}$

(9)

其中，被解释变量$ {ext}_{i} $为样本期间各县乡镇撤并改革的力度，使用各县1997—2014年间的乡镇撤并幅度来衡量。由于样本期内乡镇撤并普遍开展，此变量大多为正值，取值越大代表该县乡镇撤并力度越大。本文选用了以下两个变量来衡量乡镇政府与村庄的沟通成本：第一个变量$ {slope}_{i0} $是各县的平均坡度，在坡度较陡的地方，乡镇与村庄之间的沟通成本较高；第二个变量$ {tele}_{i0} $为基期的人均电话用户数的对数，¹²现代通信技术的推广能够有效降低沟通成本。$ {indusp}_{i0} $是1997年县域GDP中第二产业增加值占比，该指标越大意味着基层政府工作人员在推动经济发展上拥有越高的知识水平。$ {vol}_{i0} $为实际人均GDP的波动率，用来衡量公共政策实施效果的可预测性，本文使用1997—2014年间县人均实际GDP增长率的标准差衡量。GDP的波动率越高，则该地公共政策实施效果的可预测性越低。$ {pop}_{i0} $是1997年县内平均乡镇所辖人口的对数值。期初平均乡镇所辖人口较少，代表乡镇政府一开始未充分利用公共品提供的规模经济，行政人员较多，财政负担较大。为了更有效地利用规模经济，这些县会在后续年份中实施更大力度的乡镇撤并。$ {minor}_{i0} $是期初少数民族人口占比，¹³可以衡量县域内民众的偏好异质性。控制变量$ {X}_{i0} $是各县1997年的人均实际GDP，以剔除初始收入水平对乡镇撤并力度的影响。

基于理论模型的分析，沟通成本较低时，辖区规模可相应扩大，乡镇撤并力度也较大，因此本文预期$ {slope}_{i0} $的系数为负，$ {tele}_{i0} $的系数为正。如果基层工作人员的知识水平越高，其学习成本越低，需要与上级沟通的频率越低，则乡镇政府的管辖范围可以扩大，因此我们预期$ {indusp}_{i0} $的系数为正。当政策的可预测性越强、规模经济越重要时，乡镇政府最优辖区规模也越大，因此$ {vol}_{i0} $和$ {pop}_{i0} $的系数预期为负。少数民族人口占比越高的县域，推行乡镇撤并越谨慎，因此$ {minor}_{i0} $的系数预期为负。

（二）数据来源

本文使用的数据主要包括1997—2014年县域层面的各类经济、社会与地理数据。¹⁴其中，县级经济社会数据来源于历年《中国县（市）社会经济统计年鉴》，主要包括县级的GDP、规模以上工业总产值、规模以上工业企业数、人口、财政支出、电话用户数、福利院床位数、所辖乡镇数量等信息。本文根据省级的GDP平减指数，将所有经济指标折算为2000年不变价水平。县域的坡度地理数据从中国科学院资源环境数据云平台获取，各县2000年的少数民族人口占比数据来自于中国《2000人口普查分县资料》。表1是各主要变量的描述性统计。

表 1 主要变量描述性统计（乡镇撤并原因）

变量符号	变量名	观测值	平均值	标准差	最小值	最大值
ext	1997−2014年乡镇撤并幅度	1 801	0.289	0.338	−1.946	3.258
slope	县平均坡度	1 801	2.619	2.450	0.013	15.387
tele	期初人均电话用户数（2000年）	1 801	0.078	0.061	0.007	1.459
indusp	期初第二产业占比（1997年）	1 801	0.333	0.149	0.002	0.907
vol	县GDP波动率	1 801	0.093	0.056	0.016	0.813
lnpop	期初县内乡镇平均所辖人口的对数（1997年）	1 801	0.707	0.675	−1.872	4.127
minor	期初少数民族人口占比（2000年）	1 789	0.181	0.300	0.000	0.993
lngdppc	期初人均GDP的对数（1997年）	1 801	7.599	0.629	5.589	11.048

表选项

（三）基准实证结果

表2报告了实证回归结果，列（1）加入了本文的五个核心解释变量，从回归结果可知：第一，县平均坡度的回归系数显著为负，人均电话用户数的系数显著为正，这表明乡镇政府与村庄之间的沟通成本越低，乡镇政府的管理区域越大，样本期间推行乡镇撤并的力度越大，验证了本文的命题1。第二，初始第二产业占比的系数显著为正，这表明基层工作人员拥有的经济发展知识越多，基层政府人员在推行政策时，独立进行决策的能力越强，需要与上级进行沟通的次数也越少，此时乡镇政府的管辖范围可以扩大，这支持了命题2的结论。第三，县GDP波动率的回归系数显著为负，GDP波动率越低，代表当地公共政策实施效果的可预测性越强，村庄在执行政策时面临的不确定性较低，因而乡镇政府可以相应扩大辖区规模，乡镇撤并力度较大，证实了命题3。第四，县内乡镇平均所辖人口规模的回归系数显著为负，说明原本所辖人口数较少时，扩大乡镇政府辖区规模能够有效利用规模经济带来的好处，乡镇撤并力度较大，这支持了命题4的结论。

表 2 乡镇撤并原因回归结果

	（1）	（2）	（3）
	乡镇撤并幅度
slope	−0.0387^^^*	−0.0315^^^*	−0.0313^^^*
	（0.0036）	（0.0036）	（0.0035）
tele	0.5527^^	0.5120^^	0.4868^*
	（0.2449）	（0.2314）	（0.2743）
indusp	0.5129^^^*	0.3759^^^*	0.3680^^^*
	（0.0620）	（0.0621）	（0.0607）
vol	−0.3462^^	−0.2787^^	−0.2754^*
	（0.1470）	（0.1407）	（0.1408）
lnpop	−0.1440^^^*	−0.1640^^^*	−0.1639^^^*
	（0.0165）	（0.0161）	（0.0161）
minor		−0.2163^^^*	−0.2164^^^*
		（0.0271）	（0.0272）
lngdppc			0.0054
			（0.0181）
观测值	1 801	1 789	1 789
R²	0.1445	0.1725	0.1726
注：^*、^和^*分别表示在1%、5%和10%的显著性水平上显著；括号中报告的是稳健标准误，下表同。

表选项

表2的列（2）加入了少数民族人口占比作为解释变量，该变量的回归系数显著为负，说明少数民族人口占比高的县域，推行乡镇撤并的力度较小，这验证了经典的最优辖区规模理论，即居民偏好的异质性越高，地方政府的辖区应该越小。在此基础上，列（3）加入期初人均GDP作为控制变量，结果依然保持稳健。

（四）排除替代性解释

1. 经济发展潜力。本文在基准回归中使用县平均坡度和期初人均电话用户数、期初第二产业占比来代表乡镇政府与村庄之间的沟通成本以及政府工作人员的知识水平，尽管使用地理数据和期初数据能够避免内生性问题，但这些变量可能还反映了当地的经济发展潜力。如果当地经济发展潜力会对未来的乡镇撤并决策产生影响，那本文提出的命题将受到影响。因此，本文在回归中加入2014年人均GDP水平来控制经济发展潜力的影响，理由是如果当地经济发展潜力较大，后期经济发展水平会相应较高。表3中列（1）报告了相应的结果，各变量的系数与基准结果相差不大。列（2）加入了2014年第二产业占比，以进一步排除经济发展潜力的影响，结果依然保持稳健。虽然使用2014年的变量能够较好地表明经济发展潜力，但也可能存在反向因果的问题，因此本文还将控制变量替换为2004年的人均GDP水平和第二产业占比，这两个变量既能在一定程度上反映当地的经济发展潜力，又因为决定时间较早，不存在反向因果问题，如列（3）所示，结果保持稳健。

表 3 排除替代性解释的回归结果

	（1）	（2）	（3）	（4）	（5）
	经济发展潜力			人力资本水平
	乡镇撤并幅度
slope	−0.0278^^^*	−0.0270^^^*	−0.0299^^^*	−0.0337^^^*	−0.0319^^^*
	（0.0035）	（0.0035）	（0.0035）	（0.0036）	（0.0035）
tele	0.2025	0.1106	0.4067	0.5947^*	0.5000^*
	（0.1806）	（0.1598）	（0.2489）	（0.3194）	（0.2819）
indusp	0.3265^^^*	0.3769^^^*	0.2442^^^*	0.3688^^^*	0.3648^^^*
	（0.0611）	（0.0664）	（0.0816）	（0.0609）	（0.0608）
vol	−0.3419^^	−0.3368^^	−0.2442^*	−0.2504^*	−0.2745^*
	（0.1466）	（0.1491）	（0.1404）	（0.1388）	（0.1409）
lnpop	−0.1355^^^*	−0.1334^^^*	−0.1571^^^*	−0.1597^^^*	−0.1645^^^*
	（0.0166）	（0.0167）	（0.0160）	（0.0161）	（0.0164）
minor	−0.1769^^^*	−0.1826^^^*	−0.2072^^^*	−0.2405^^^*	−0.2216^^^*
	（0.0275）	（0.0275）	（0.0270）	（0.0292）	（0.0287）
lngdppc	−0.0898^^^*	−0.1017^^^*	−0.0621^^	0.0111	0.0056
	（0.0178）	（0.0183）	（0.0266）	（0.0192）	（0.0183）
lngdppc2014	0.1401^^^*	0.1696^^^*
	（0.0169）	（0.0207）
indusp2014		−0.1715^^
		（0.0684）
lngdppc2004			0.0758^^^*
			（0.0282）
indusp2004			0.1366^*
			（0.0745）
avgedu				−0.0249^^
				（0.0100）
illiterate					0.0004
					（0.0007）
观测值	1 789	1 789	1 784	1 785	1 785
R²	0.2031	0.2061	0.1809	0.1779	0.1748

表选项

2. 人力资本水平。本文使用期初的县内乡镇平均所辖人口代表当地公共品规模经济的可利用空间，但该变量本身也是当地人力资本水平的体现。如果人力资本水平与未来乡镇撤并的决策相关，那该变量的回归系数无法准确衡量公共品规模经济可利用空间对乡镇撤并的影响。为排除该替代性解释，本文整理了第五次全国人口普查分县数据中的平均受教育年限和文盲率数据，作为各县人力资本水平的衡量指标，将其作为控制变量加入回归中，如表3列（4）、列（5）所示，各主要变量的系数变化不大，结果依然保持稳健。

（五）稳健性检验²⁰

1. 排除反向因果。基准回归中，县GDP波动率基于1997—2014年的GDP数据测算得到，为防止内生性问题的干扰，其他变量均基于地理数据或由期初数据计算而得。由于样本后期的GDP水平既是乡镇撤并决策的影响因素，也是其结果，反向因果问题可能使估计结果产生偏误。为此，本文将县GDP波动率的计算期间缩短10年，即1997—2004年，该期间内的GDP水平决定时间较早，不存在反向因果关系。根据回归结果，县GDP波动率的系数依然显著为负，其他主要变量的系数也保持稳健。

2. 考虑文化差异性。为了控制县内部文化差异的影响，本文从国泰安（CSMAR）数据库获取了各县的方言数量，将其作为文化差异性的衡量指标。根据回归结果，在考虑县内文化差异性的影响后，本文主要变量的系数依然保持稳健。

3. 考虑人口流动。为控制人口流动性对乡镇撤并的影响，本文基于第五次全国人口普查分县数据，参考王丽艳和马光荣（2017）的测算方法，分别计算出县内人口流动率、人口净流出率和人口流出率，并将其作为控制变量加入回归中。根据回归结果，在控制人口流动的影响后，主要解释变量的系数与基准回归相似，结果保持稳健。

综上所述，本文的实证结果与理论预期保持一致。上述结果表明，当乡镇与村庄间沟通成本越低、政府工作人员的知识水平越高、公共政策实施效果的可预测性越强、公共品的规模经济效应越需要发挥时，乡镇政府的辖区规模会相应扩大，这些地区在1997—2014年间实施乡镇撤并力度较大。

六、乡镇撤并对经济发展影响的实证研究

（一）实证模型设定

乡镇撤并改革是否促进了改革地区的经济发展呢？本文基于1997—2014年县级面板数据，使用双向固定效应模型考察各县乡镇撤并对县域经济发展的影响。回归模型设定如下：

$ \mathrm{l}\mathrm{n}gdppc_{it}=\beta_0+\beta_1\mathrm{l}\mathrm{n}num_{it}+\mathrm{\gamma}X_i\times\lambda_t+\alpha_i+\lambda_t+\varepsilon_{it} $

(10)

其中，被解释变量$ {\mathrm{l}\mathrm{n}gdppc}_{it} $是i县第t年的人均GDP的对数，核心解释变量$ \mathrm{l}\mathrm{n}{num}_{it} $是该县第t年所辖乡镇数量的对数。$ {\alpha }_{i} $为县级固定效应，$ {\lambda }_{t} $为年份固定效应。通过控制县级固定效应，可以控制所有不随时间变化的县级特征，但是有些县域固有特征可能既影响一个县实施乡镇撤并的幅度，同时又对经济发展产生随时间变化的效应。因此，我们参照Duflo（2001）的方法，在模型中控制了县域初始特征$ {X}_{i} $与年度固定效应$ {\lambda }_{t} $的交互项，从而允许这些县域特征在各年度对因变量产生异质性影响。$ {X}_{i} $包括1997年县内平均乡镇所辖人口和平均坡度。$ {\varepsilon }_{it} $为随机扰动项，这里将标准误聚类到县级层面。¹⁵在面板数据双向固定效应模型下，$ {\beta }_{1} $反映了乡镇数量变动对经济发展的影响。除人均GDP外，本文还使用夜间灯光亮度、¹⁶人均工业总产值、¹⁷人均规模以上工业企业数作为衡量县域经济发展的替代指标。

（二）基准实证结果

表4列（1）、列（2）报告了基准回归结果，列（1）控制了县固定效应和年份固定效应，列（2）进一步加入了各县初始特征和年份虚拟变量的交互项，结果表明各县乡镇数量的减少对人均GDP有显著的正向影响。以列（2）的系数为例，在其他条件保持不变时，县所辖乡镇数量减少10%，当地实际人均GDP提高1.7%。样本期间我国县域所辖乡镇数量平均减少了29%，意味着这一时期的撤乡并镇改革平均使县域人均GDP提高约5%。

表 4 乡镇撤并对县域经济发展的影响

	（1）	（2）	（3）	（4）	（5）
	基准结果		稳健性检验
	基准结果		非线性关系	添加控制变量
	人均GDP对数
lnnum	−0.2043^^^*	−0.1738^^^*	−0.2545^^^*	−0.1604^^^*	−0.1571^^^*
	（0.0218）	（0.0221）	（0.0831）	（0.0237）	（0.0217）
lnnum2			0.0160
			（0.0160）
netflow					−0.4027^^^*
					（0.0901）
县固定效应	控制	控制	控制	控制	控制
年固定效应	控制	控制	控制	控制	控制
县初始特征×年虚拟变量		控制	控制	控制	控制
观测值	32 040	32 040	32 040	31 857	31 876
R²	0.9474	0.9487	0.9487	0.9489	0.9494
注：^^^、^^和^分别表示在1%、5%和10%的水平上显著；括号内标准误聚类到县域层面，下表同。

表选项

（三）稳健性检验

1. 非线性关系。本文在回归中加入关键解释变量乡镇数量对数的二次项。根据回归结果，乡镇数量一次项系数在1%的显著性水平下显著为负，二次项的系数为正，但不显著。这说明在本文的样本研究期间内，乡镇数量和经济发展水平负相关，不存在显著的非线性关系。

2. 添加控制变量。为控制人口特征对当地经济发展的影响，本文在回归中加入县少数民族人口占比与年份虚拟变量的交互项。根据回归结果，本文结论是稳健的。此外，本文基于全国第五次和第六次人口普查分县数据计算出各县人口净流出率，并在回归中进行控制。根据回归结果，关键解释变量的系数保持稳健。

3. 替换被解释变量。本文使用夜间灯光亮度数据作为衡量县域经济发展水平的一个替代性指标。¹⁸根据回归结果，关键解释变量的系数显著为负，说明乡镇数量的减少会显著增加当地的夜间灯光亮度，提高县域经济发展水平。本文还分别采用人均规模以上工业企业总产值和人均规模以上工业企业数量作为经济发展的替代指标。根据回归结果，关键解释变量的系数均显著为负。上述结果表明，乡镇撤并改革确实促进了当地的经济发展。

（四）工具变量法¹⁹

借鉴Nakamura和Steinsson（2014）等的思路，本文构造了Bartik工具变量来解决内生性问题。具体而言，我们使用各县的平均坡度与省内当年乡镇总数量的交互项作为县乡镇数量的工具变量。使用工具变量的一阶段回归模型如下：

$ \mathrm{l}\mathrm{n}num_{it}=\beta_0+\theta\mathrm{l}\mathrm{n}num_{ipt}\times slope_{i0}+\mathrm{\gamma}X_i\times\lambda_t+\alpha_i+\lambda_t+\varepsilon_{it} $

(11)

其中，$ \mathrm{l}\mathrm{n}{num}_{it} $代表i县所在的p省在第t年的乡镇总数量的对数，$ {slope}_{i0} $是i县的平均坡度。如果一阶段成立，本文预期系数$ \theta $将为正，这表明当省内乡镇总数量越多，县平均坡度越高时，该县的乡镇数量也越多。

根据回归结果，工具变量对乡镇数量的影响在1%的显著性水平下显著为正，KP-F统计量超过600，远大于10，说明不存在弱工具变量问题。乡镇数量对人均GDP影响的系数显著为负，说明在其他条件保持不变时，县所辖乡镇数量减少10%，当地实际人均GDP提高1.0%。另外，将被解释变量替换为灯光亮度，系数仍显著为负，说明工具变量法的估计结果是稳健的。

（五）乡镇撤并对就业的影响

本文使用各县年末单位从业人员占总人口的比重衡量就业水平，将其作为被解释变量，基于式（10）进行实证检验。根据回归结果，关键解释变量的系数均显著为负，说明乡镇撤并改善了当地的就业状况。

（六）乡镇撤并对政府支出规模的影响

本文使用县域一般公共预算支出与GDP之比衡量政府支出规模，并将其作为被解释变量进行实证分析。根据回归结果，关键解释变量的系数显著为正，说明乡镇数量的减少确实有利于降低财政支出规模。

（七）乡镇撤并对公共品供给的影响

本文使用人均福利院床位数来衡量公共品供给水平，将其作为被解释变量进行分析。根据回归结果，关键解释变量的系数显著为负，说明乡镇撤并显著提高了县域的人均福利院床位数。这表明我国的乡镇撤并改革不仅节省了当地政府的财政开支，还提高了地方公共服务水平。

七、结论与政策启示

本文结合组织经济学理论，从政府组织运行成本的角度出发，构建了地方政府辖区规模最优化的理论模型，并利用我国各地区推行的乡镇撤并改革，对理论假说进行了实证检验。结果表明，随着上下级政府间沟通成本的下降、政府工作人员知识水平的提升、公共政策推行效果可预测性的增强、规模经济重要性的提升以及居民偏好异质性的降低，乡镇撤并改革推行的幅度会提升。这也意味着乡镇撤并改革的原因来自于两个方面：第一，改革之前我国乡镇辖区规模普遍过小，不利于规模经济效应的发挥，财政成本较高；第二，随着基层政府工作人员知识文化水平提升，政务公开、村务公开等制度不断完善，实现了政府行政管理与基层群众自治有效衔接和良性互动，基础设施的完善、通信技术的飞速发展和电子政务的推行更是进一步降低了沟通成本。

本文的研究结论能够为政府行政区划的调整和改革提供参考。一方面，在行政区划改革的过程中，应该遵循因地制宜的原则，依据自然环境、发展空间、经济水平、聚集效应等因素，充分权衡辖区过大带来的管理困难和辖区过小导致的规模经济损失，有序地开展行政区划改革的实践探索，激发改革对经济社会发展的内在活力，使行政区划改革能够更好地服务于地方经济发展。另一方面，应形成国土空间划分合理、层次幅度科学匹配的行政区划制度，这是国家治理体系和治理能力现代化的重要组成部分。信息技术的高速发展和外部环境的快速变化会对政府组织架构和行政区划产生深远的影响。我国的行政区划需适时开展适应性调整与改革创新，继续致力于建立简约、精干、高效的政府组织体系，通过部分行政区划建制的撤并，发挥行政区划设置在精简行政机构、降低行政成本、提高行政管理效能等方面的积极作用，推进基层治理体系和治理能力现代化。

1北京、上海、南京、广州等城市实施了合并部分市辖区的改革。

2党国英：《乡镇撤并基本完成实际效果还须检验》，《人民论坛》2006年第3期。

3大规模开展地方政府辖区合并的国家包括加拿大、日本、澳大利亚、新西兰、以色列以及很多欧洲国家。例如，丹麦在2007年将市政府数量从271个合并为98个，瑞典的城市数量已从二战后的约2500个减少到了目前不足300个（Hinnerich，2009）。

4印度尼西亚、巴西和很多非洲国家实施了拆分行政区划、缩小地方政府辖区规模的改革。据统计，撒哈拉以南非洲国家的地方政府数量自1990年以来增加了约20%；印度尼西亚的区政府数量从1998年的290个增加到了2008年的497个（Grossman和Lewis，2014）。

5参见民政部2001年发布的《关于乡镇行政区划调整工作的指导意见》（民发[2001]196号文）。

6参见中共中央、国务院1983年发布的《关于实行政社分开建立乡政府的通知》（中发[1983]35号文）。

7根据民政部2004年的统计算，一般乡镇按100名管理干部计算，每人每年的财政支出按1万元计算，每减少1个乡镇，裁减财政供养人员约100人，减轻财政负担约100万元。

8乡镇撤并幅度=（1997年县所辖乡镇数量−2014年县所辖乡镇数量）/1997年县所辖乡镇数量，负值代表1997—2014年间乡镇数量增加。

9尽管村庄在我国宪法中属于自治组织，不被视为完整的一级政府，村两委班子成员（村党支部委员会、村民委员会）不被视为真正的政府雇员，但是村庄却是基层治理的基本单元。在实践中，政策制定时上级政府需要与村庄工作人员和村民进行密切沟通，上级政府会向村庄派驻管理员，在具体执行某些政策时，通常也会向村庄派驻工作组。因此，本文模型中的村庄工作人员是指所有在村庄开展工作的人员，不仅包含村两委班子成员，也包括上级政府派驻在村庄的管理员和工作组。

10理想状况是 $ Z\in {A}_{i} $，这时村庄工作人员遇到的所有问题都可以运用自己的知识解决，不需要寻求上级帮助即可顺利开展工作，否则，村庄工作人员需要逐层询问上级，直至问题得到解决，甚至可能问了所有层级的工作人员后，问题仍无法解决。

11假设分布函数$ {F}\left(Z\right) $是连续的，因此其密度函数$ f\left(Z\right) $存在，$ \lambda $较大的F是相对一阶随机占优的。

12由于电话用户数据最早的可获取年份是2000年，该指标使用的是2000年人均电话用户数。

13由于少数民族人口占比数据仅在人口普查年份才可以获得，本文使用2000年第五次人口普查数据。

14县域包括县、县级市、自治县，但不含市辖区。由于西藏自治区数据缺失较为严重，样本中不包含西藏自治区所辖县。

15将标准误聚类到地级市层面，结果依然保持稳健。

16灯光亮度数据由美国气象卫星计划中的传感器按日度采集，美国国家地球物理数据中心( National Geophysical Data Center，简称NGDC) 对一年的数据进行了平均处理，并将灯光亮度转变为灰度像元，取值范围是0到63。我们根据我国县级行政区划地图，计算出每年各县域内的平均灯光亮度。

17人均工业总产值、人均规模以上工业企业数、年末单位从业人员占比、财政支出占GDP比重和人均福利院床位数均来自历年《中国县（市）社会经济统计年鉴》。

18Henderson等(2012)基于跨国数据证明了夜间灯光亮度数据与经济发展水平具有高度关联性，可以用来度量经济发展水平。

20限于篇幅，下文的图表分析省略，留存备索。

19限于篇幅，图表分析省略，留存备索。

主要参考文献

[1]	王丽艳, 马光荣. 帆随风动、人随财走? ——财政转移支付对人口流动的影响[J]. 金融研究, 2017(10): 18–34.

[2]	张新光. 中国乡镇行政管理体制的历史沿革及其启示[J]. 南京师大学报（社会科学版）, 2007(1): 34–39. DOI:10.3969/j.issn.1001-4608-B.2007.01.006

[3]	Alesina A, Baqir R, Hoxby C. Political jurisdictions in heterogeneous communities[J]. Journal of Political Economy, 2004, 112(2): 348–396. DOI:10.1086/381474

[4]	Alesina A, Spolaore E. On the number and size of nations[J]. The Quarterly Journal of Economics, 1997, 112(4): 1027–1056. DOI:10.1162/003355300555411

[5]	Blair J P, Staley S R, Zhang Z C. The central city elasticity hypothesis: A critical appraisal of rusk’s theory of urban development[J]. Journal of the American Planning Association, 1996, 62(3): 345–353. DOI:10.1080/01944369608975699

[6]	Bolton P, Roland G. The breakup of nations: A political economy analysis[J]. The Quarterly Journal of Economics, 1997, 112(4): 1057–1090. DOI:10.1162/003355300555420

[7]	Boyne G A. Local government structure and performance: Lessons from America?[J]. Public Administration, 1992, 70(3): 333–357. DOI:10.1111/j.1467-9299.1992.tb00942.x

[8]	Denters B. Size and local democracy[M]. Cheltenham,UK:Edward Elgar Publishing,2014.

[9]	Dollery B, Byrnes J, Crase L. Australian local government amalgamation: A conceptual analysis population size and scale economies in municipal service provision[J]. Australasian Journal of Regional Studies, 2008, 14(2): 167–175.

[10]	Duflo E. Schooling and labor market consequences of school construction in Indonesia: Evidence from an unusual policy experiment[J]. American Economic Review, 2001, 91(4): 795–813. DOI:10.1257/aer.91.4.795

[11]	Feiock R C, Carr J B. A reassessment of city/county consolidation: Economic development impacts[J]. State and Local Government Review, 1997, 29(3): 166–171. DOI:10.1177/0160323X9702900304

[12]	Garicano L. Hierarchies and the organization of knowledge in production[J]. Journal of Political Economy, 2000, 108(5): 874–904. DOI:10.1086/317671

[13]	Grossman G, Lewis J I. Administrative unit proliferation[J]. American Political Science Review, 2014, 108(1): 196–217. DOI:10.1017/S0003055413000567

[14]	Hayek F A. The use of knowledge in society[J]. The American Economic Review, 1945, 35(4): 519–530.

[15]	Henderson J V, Storeygard A, Weil D N. Measuring economic growth from outer space[J]. American Economic Review, 2012, 102(2): 994–1028. DOI:10.1257/aer.102.2.994

[16]	Hinnerich B T. Do merging local governments free ride on their counterparts when facing boundary reform?[J]. Journal of Public Economics, 2009, 93(5-6): 721–728. DOI:10.1016/j.jpubeco.2009.01.003

[17]	Jimenez B S, Hendrick R. Is government consolidation the answer?[J]. State and Local Government Review, 2010, 42(3): 258–270. DOI:10.1177/0160323X10386805

[18]	Keating M. Size,efficiency and democracy:Consolidation,fragmentation,and public choice[A]. Judge D,Stoker G,Wolman H. Theories of urban politics[M]. Thousand Oaks,CA:Sage,1995.

[19]	Lowery D. A transactions costs model of metropolitan governance: Allocation versus redistribution in urban America[J]. Journal of Public Administration Research and Theory, 2000, 10(1): 49–78. DOI:10.1093/oxfordjournals.jpart.a024266

[20]	Miceli T J. The decision to regionalize in the provision of education: An application of the tiebout model[J]. Journal of Urban Economics, 1993, 33(3): 344–360. DOI:10.1006/juec.1993.1020

[21]	Nakamura E, Steinsson J. Fiscal stimulus in a monetary union: Evidence from US regions[J]. American Economic Review, 2014, 104(3): 753–792. DOI:10.1257/aer.104.3.753

[22]	Nelson A C, Foster K A. Metropolitan governance structure and income growth[J]. Journal of Urban Affairs, 1999, 21(3): 309–324. DOI:10.1111/0735-2166.00019