一、引 言
改革开放以来,中国对外贸易实现了高速增长,成为了全球最大的货物贸易出口国,取得了举世瞩目的成就。长期以来,中国的出口繁荣被认为源自廉价劳动力的比较优势,但伴随着人口老龄化趋势的加剧,要素价格的不断上涨,支撑中国出口高速增长的原有动力已经难以为继,这种比较优势越来越表现出其内在的脆弱性(钱学锋和黄云湖,2013)。在规模报酬递增的情形下,本地市场效应是决定一国贸易模式与贸易利益的重要因素,成为要素禀赋以外,国际贸易产生最重要的源泉之一(Krugman,1980)。由于受到文化、制度以及地理条件等因素的限制,中国的国内市场在地区间出现了严重的市场分割问题,极大地抑制了中国本地市场效应的发挥(朱希伟等,2005;张杰等,2010)。本地市场效应不足的问题越来越成为中国企业出口的重要限制条件,削弱了中国对外贸易的规模经济效益与竞争优势。
在这样的背景下,大量文献从司法独立、地方保护以及基础设施等制度或政策的角度对国内市场分割的成因进行分析。近年来,越来越多的研究者开始关注到以方言壁垒为代表的非制度性因素也是造成中国地区间市场分割的重要成因(林建浩和赵子乐,2017;刘毓芸等,2017)。方言所形成的地区间壁垒从供给和需求两个层面阻碍了全国性大市场的形成,并抑制了企业本地市场效应的发挥。一方面,方言的多样性导致同一国家内部的族群存在不同的身份认同感,不同方言群体不仅在交流中存在障碍并引发贸易成本,而且将导致不同地区间心理距离的扩大并带来不信任感,阻碍了地区间分工合作的形成。这显然从供给层面增加了地区间企业的贸易成本,方言这一无形壁垒将完整的国内市场进行分割。另一方面,方言代表着共同的文化符号与祖先结构,不同族群因方言有着共同的认知、信任与纽带关系,这将显著影响人们对产品的偏好。本地消费者将因为偏爱、信任等感情,更加偏好来自共同方言地区的产品。这两方面因素都将导致共同方言的区域内部与区域外形成更强的市场分割。但现有研究并未对方言的贸易效应进行识别。本文在现有研究的基础上,对中国国内市场规模扩张的方言壁垒及其出口效应进行检验与分析,以扩展现有研究对方言经济效应的认识。
与本文主题密切相关的另一方面重要文献是有关本地市场效应的研究。Krugman(1980)在规模报酬递增的垄断竞争框架下对贸易的成因进行了分析,发现拥有相对较大国内市场需求的国家(地区)将成为净出口国(地区),并将此称之为本地市场效应。此后的异质性贸易理论在考虑生产率异质性后同样发现了显著的本地市场效应(Melitz,2003)。在理论研究的基础上,大量实证研究从不同角度检验了本地市场效应的存在性。钱学锋和黄云湖(2013)采用多国HME框架估计了中国不同行业的本地市场效应,发现本地市场效应将随着劳动力成本的提高逐渐成为中国出口增长最重要的动力来源。但现有研究发现,本地市场效应在不同国家(地区)的不同行业中的表现是不同的,这不仅源自供给因素,而且来源于需求方面的因素。Coşar等(2018)发现贸易成本、生产成本、品味的差异性均是造成本地市场效应的重要原因。他们尤其关注本地消费者对本地品牌的偏好,从而解释了外资企业的本地化经营策略。但是,现有文献对本地市场效应研究的最大问题在于,本地市场规模取决于本国总体经济规模或者人口规模,但有效的本地市场规模却因为市场分割的存在远远小于本国的经济与人口总量。尤其是对中国这样一个在文化、地理与制度方面均存在地方市场分割的大国而言,在原有对本地市场效应进行度量与识别的框架基础上进行检验,得到的结果显然是有偏的。
本文从本地市场效应的角度出发,建立起方言与出口之间的因果联系并对其进行检验。为了实现这一目标,本文首先利用《汉语方言大词典》与《中国语言地图集》对不同地区的方言进行识别,进而通过不同地区方言的分布信息构造共同方言市场变量,以识别方言所带来的市场分割。其次,本文在规模报酬系数与资本转售率的基础上,分别利用分样本比较与双重差分法,利用中国工业企业数据库对方言的出口效应进行检验与分析。最后,本文从共同方言市场的度量、遗漏重要解释变量、内生性问题、样本选择问题等方面进行进一步的稳健性分析。尤其是,本文采用遗传距离构造的共同基因市场作为工具变量,以解决内生性问题等方面对估计结果所带来的潜在影响。本文的检验结果均证实了方言壁垒因市场分割所带来的出口效应。本文的研究发现,方言是造成中国地区市场分割的重要因素,方言形成的壁垒限制了中国本地市场效应的发挥,进而抑制了中国规模报酬递增部门的出口与发展。
本文从两个方面对现有研究进行了扩展与创新:一方面,本文有利于我们从开放条件下检验方言对对外贸易的影响,从而为方言与经济增长之间的关系提供新的机制与证据。现有关于方言的研究主要局限于方言对国内不同区域间要素流动以及贸易壁垒的影响,从而以此识别方言影响中国经济增长的微观机制(徐现祥等,2015)。但是,方言对中国对外贸易的影响及其微观机制却始终未受到关注,本文正是从这个角度出发,试图提供新的理论机制与经验证据。另一方面,本文在传统的本地市场效应假说中加入了国内地区市场分割的因素,扩展了新贸易理论与本地市场效应的研究。现有关于本地市场效应的理论与经验研究均假设国内市场不存在市场分割,这也就过度夸大了现实中的本地市场规模。本文则从方言角度入手,对造成本地市场分割的因素对中国企业出口所带来的影响进行检验,从而为方言研究提供新的理论基础,并从地方市场分割的角度拓展本地市场效应的研究。
二、理论框架与研究假设
Krugman(1980)指出,在一个存在报酬递增和贸易成本的世界中,拥有相对较大国内市场需求的国家将成为净出口国,并将这一现象称为本地市场效应。此后的大量理论与经验研究扩展了本地市场效应的理论边界,并对其展开了实证检验。Melitz(2003)将企业异质性假设引入了Krugman模型,认为企业进入国际市场需要支付沉没成本,只有高生产率企业能够支付沉没成本同时进入国内与国际市场,国内市场规模的扩张能够促进企业实现规模经济,成为企业出口的重要优势。然而,Krugman(1980)和Melitz(2003)的理论是建立在一个国内市场一体化假设基础之上的,并没有考虑国内市场分割的存在。这一理论假设在国内市场分割严重的中国很难成立。朱希伟等(2005)较早地提出了中国企业偏向于直接进入国外市场,而非在国内进行市场扩张的现象,并且洞悉到国内市场分割与中国出口过度扩张间的矛盾。他们的研究发现在面临严重市场分割的情形下,中国企业倾向于选择沉没成本更低且更不具规模经济的OEM方式出口,从而形成了过度出口的分离均衡。张杰等(2010)则从企业所有制的角度就市场分割对中国企业出口的影响进行了检验,他们的研究发现市场分割只抑制了国内企业的出口,外资企业并不受影响,从侧面证实了朱希伟等(2005)的研究假设。
朱希伟等(2005)和张杰等(2010)的研究很好地弥合了理论与中国现实之间的差距,而且他们的研究表明虽然表面上市场分割加剧了中国企业对国外市场的依赖,但这种依赖主要集中于外资企业以及OEM类型的生产阶段,导致中国企业选择规模经济递减的低沉没成本生产阶段,这种效应对于内资企业尤为严重。但是,他们的研究仍然有待扩展:一方面,他们的研究仅仅指出市场分割将影响中国的出口模式,却并没有讨论市场分割的来源及其对企业出口的影响。本文正是在本地市场效应视角下,通过引入共同方言市场,考察了方言壁垒所形成的市场分割对企业出口所带来的影响。另一方面,他们的研究也并没有注意到中国企业所面临的国内市场是复杂块状分割的,不同地区企业所面临的国内市场规模是迥异的,而文化和方言的隐形壁垒在块状分割市场的形成中起到关键的作用。本文正是在他们的研究基础上,刻画与检验了分割市场对企业出口模式所带来的影响。
对于中国国内的市场分割,Young(2000)的研究较早地对中国的地方保护与市场分割提出了严格的理论假设,此后的大量研究均将中国严重的市场分割归因于渐进式改革所形成的地方保护。然而,正如高翔和龙小宁(2016)所指出的,行政区划作为地方保护主义产生的基础条件,其产生就受到文化分割和方言壁垒的影响。近年来,越来越多的研究开始关注文化与方言所产生的市场分割,并对其经济效应展开了分析。不同地区由于历史、气候、地理条件的差异形成了不同的语言文化,而不同的语言特征不仅为不同的社会群体打下了显示性的标签,而且在不同地区间的情感沟通与市场交易中形成了隐形的方言壁垒。例如,高翔和龙小宁(2016)从省制的行政区划角度入手,发现不同地区之间的文化冲突导致了经济合作和贸易往来间的贸易成本迅速提高,从而阻碍了当地的经济发展。刘毓芸等(2017)从方言的角度入手,从侧面证实了方言壁垒所带来的市场分割效应。
本文在图1中展示了方言壁垒影响企业出口的理论机制与框架,其中的虚线部分表示因不同地区方言差异所形成的隐形壁垒,这些壁垒将市场划分为不同的地区,本文将这些使用相同方言的地区称之为共同方言市场。因此,方言壁垒的分割是共同方言产生的原因,方言壁垒分离得越碎片化,共同方言市场规模也就越小。虽然共同方言市场的大小并不等价于本地市场规模,企业依然能够穿越方言壁垒向不同方言市场销售产品,但方言壁垒的存在却大大提高了企业异地销售的成本,共同方言市场与本地市场规模之间呈现显著的正相关关系。一方面,方言是不同地区个体独特的标志物,不同方言群体不仅在交流中存在障碍并引发贸易成本(林建浩和赵子乐,2017),而且还将导致不同地区间心理距离的扩大并带来不信任感,阻碍跨地区分工合作的形成(刘毓芸等,2017)。这显然从供给层面增加了地区间企业贸易的成本,方言这一无形壁垒将完整的国内市场进行分割。另一方面,共同的方言体现了不同地区间在偏好、文化、制度以及气候上的相似性,为基于本地偏好生产的产品赢得共同方言市场消费者的青睐提供了先天优势(高翔和龙小宁,2016;黄玖立和刘畅,2017)。因此,更小的共同方言市场导致企业必须面对共同方言市场外使用不同语言的区域市场,所带来的贸易成本显然是更高的。例如,Jensen和Miller(2018)发现本地消费者对外地商品的质量、声誉与特色的信息不对称,导致本地消费者对外地商品需求的下降。对于不同方言地区的商品,信息不充分将更加严重,从而导致企业所能获取的本地市场规模大大缩小。
方言壁垒所引发的共同方言市场大大降低了中国企业的本地市场规模,形成了无形的市场分割。根据朱希伟等(2005)的研究,市场分割所带来的国内贸易成本与出口市场沉没成本之间的差异将导致截然不同的开放均衡。一方面,市场分割的形成导致中国企业进入异地市场的贸易成本是非常高昂的,甚至时常高于进入出口市场的沉没成本。然而,OEM以及加工贸易的方式具有沉没成本低且规模报酬不变或递减的特征,这导致企业得以通过这样的方式进入国际市场,形成了以出口为基础的开放经济均衡,这不仅造成中国企业的生产表现为规模报酬不变或递减,而且导致在此条件下市场分割与中国企业出口正相关关系的产生,导致中国对外贸易的依赖和行为扭曲。然而,对于出口市场中沉没成本仍然高于国内市场的企业,其市场的扩张仍然依赖于本地市场扩张所带来的规模经济,仍然将形成以本地市场为基础的开放均衡,导致市场分割与企业出口间负相关关系的产生。综上所述,本文提出如下研究假设:
方言壁垒将会导致共同方言市场的产生,而共同方言市场的扩张将提高企业的本地市场规模,但其对企业出口的影响取决于行业的规模经济与沉没成本特征。若企业处于规模报酬递减、沉没成本较低的行业,则方言壁垒将导致企业出口的增加,企业将建立以出口市场为基础的开放均衡;若企业处于规模报酬递增、沉没成本较高的行业,则方言壁垒将导致企业出口的减少,企业将建立以本地市场为基础的开放均衡。
三、数据说明与计量模型的构建
(一)数据说明
为了刻画中国企业的出口行为,本文所采用的企业数据来自2005年中国工业企业数据库。本文在国民经济行业分类的基础上进一步剔除了非制造业企业。样本期间,中国行政区域的划分经过了不断的调整,本文对样本所涉及的区域行政编码进行了统一。本文删除了总资产小于固定资产、总资产小于流动资产的企业样本,删除了增加值、就业人数和销售额为负的企业样本,并删除了职工人数少于8人的企业样本。
本文以县级行政区划为分析单位,使用源于中国研究服务数据平台的汉语方言数据来刻画方言特征。其中,根据许宝华和宫田一郎(1999)所编的《汉语方言大词典》及中国社会科学院和澳大利亚人文科学院(1987)所编的《中国语言地图集》,本文将汉语方言从粗略到细致依次分为:汉语、方言大区、方言区、方言片(次方言)。①本文采取方言片作为基本的方言单元。我们在整理后依据数据库中所报告的中国2 282个县级行政区划所使用的具体汉语方言片来构建每个县的共同方言市场规模。此外,对共同市场的刻画还需要人口分布方面的信息。一方面,本文采用了2000年人口普查数据所报告的县级人口数据;另一方面,本文采用2005年全国1%人口抽样调查数据,该数据从2000年人口普查中进行分层抽样所得,覆盖了除中国台湾、香港和澳门外的其他31个省份,抽样调查样本占到了全国1%的人口,并在调查中涵盖了收入、职业等丰富的居民基本信息,能够很好地反映人口在不同地区的分布。
(二)计量模型构建
本文运用Heckman两阶段选择模型对方言多样性的出口效应进行估计。当企业进行出口决策时,它们将面临扩展边际与集约边际两方面的选择。根据Heckman两阶段选择模型,本文设定第一阶段考察企业的扩展边际,将模型形式设定如下:
$Pr \left( {e{x_{fij}} = 1} \right) = {\alpha ^a} + \beta _1^aCommo{n_j} + \beta _2^aS\!u{b_{fij}} + {\gamma ^a}{X_{fij}} + {\varphi ^a}{Y_j} + {\phi _p} + {\phi _i} + {\varepsilon _{fij}}$ | (1) |
其中,f代表企业,i代表行业,j代表县;ex为企业选择是否出口的虚拟变量,若出口为1,不出口则为0;Common表示共同方言市场规模;X表示企业层面的控制变量,包括生产率、企业规模、企业经营年限与企业所有制变量,控制了企业层面的特征;Y表示地区层面的控制变量,包括地区受教育水平、人口密度、外商直接投资和到港口距离变量,控制随地区发生变化的特征与因素。为了避免无法观测因素所带来的重要变量缺失的问题,本文在模型中控制了行业(φi)与省份(φp)层面的固定效应,计算了城市层面的聚类稳健标准差。参考张杰与郑文平(2015)对补贴出口效应的研究,选择政府补贴(Sub)作为模型的识别变量,若获得补贴则变量为1,否则为0。在模型(1)中,本文最关注共同方言市场变量(Common)的估计系数。我们预期共同方言市场变量的估计系数在规模报酬递增的行业中显著为正,在规模报酬递减的行业中显著为负。
Heckman两阶段选择模型的第二阶段为企业出口规模的决定模型,考察了企业出口的集约边际。在第二阶段模型中,我们加入了第一阶段模型所估计得到的逆米尔斯比,以克服样本选择偏差。若逆米尔斯比显著不为0,则第二阶段模型存在样本选择问题,Heckman两阶段选择模型能够有效解决样本选择偏差。本文将第二阶段模型设定如下:
$\ln ({ex} valu{e_{fij}} + 1) = \alpha^b + \beta _1^b Commo{n_j} + {\gamma^b}{X_{fij}} + {\varphi^b}{Y_j} + {\eta^b}{\lambda _{fij}} + {\phi _p} + {\phi _i} + {\varepsilon _{fij}}$ | (2) |
其中,exvalue为企业出口交货值,取出口交货值加1后的对数作为被解释变量;模型还考虑了企业层面(X)与地区层面(Y)的控制变量,对控制变量的设定与第一阶段模型保持一致;为了避免不可观察因素导致的遗漏关键解释变量问题,本文在模型(2)中考虑了行业与省份层面的固定效应,以控制不随时间变化而仅随行业或省份变化的不可观察因素。在模型(2)中,我们并没有加入补贴变量,而是加入了逆米尔斯比(λfij)变量。在模型(2)中,本文最关注共同方言市场变量(Common)的估计系数。根据新贸易理论的理论预测,我们预期共同方言市场变量的估计系数在规模报酬递增的行业中显著为正,在规模报酬递减的行业中显著为负,进而通过两组估计之间的差异对方言的出口效应进行推断。
本文将采用Rajan和Zingales(1998)提出的双重差分模型就共同方言市场影响企业出口的行业差异性进行识别,并对其机制进行检验与分析。基于双重差分法的研究思路,本文通过引入地区层面的共同方言市场变量与行业层面的规模经济变量,从而进一步检验共同方言市场规模扩张影响具有不同规模经济的行业企业出口行为的差异性。具体方程如下:
$Pr (e{x_{fij}} = 1) = {\alpha ^c} + \beta _1^c Commo{n_j} \times S\!cal{e_i} + \beta _2^c S\!u{b_{fij}} + {\gamma ^c}{X_{fij}} + {\varphi ^c}{Y_j} + {\phi _p} + {\phi _i} + {\varepsilon _{fij}}$ | (3) |
$\ln ({ex} valu{e_{fij}} + 1) = \alpha^d + \beta _1^d Commo{n_j} \times S\!cal{e_i} + {\gamma ^d}{X_{fij}} + {\varphi ^d}{Y_j} + {\eta ^d}{\lambda _{fij}} + {\phi _p} + {\phi _i} + {\varepsilon _{fij}}$ | (4) |
其中,本文在基准模型基础上加入了共同方言市场与规模经济变量的交乘项,并在模型中加入了各自的直接项;Scalei表示行业i的规模经济变量,本文采用规模报酬系数与资本转售率指标对规模经济进行度量。一方面,当采用规模报酬系数作为规模经济的代理变量时,规模报酬系数越大,则规模报酬递增程度越强,我们预期此时交乘项的估计系数显著为正,即共同方言市场规模的扩大对规模经济效应更大的行业的出口促进效应更大。另一方面,当采用资本转售率指标作为规模经济的代理变量时,资本转售率指标越大,则规模经济程度越低,我们预期此时交乘项的估计系数显著为负。
(三)指标构建
1. 被解释变量:企业出口。本文从扩展边际与集约边际两个角度对企业出口进行刻画。对于企业出口的扩展边际,本文利用中国工业企业数据库中的出口交货值度量企业出口倾向,出口则赋值为1,不出口则为0;对于企业出口的集约边际,本文采用出口交货值加1的对数形式表示。
2. 核心解释变量:共同方言市场规模。本文通过判断中国任意两两县级行政区域的次方言是否相同,以识别其是否处于共同方言区域。本文借鉴新经济地理学的市场潜力指数的构造方式,即一省区所面临的潜在市场容量是一个空间加权平均值,该指标与本地区及其他地区的市场规模呈正比,但与其他地区到该地区的距离呈反比。基于此,本文构造的共同方言市场规模变量如下:
$Commo{n_j} = \frac{{\sum\limits_{s = 1}^N {{{[I\left( {{F_s} = {F_j}} \right) \times po{p_s}}}/{{di{s_{sj}}}}]} }}{{\sum\limits_{s = 1}^N {\left( {po{p_s}/di{s_{sj}}} \right)} }}$ | (5) |
其中,下标j表示县级行政区划;s表示与县级行政区j相配对的区或县;F表示不同地区所使用的方言或主导方言;I(·)表示一个示性函数,用来判别地区j与地区s是否属于共同方言市场,若两地区所使用的方言或主导方言相同,则取值为1,否则为0;pop为人口数,dis为两地区间的球面距离。在计算共同方言市场变量时,本文将本地区视为自身的共同方言市场,并将自身到自身的地理距离取值为1。本文以地区人口数量作为该地区市场规模的代理变量,但由于不同地区间的地理距离是不同的,随着地理距离的增加,市场规模效应呈递减趋势,本文采用地理距离的倒数作为权重,对共同方言市场的人口数量进行加权求和,并得到其在最大潜在共同方言市场中所占的比重,作为共同方言市场规模的代理变量。
为了展现中国不同地区的共同方言市场规模差异性,本文在表1和表2中对共同方言市场排名前10位和后10位的县级行政区划进行了分析。表1展示了共同方言市场排名前10位的县级行政区划,全国共同方言市场规模最大的县级行政区划是上海市浦东新区,其共同方言市场规模指标值为0.554。从表1中我们能够发现,除了云南省昆明市官渡区以外,共同方言市场规模较大的地区均集中于北京市、上海市和广东省等出口集聚的地区。表2则展示了共同方言市场排名后10位的县级行政区划,全国共同方言市场规模最小的县级行政区划是江西省鄱阳县,其共同市场规模指标值为0.041。从表2中我们能够发现,共同方言市场规模较小的地区均集中于江西、新疆、山西和安徽等出口较少的地区。
省份 | 地级市 | 县级行政区划 | 共同方言市场规模 | |
1 | 江西省 | 上饶市 | 鄱阳县 | 0.041 |
2 | 新疆维吾尔自治区 | 哈密市 | 巴里坤哈萨克自治县 | 0.044 |
3 | 山西省 | 临汾市 | 大宁县 | 0.047 |
4 | 安徽省 | 池州市 | 石台县 | 0.050 |
5 | 安徽省 | 黄山市 | 黔县 | 0.052 |
6 | 山西省 | 临汾市 | 永和县 | 0.055 |
7 | 江西省 | 宜春市 | 铜鼓县 | 0.062 |
8 | 山东省 | 日照市 | 岚山区 | 0.064 |
9 | 安徽省 | 宣城市 | 旌德县 | 0.067 |
10 | 福建省 | 三明市 | 明溪县 | 0.068 |
省份 | 地级市 | 县级行政区划 | 共同方言市场规模 | |
1 | 上海市 | 市辖区 | 浦东新区 | 0.554 |
2 | 广东省 | 深圳市 | 宝安区 | 0.543 |
3 | 上海市 | 市辖区 | 杨浦区 | 0.532 |
4 | 上海市 | 市辖区 | 虹口区 | 0.526 |
5 | 广东省 | 佛山市 | 南海区 | 0.522 |
6 | 黑龙江省 | 哈尔滨市 | 南岗区 | 0.516 |
7 | 北京市 | 市辖区 | 朝阳区 | 0.516 |
8 | 云南省 | 昆明市 | 官渡区 | 0.515 |
9 | 上海市 | 市辖区 | 闸北区 | 0.515 |
10 | 广东省 | 广州市 | 白云区 | 0.514 |
3. 规模经济。共同方言市场对规模经济特征不同行业的企业出口行为的影响是存在差异的。为了识别行业规模经济特征,本文从行业规模报酬系数与沉没成本两个角度来测度。
一方面,本文假设企业的生产方程服从柯布-道格拉斯的生产函数形式,企业的规模报酬特征应当由劳动力与资本的参数决定。本文参照Olley和Pakes(1996)提出的方法,对行业的生产方程进行估计,进而通过规模报酬系数识别每个行业的规模经济特征。该方法可以有效解决缺失变量问题以及由企业进入退出带来的样本选择偏差问题。具体形式如下:
${Y_{it}} = {\beta _0} + {\beta _L}{L_{it}} + {\beta _K}{K_{it}} + {\eta _{it}} + {\varepsilon _{it}}$ | (6) |
其中,Y、L和K分别表示企业增加值、就业人数和资本存量的对数形式。ηit是被企业决策者观察到了而没有被研究人员观察到的生产率冲击;εit是同时没有被企业决策者与研究人员观察到的生产率冲击。通过对式(6)的估计,我们能够得到劳动力与资本的估计系数。本文利用劳动力与资本的弹性估计系数之和,就能够求得企业的规模报酬系数。根据中国国民经济行业分类的二位行业划分,中国制造业中共有7个行业处于规模报酬递增,22个行业处于规模报酬递减。②从总体上看,中国制造业行业普遍未发挥出规模经济,这也印证了朱希伟等(2005)的研究发现,即中国制造业企业普遍缺乏本地市场规模,选择进入沉没成本较低且规模报酬递减的生产区段中,从而无法发挥规模经济以及本地市场效应。
另一方面,由于企业生产方程的设定具有较强的假设性,生产方程的设定将会影响到结果的准确性。根据Krugman(1979)和Krugman(1980)的模型设定,沉没成本与固定成本是企业规模经济产生的重要原因。因此,本文将从沉没成本的角度对行业的规模特征进行进一步刻画。具体而言,本文采用Balasubramanian和Sivadasan(2009)提出的行业资本转售率指标,作为行业沉没成本的代理变量。资本转售率越高,行业沉没成本则越低,进而行业的规模效应也就越小。
4. 识别变量与控制变量。(1)识别变量:补贴虚拟变量。本文选择补贴作为模型的识别变量。具体地,中国工业企业数据库报告了每个企业受到政府的生产性补贴,本文根据这一信息将补贴变量设定为虚拟变量的形式,若企业获得补贴则赋值为1,未获得则为0,将其加入到第一阶段模型估计中去。
(2)企业层面的控制变量(X)。本文还加入了生产率、企业规模、企业经营年限与企业所有制作为控制变量。具体变量设定如下:①全要素生产率(TFP)。本文采用Olley和Pakes(1996)的方法计算了企业的全要素生产率,在模型中加入了全要素生产率作为控制变量。②企业规模。本文采用总员工数量的对数形式作为企业规模的代理变量。③企业经营年限。本文将企业经营年限变量定义为2006减去该企业成立年份的对数形式。④企业所有制。本文按照企业工商注册代码将企业类型划分为国有企业、外资企业与民营企业,分别设定国有企业与外资企业虚拟变量以控制所有制形式对企业出口的影响,若企业所有制形式为国有企业或外资企业,则赋值为1,否则为0。
(3)城市层面的控制变量(Y)。本文利用2005年全国1%人口抽样调查数据与2006年《城市统计年鉴》,在计量模型中加入了城市受教育水平、城市人口密度、城市外商直接投资、城市最近港口距离,以控制城市层面特征的影响。具体地,我们对城市层面的控制变量设定如下:①城市受教育水平。我们采用2005年全国1%人口抽样调查数据中涉及的个人受教育信息,对城市平均受教育年限进行估算:文盲为0年,半文盲为1年,小学程度为5年,初中程度为9年,高中程度为12年,大专及本科程度为16年,研究生程度为19年。②城市人口密度。我们采用该城市的常住总人口数与该地区地理面积之比作为其代理变量。③外商直接投资。我们采用该城市外商直接投资占GDP比重作为其代理变量。④城市离最近港口的距离。我们采用该城市与距其最近港口的球面距离作为其代理变量,以控制贸易成本的影响。
四、实证结果与分析
(一)出口效应的分组估计
为了检验方言壁垒对中国企业出口所造成的影响,本文利用中国工业企业数据与方言数据,采用Heckman两阶段模型对方程(1)与方程(2)进行估计,并均在估计中控制了省份与行业的固定效应。为了避免异方差问题对回归结果的影响,本文均计算了稳健标准差。基于此,本文从规模经济与二元边际的角度分别探讨方言壁垒的出口效应。
本文采用Olley和Pakes(1996)的方法估计了式(6)的资本与劳动产出弹性,并根据资本产出弹性与劳动产出弹性之和计算了规模报酬系数。规模报酬系数大于1的行业被划分为规模报酬递增行业,而规模报酬系数小于1的行业则被识别为规模报酬递减的行业。本文根据我们对规模报酬递增与递减行业划分的子样本,分别对方程(1)和方程(2)进行估计。本文采用补贴作为Heckman两阶段模型的识别变量,识别变量在表3中的估计结果均在1%的显著性水平上显著为正,即补贴提高了中国企业出口的扩展边际,这一估计结果与张杰和郑文平(2015)的研究结论一致。本文采用第一阶段Probit模型构造逆米尔斯比,再将其加入到计量方程(2)中以得到其估计结果。逆米尔斯比的估计系数均在1%的显著性水平上显著为正,这表明本文的估计确实存在样本选择性偏误,Heckman两阶段模型的估计是有效的。具体的估计结果如表3所示。
规模报酬递增行业 | 规模报酬递减行业 | |||
扩展边际 | 集约边际 | 扩展边际 | 集约边际 | |
(1) | (2) | (3) | (4) | |
共同方言市场 | 0.056**(0.028) | 0.634**(0.271) | −0.108***(0.014) | −1.640***(0.145) |
补贴 | 0.061***(0.005) | 0.040***(0.003) | ||
生产率 | −0.002(0.002) | 0.074***(0.016) | 0.014***(0.001) | 0.329***(0.011) |
企业规模 | 0.082***(0.002) | 1.588***(0.062) | 0.084***(0.001) | 1.432***(0.030) |
企业经营年限 | 0.009***(0.002) | 0.098***(0.023) | 0.029***(0.001) | 0.347***(0.016) |
国有企业 | −0.025***(0.008) | −0.068(0.068) | −0.069***(0.006) | −0.691***(0.055) |
外资企业 | 0.219***(0.004) | 4.086***(0.153) | 0.237***(0.002) | 3.823***(0.074) |
地区受教育水平 | 0.084**(0.035) | 1.525***(0.344) | −0.062***(0.017) | −0.764***(0.170) |
人口密度 | −0.030***(0.006) | −0.488***(0.057) | −0.009***(0.003) | −0.092***(0.027) |
外商直接投资 | 0.021***(0.003) | 0.282***(0.033) | 0.035***(0.002) | 0.422***(0.019) |
到港口距离 | −0.008***(0.001) | −0.130***(0.013) | −0.010***(0.001) | −0.129***(0.007) |
省份固定效应 | 控制 | 控制 | 控制 | 控制 |
行业固定效应 | 控制 | 控制 | 控制 | 控制 |
Mills Ratio | 1.712***(0.204) | 1.193***(0.112) | ||
F检验 | 332.89 | 1 487.51 | ||
Wald检验 | 8 470.26 | 38 982.4 | ||
(伪)拟合优度 | 0.271 | 0.303 | 0.277 | 0.342 |
样本量 | 39 293 | 39 293 | 158 330 | 158 330 |
注:(1)括号内为估计系数的稳健标准差,*、**和***分别代表10%、5%和1%的显著性水平;(2)Probit模型中R2统计量为Pseudo R2,固定效应模型估计结果的R2为拟合优度统计量。下同。 |
一方面,对于规模报酬递增行业,共同方言市场变量在企业出口的扩展边际方程中的估计系数为0.056,且在5%的显著性水平上显著为正;而对于规模报酬递减行业而言,共同方言市场变量的估计系数则为−0.108,且在1%的显著性水平上显著为负。这一估计结果表明,方言壁垒的减少将导致共同方言市场规模的扩大,促使规模报酬递增行业的企业进入出口市场,而造成规模报酬递减行业的企业退出出口市场,从而导致共同方言市场更大地区的企业更集中于出口规模报酬递增行业的产品。另一方面,本文对规模报酬递增行业与递减行业集约边际的估计结果分别为0.634和−1.640,且均在显著性水平上显著。这说明方言壁垒所带来的出口效应在规模报酬递增行业与递减行业上存在巨大差异,共同方言市场规模的扩大将提高规模报酬递增行业的企业出口规模,但却会降低规模报酬递减行业的企业出口规模。方言将通过降低本地市场规模的扩张,造成本地出口结构偏向于规模报酬递减的行业和部门,从而不利于本地市场效应与规模经济优势的发挥。
为了保证估计结果的稳健性,本文在计量模型中加入了一系列企业层面与地区层面的固定效应,以避免遗漏重要解释变量问题。一方面,本文加入了生产率、企业规模、经营年限以及所有制等企业层面的控制变量。企业的生产率、规模、经营年限对企业出口二元边际的影响均显著为正,表明生产率、企业规模与经营年限均能够提高企业出口的扩展边际与集约边际。本文还加入了国有企业与外资企业的虚拟变量以控制所有制因素对企业出口所带来的影响。根据表3的估计结果,国有企业显著抑制了企业出口的扩展边际,对集约边际却并没有显著的影响,外资企业则在集约边际与扩展边际上的估计系数均显著为正,表明外资企业无论在出口倾向还是出口规模上均显著高于内资企业。另一方面,本文进一步加入了地区受教育水平、人口密度、外商直接投资和到港口距离等地区层面的控制变量。其中,地区受教育水平在规模报酬递增行业中的估计系数显著为正,但在规模报酬递减行业中的估计系数却显著为负。人口密度、到港口距离的估计系数显著为负,外商直接投资的估计系数则显著为正。
(二)出口效应的双重差分检验
在表3的基础上,本文进一步加入了行业的规模经济特征,以识别共同方言市场扩张影响企业出口的效应在不同行业上的差异性。基于此,本文分别采用规模报酬系数与资本转售率作为行业规模经济的代理变量,以行业层面规模经济变量与地区共同方言市场变量的交乘项来识别共同方言市场影响企业出口的机制,估计结果如表4所示。
规模报酬系数 | 资本转售率 | |||
(1)扩展边际 | (2)集约边际 | (3)扩展边际 | (4)集约边际 | |
共同方言市场 | −1.975***(0.434) | −19.564***(4.270) | 0.042(0.027) | 0.261(0.245) |
补贴 | 0.045***(0.002) | 0.046***(0.003) | ||
共同方言市场×规模报酬系数 | 1.948***(0.444) | 18.788***(4.362) | ||
共同方言市场×资本转售率 | −1.236***(0.226) | −15.964***(2.094) | ||
控制变量 | 控制 | 控制 | 控制 | 控制 |
省份固定效应 | 控制 | 控制 | 控制 | 控制 |
行业固定效应 | 控制 | 控制 | 控制 | 控制 |
Mills Ratio | 1.301***(0.098) | 1.363***(0.109) | ||
F检验 | 1 536.86 | 1 291.77 | ||
Wald检验 | 47 482.63 | 39 018.46 | ||
(伪)拟合优度 | 0.276 | 0.337 | 0.277 | 0.339 |
样本量 | 197 623 | 197 623 | 159 341 | 159 341 |
表4报告了采用双重差分法所得到的估计结果。本文在模型中加入了省份与行业层面的固定效应,但并未加入行业规模经济特征的直接项,以避免多重共线性的影响。对于双重差分法的估计,本文在模型中同样加入了企业层面和地区层面的控制变量,以避免遗漏解释变量的问题,且控制变量的估计结果均保持了稳健。根据表4的估计结果,本文分别采用规模报酬系数与资本转售率以对行业规模经济特征进行刻画,通过估计其与共同方言市场变量交乘项的估计系数,以识别方言壁垒对企业出口影响的机制。表4中的列(1)和列(2)展示了共同方言市场与规模报酬系数的交乘项估计结果:无论对于企业出口的扩展边际还是集约边际而言,交乘项的估计系数均在1%的显著性水平上显著为正,这表明共同方言市场的扩张对企业出口扩展边际与集约边际都有促进作用,但这种促进作用随着规模报酬系数的增大而不断提高,共同方言市场的本地市场扩张效应偏向于更具规模经济的行业。表4中的列(3)和列(4)则展示了共同方言市场与资本转售率的交乘项估计结果:在扩展边际与集约边际方程中,交乘项估计系数均在1%的显著性水平上显著为负,这表明共同方言市场对企业出口扩展边际与集约边际的促进作用随着资本转售率的提高而不断降低,即随着行业规模经济的降低而不断降低。这同样证实了前两列的估计结果与推论。
(三)稳健性检验与分析③
1. 共同方言市场的重新度量。为了确保本文得到的结果并不因指标的变化而变化,在原有公式的基础上,本文采用每个县级行政区划的GDP作为新的权重对共同方言市场指标进行重新度量。在此基础上,本文对方程(1)—方程(4)进行估计,就共同方言市场规模影响企业出口的扩展边际与集约边际分别进行检验与分析。本文检验发现:无论是扩展边际还是集约边际,共同方言市场规模对规模报酬递增行业的影响均显著为正,而对规模报酬递减行业的影响则显著为负,即方言壁垒对本地市场效应的限制将导致本地出口结构偏向那些不具有规模经济的行业,这一结果与基准估计保持一致。此外,在扩展边际与集约边际的估计方程中,规模报酬系数与地区共同方言市场的交乘项估计系数显著为正,而与资本转售率的交乘项估计系数则显著为负,均表明共同方言市场扩张所带来的出口效应随着行业规模经济的提高而不断提高,即双重差分模型的估计结果同样是稳健的。
2. 遗漏重要解释变量。由于不同地区采用方言种类的不同同样会影响该地区的经济发展,而方言的种类同样是决定共同方言市场大小的关键因素。因此,为了避免遗漏方言类型而导致内生性问题,本文进一步加入了方言类型的固定效应。一个地区方言多样性的高低不仅会影响本地区的市场规模效应,进而影响企业出口,而且也会影响当地的共同方言市场规模。这种潜在机制导致了第三方共同影响因素的存在,也导致了潜在的内生性问题。因此,本文借鉴徐现祥等(2015)对方言多样性的测算方法计算方言多样性指数,采用HHI的方式,对方言多样性程度进行度量。本文在考虑了方言固定效应与方言多样性后,发现估计结果保持稳健。无论对于扩展边际还是集约边际,在方言多样性估计系数的绝对值方面,规模报酬递增行业均大于规模报酬递减行业的估计结果。这说明方言多样性同样降低了本地市场效应,导致其对规模报酬递增行业所带来的出口抑制效应显著大于规模报酬递减行业。
本文所采用的地区层面的共同方言市场的出口效应,还受到其他遗漏变量的影响,如地区性政策、地方官员偏好、产业结构等因素不仅可能影响共同方言市场的规模,而且还会影响企业的出口,这就将导致遗漏解释变量的问题。因此,本文在方程中加入了产业政策、市长受教育水平以及当地产业结构变量作为控制变量,以对本文的估计结果进行稳健性检验与分析。具体地,本文以当地工业总产值占GDP的比重度量当地的产业结构,采用所在城市市长的受教育年限体现地方官员的偏好,采用该省二位行业是否实施产业政策的虚拟变量度量地区性政策。在加入控制变量后,本文所得到的估计结果均与基准回归保持一致。
3. 内生性问题。本文借鉴林建浩和赵子乐(2017)的研究,选择遗传距离作为工具变量。为了计算不同城市间的遗传距离,本文使用赵桐茂等(1991)的免疫球蛋白Gm单体型频率数据,去掉其中的Gm3;5型以及只包含少数民族样本的城市。本文采用Hedrick(1971)所提出的基因距离算法,根据Nei(1972)的方法计算得到两地区间更为稳定的遗传距离DIH变量,作为两地区间的遗传距离的代理变量。根据赵桐茂等(1991)、林建浩和赵子乐(2017)的建议,本文选定上海市作为构造遗传距离的基准城市,在两个城市相对于基准城市的绝对遗传距离基础上,再计算相对遗传距离。遗传距离的计算方法只能测算出不同群体在血统上的分离时间,却无法反映共同遗传基因的市场规模。因此,本文在共同方言市场规模的基础上,以人口规模与遗传距离的比值作为权重,进而根据遗传距离计算共同方言市场规模的工具变量。本文选取所计算出的全部相对遗传距离中最小的前10%作为具有共同遗传距离的市场。本文采用工具变量法后估计发现:共同方言市场对规模报酬递增行业的企业出口扩展边际与集约边际的估计结果均在1%的显著性水平上显著为正,但对规模报酬递减行业的企业出口扩展边际与集约边际的估计结果均在1%显著性水平上显著为负,这与基准估计所得到的结果相同。与此同时,我们应当注意到采用工具变量法估计所得到的系数,在绝对值上相比基准估计均有所增大,这表明内生性问题确实导致了共同方言市场效应的低估,但工具变量估计并未改变本文基准估计所得到的基本结论。
4. 样本稳健性分析。本文将那些出口额占销售额比重超过90%的企业识别为外向型企业,并将其从样本中删去,以保证样本的稳健性。估计结果表明,在规模报酬递增行业中,共同方言市场变量的估计系数在1%的显著性水平上显著为正;但在规模报酬递减行业中,估计系数却在5%的显著性水平上显著为负。这表明基准回归中的估计结果仍然是稳健的。进一步发现,规模报酬系数与共同方言市场交乘项的估计系数显著为正,而共同方言市场与资本转售率的估计系数显著为负,这同样证实了基准回归结果的稳健性。本文再采用1998−2007年中国工业企业数据的面板数据,假设各县的共同方言市场规模变量不随时间而变化,发现在控制年份固定效应后,估计结果仍然保持稳健。
五、结论与启示
全面形成国内统一的大市场格局是中国发挥本地市场效应与规模经济优势的关键,突破不同地区在文化与语言上的无形壁垒是进一步推进区域均衡发展战略的重点。尤其是,方言造成的本地市场分割严重限制了本地市场效应的发挥,导致本地规模报酬递增行业的出口竞争力下降,从而抑制本地出口企业发挥潜在的规模经济。本文在这样的现实背景下,利用中国工业企业数据与方言数据,测算了中国不同县级行政区的共同方言市场规模,构建计量模型检验了共同方言市场对企业出口扩展边际与集约边际的影响。本文从规模经济分组与双重差分两个角度对共同方言市场的出口效应进行检验。本文的研究发现,共同方言市场规模的扩大不仅将导致规模报酬递增行业内企业数量的增加,而且也将导致企业出口规模的扩大,同时促进了规模报酬递增行业的企业在扩展边际与集约边际上的扩张。在采用行业层面的规模报酬系数与资本转售率构建双重差分模型进行估计后,本文同样证实了共同方言市场规模扩张所带来的出口效应,共同方言市场规模的扩张对企业出口的影响存在显著的规模经济偏向特征,将导致本国出口结构更加偏向规模报酬递增行业,从而有利于发挥规模经济。本文的研究拓展了现有研究对文化与经济之间关系的讨论,为该领域研究提供了新的视角与证据。
本文从方言的视角丰富了本地市场效应以及市场分割影响出口的研究,为方言影响经济绩效的机制分析提供了重要证据。本文的研究表明,方言是文化的重要表现形式,文化的版图约束了市场的扩展,形成了经济上的文化块状结构。打破方言和族群以语言为特征的身份识别与认知障碍,有利于打破地区间的市场分割,形成全国有效的统一市场,从而利用规模经济形成中国对外贸易的新动能。虽然历史文化与方言的形成是一个持久的过程,对地方市场形成的影响也是深远的,但本文的研究结论仍然支撑了现有区域均衡发展战略的实施路径。政府能够通过改革户籍制度促进地区间的人口流动,削弱方言对本地市场的主导作用,从而消除方言对市场分割带来的无形壁垒。此外,政府应当进一步推广普通话、提高本地基础教育的质量和水平,从而从根本上改变方言所带来的沟通障碍与隔阂。但我们也应当看到,方言所带来的市场分割只是其经济效应的一部分,方言所带来的文化多样性同样可能促进创新性思想的产生,从各个方面对经济发展带来更多的可能性。因此,如何权衡好文化与方言所带来的复杂效应,以及保存好文化与方言标记同样是未来的重大挑战。
① 商务印书馆在2012年重新修订了《中国语言地图集(第2版)》,但由于本文所选取的样本均在2012年之前,采用该更新的数据库可能不合适,且增加了出口影响方言的内生性问题风险。此外,2007年后中国工业企业数据库就不再汇报中间品与增加值的信息。因此,为了突破诸多研究限制和最大程度地避免内生性问题,本文最终并未选取《中国语言地图集(第2版)》作为整理资料的依据,而是采用了1987年出版的《中国语言地图集》。
② 因篇幅所限,本文未在文中汇报各行业的规模报酬递增与递减的特征;如有需要,可向作者索取。
③ 因篇幅所限,本文未在文中报告稳健性估计结果;如有需要,可向作者索取。
[1] | 高翔, 龙小宁. 省级行政区划造成的文化分割会影响区域经济吗?[J]. 经济学(季刊), 2016(2): 647–674. |
[2] | 黄玖立, 刘畅. 方言与社会信任[J]. 财经研究, 2017(7): 83–94. |
[3] | 林建浩, 赵子乐. 均衡发展的隐形壁垒: 方言、制度与技术扩散[J]. 经济研究, 2017(9): 182–197. DOI:10.3969/j.issn.1673-291X.2017.09.080 |
[4] | 刘毓芸, 戴天仕, 徐现祥. 汉语方言、市场分割与资源错配[J]. 经济学(季刊), 2017(4): 1583–1600. |
[5] | 钱学锋, 黄云湖. 中国制造业本地市场效应再估计: 基于多国模型框架的分析[J]. 世界经济, 2013(6): 59–78. |
[6] | 许宝华, 宫田一郎. 汉语方言大词典[M]. 北京: 中华书局, 1999. |
[7] | 徐现祥, 刘毓芸, 肖泽凯. 方言与经济增长[J]. 经济学报, 2015(2): 1–32. DOI:10.3969/j.issn.1005-913X.2015.02.002 |
[8] | 张杰, 张培丽, 黄泰岩. 市场分割推动了中国企业出口吗?[J]. 经济研究, 2010(8): 29–41. DOI:10.3969/j.issn.1005-913X.2010.08.015 |
[9] | 张杰, 郑文平. 政府补贴如何影响中国企业出口的二元边际[J]. 世界经济, 2015(6): 22–48. |
[10] | 赵桐茂, 张工梁, 朱永明, 等. 中国人免疫球蛋白同种异型的研究: 中华民族起源的一个假说[J]. 遗传学报, 1991(2): 97–108. |
[11] | 中国社会科学院, 澳大利亚人文科学院. 中国语言地图集[M]. 中国香港: 朗文出版(远东)有限公司, 1987. |
[12] | 朱希伟, 金祥荣, 罗德明. 国内市场分割与中国的出口贸易扩张[J]. 经济研究, 2005(12): 68–76. DOI:10.3969/j.issn.1002-5863.2005.12.042 |
[13] | Balasubramanian N, Sivadasan J. Capital resalability, productivity dispersion, and market structure[J]. The Review of Economics and Statistics, 2009, 91(3): 547–557. DOI:10.1162/rest.91.3.547 |
[14] | Coşar A K, Grieco P L E, Li S Y, et al. What drives home market advantage?[J]. Journal of International Economics, 2018, 110: 135–150. DOI:10.1016/j.jinteco.2017.11.001 |
[15] | Hedrick P W. A new approach to measuring genetic similarity[J]. Evolution, 1971, 25(2): 276–280. DOI:10.1111/evo.1971.25.issue-2 |
[16] | Jensen R T, Miller N H. Market integration, demand and the growth of firms: Evidence from a natural experiment in India[R]. NBER Working Paper No. 24693, 2018. |
[17] | Krugman P. Scale economies, product differentiation, and the pattern of trade[J]. The American Economic Review, 1980, 70(5): 950–959. |
[18] | Krugman P R. Increasing returns, monopolistic competition, and international trade[J]. Journal of International Economics, 1979, 9(4): 469–479. DOI:10.1016/0022-1996(79)90017-5 |
[19] | Melitz M J. The impact of trade on intra-industry reallocations and aggregate industry productivity[J]. Econometrica, 2003, 71(6): 1695–1725. DOI:10.1111/ecta.2003.71.issue-6 |
[20] | Nei M. Genetic distance between populations[J]. The American Naturalist, 1972, 106(949): 283–292. DOI:10.1086/282771 |
[21] | Olley G S, Pakes A. The dynamics of productivity in the telecommunications equipment industry[J]. Econometrica, 1996, 64(6): 1263–1297. DOI:10.2307/2171831 |
[22] | Rajan R G, Zingales L. Financial dependence and growth[J]. The American Economic Review, 1998, 88(3): 559–586. |
[23] | Young A. The razor’s edge: Distortions and incremental reform in the People’s Republic of China[J]. The Quarterly Journal of Economics, 2000, 115(4): 1091–1135. DOI:10.1162/003355300555024 |