
一、引 言
数字经济时代,数据作为新型生产要素的地位日益凸显,成为经济转型、创新发展与社会治理的新动力(刘涛雄等,2024)。公共数据是海量数据的重要组成部分,具有显著的公共品属性,对各类数据要素开发利用具有基础性、示范性作用(方锦程等,2023)。然而,由于意愿不足、机制建设滞后,在一段时间内,国内公共数据处于“沉睡”状态,难以发挥其蕴含的巨大经济社会价值。近年来,国家高度重视公共数据开发利用,连续发布一系列政策文件。2015年8月,国务院发布《促进大数据发展行动纲要》,提出“稳步推动公共数据资源开放”,这标志着公共数据开放上升为国家战略。2024年10月,中共中央办公厅、国务院办公厅发布《关于加快公共数据资源开发利用的意见》,提出“有效扩大公共数据供给,提高公共数据资源配置效率和使用效益”,这是中央层面首次对公共数据资源开发利用进行系统部署,为新阶段高质量推进公共数据开发利用提供了行动指南。
2017年12月,习近平总书记在中共中央政治局第二次集体学习时指出,发挥数据的基础资源作用和创新引擎作用,加快形成以创新为主要引领和支撑的数字经济。创新是新质生产力的显著特征,数字创新作为大国重塑创新格局的前沿领域,构成新质生产力建设的关键内容。数字时代,数据是科研活动的重要要素,正从底层驱动创新范式变革(江小涓等,2024)。数据要素具有可再生性和规模效益倍增效应以及正外部性,有助于降低企业成本,提升生产效率,从而推动数字创新(徐翔等,2021)。特别是数据与其他要素的高效融合,对以创新为核心要义的新质生产力建设具有显著促进作用(戚聿东和徐凯歌,2023;蒋永穆和薛蔚然,2024)。
梳理文献发现,随着对数据作为新型生产要素认识的不断深化,公共数据开放的研究从图书与情报分析领域快速拓展至经济学领域,研究方法也从定性规范分析转向定量识别。早期研究主要聚焦于公共数据开放的制度框架建设和多元影响因素(Zuiderwijk和Janssen,2014)。鉴于公共数据有效利用具有巨大的价值潜力(Zhao和Fan,2021),有文献从宏观和微观层面开展了实证分析(Jetzek等,2019)。在宏观层面,公共数据开放能够促进区域协调发展(方锦程等,2023),提升城市创业活力(蔡运坤等,2024)。在微观层面,公共数据开放成为资本跨区域流动(蓝发钦等,2024)、企业有效投资提振(王海等,2024)和全要素生产率提升(彭远怀,2023)的重要动力。
部分文献开始关注公共数据开放的创新效应,但往往将不同类型的创新视为一个整体(陈艳利和蒋琪,2024),忽略了传统创新与数字创新之间的差异。近期虽已有文献注意到这一区别(郑浦阳,2024),但仍未能充分考虑省域大空间尺度下不同城市在公共数据开放方面的差异,从而影响了效应评估的精细程度。数字创新是数字经济时代的重要特征,也是形成新质生产力的有效途径,与数据要素的创新配置密切相关(佟家栋和张千,2024)。探究公共数据开放如何赋能企业数字创新,不仅有助于深化对数据要素创新驱动作用的认识,也是探寻加快新质生产力建设路径的现实需求。为此,本文在构建理论模型的基础上,采用 2007—2021 年中国 A 股非金融上市公司的数据,将地级市公共数据平台开放视为准自然实验,运用渐进双重差分方法,识别了公共数据开放的数字创新效应。研究发现,公共数据开放能够显著促进企业数字创新,这一效应通过强化创新基础支撑、提升创新意愿和增强创新动力的一体化逻辑实现,且效应大小因企业规模、行业技术与竞争特征以及地方数字经济政策强度的不同而呈现异质性;此外,公共数据开放的整体质量和平台建设质量能够促进企业数字创新,而数据开放质量和政策保障力度的作用尚未凸显。
本文的研究贡献主要体现在:第一,聚焦数字中国背景下在新质生产力建设中发挥独特作用的数字创新,将公共数据开放所释放的数据要素纳入内生增长理论模型中,阐释了公共数据要素投入与企业创新之间的动态关系,为理解公共数据开放所产生的数字创新效应提供了简明严谨的数理框架。第二,本文遵循数理分析与经验识别相互贯通的思路,基于强化创新基础支撑、提升创新意愿和增强创新动力的链式逻辑,明确了公共数据开放影响企业数字创新的路径,拓展了数据要素价值创造的生成逻辑链条和创新红利释放的研究视野。第三,本文结合企业规模、行业技术与竞争环境、数字经济政策供给强度等异质性特征以及公共数据平台的质量特征,将经验证据拓展至企业—行业—地区三重层面和公共数据开放的质量维度,从而丰富了公共数据开放的数字创新效应的评估视角。这为进一步完善公共数据开放制度,提高公共数据开放质量,实现数字创新红利,从而加快新质生产力建设提供了更具针对性和精细化的政策启示。
二、制度背景与典型事实
自20世纪90年代美国率先发起开放数据行动以来,公共数据开放浪潮席卷全球,但各国际组织和国家在实施重点上存在差异。进入21世纪后,伴随信息经济、数字政务和数字经济的蓬勃发展,我国相关实践从早期的信息资源开发利用逐步拓展到数据要素深度开发,从政务信息公开深化为公共数据开放共享,这一演进过程充分体现了政策制定者对数据要素和公共数据价值认知的持续深化。
公共数据类型丰富,蕴藏巨大的经济社会价值。然而,《全国数据资源调查报告(2023)》显示,2023年我国数据生产总量达32.85ZB(泽字节),但仅有2.9%的数据被存储,且存储数据中约40%在一年内未被读取或复用,数据利用率非常低。数据要素作用的发挥在很大程度上取决于数据的可得性、流通性和利用程度。作为国家重要的基础性战略资源,公共数据的开放利用具有示范引领作用。
在国内实践中,公共数据开放正加速从战略理念转化为具体实践,地方政府积极建设公共数据开放平台。根据《数据流通利用研究报告(2024)》,截至2023年底,我国城市级公共数据开放平台已达226个,开放数据集增至34万个。参与公共数据开放的城市数量持续增加,数据供给规模不断扩大。公共数据平台开放为加快构建数据基础设施、推动公共数据开放政策落地和促进数字创新提供了重要支撑。
本文基于相关数据绘制了公共数据开放平台数量与数字创新产出的变化趋势图。
三、理论模型与研究假设
(一)理论模型
公共数据开放强化了数据要素的核心地位,革新了传统生产函数并催生了创新的“新组合”。作为形成新质生产力的关键生产要素,数据要素主要依托数据生产力驱动,推动企业内部结构、运营模式、管理策略和资源配置的深度变革(Ciampi等,2021;任保平和郭晗,2024),从而衍生出“新模式”,即企业创新的过程。为从理论上阐释公共数据开放与企业数字创新的内在联系,本文在De Ridder(2021)以及唐要家等(2022)的理论基础上,将公共数据要素纳入企业创新决策行为的内生增长理论框架中。
1. 消费者。假设经济中的消费者是同质的,消费者的效用函数可以表示为:
| $ U = \int_0^\infty {\exp ( - \rho t)\ln {C_t}{\rm{d}}t} $ | (1) |
其中,
2. 总产出。生产部门由所有的在位企业构成,总产出可定义为:
| $ Y = \exp \int_0^1 {\ln (\sum\limits_{i \in {I_j}} {{q_{ij}}{y_{ij}}){\rm{d}}j} } $ | (2) |
其中,
3. 公共数据资本投入与企业生产函数。企业
| $ {y_{ij}} = {l_{ij}}/{s_{ij}} $ | (3) |
其中,企业
劳动力与公共数据资本的结合对产出产生特殊影响:一方面,企业在开发利用公共数据资本时,其效率存在显著差异,企业特有的成本参数
| $ f({s_{ij}},{\varphi _i}) = \omega {\varphi _i}({s_{ij}^{ - \vartheta }} - 1) $ | (4) |
式(4)在
4. 最优定价与公共数据资本投入。企业运用公共数据资本优化生产决策的过程如下:首先,企业对公共数据进行清洗、挖掘和分析,核心目标是评估公共数据资本的合理投入水平
在价格制定过程中,鉴于企业间成本的异质性,市场领导者通常将定价锚定在次优企业的边际成本水平,而其他竞争者则被动遵循自身边际成本进行定价。这一机制直接促使市场形成特定的均衡状态,即形成均衡价格
所有企业
关于公共数据资本投入决策,根据式(4),在产出水平
| $ {s_{ij}}^* = \min \left[ {{{\left[{{( {{y_{ij}}^*} )}^{ - 1}}\vartheta {\varphi _i}\right]}^{\tfrac{1}{{\vartheta + 1}}}},1} \right] $ | (5) |
将市场均衡价格和最优产出
| $ {s_{ij}}^* = \min \left[ {{{({s_{ - i\tilde j}}\frac{{{q_{ij}}}}{{{q_{ - i\tilde j}}}}\frac{\omega }{Y}\vartheta {\varphi _i})}^{\tfrac{1}{{\vartheta + 1}}}},1} \right] $ | (6) |
式(6)表明,当其他企业降低
综合成本最小化的一阶条件、零利润原则和市场需求方程,通过将式(4)代入,可确定质量调整的临界价格:
| $ {p^c}({\varphi _i}) = \min \left[ {{{\left[ {\frac{\omega }{{Y + \omega {\varphi _i}}}\left[{{( {\vartheta {\varphi _i}} )}^{\tfrac{1}{{\vartheta + 1}}}} + {\varphi _i}{{( {\vartheta {\varphi _i}} )}^{\tfrac{\vartheta }{{\vartheta + 1}}}}\right]} \right]}^{\tfrac{{\vartheta + 1}}{\vartheta }}}Y,\omega } \right] $ | (7) |
5. 企业价格加成。在伯特兰德竞争框架下,占据主导地位的企业
| $ {p_{ij}} = \omega ({q_{ij}}/{q_{ - i\tilde j}}) $ | (8) |
根据
| $ {\mu _{ij}} = \frac{{{p_{ij}} - m{c_{ij}}}}{{{p_{ij}}}} = 1 - \frac{{m{c_{ij}}}}{{{p_{ij}}}} = 1 - \frac{{{s_{ij}}}}{{{q_{ij}}/{q_{ - i\tilde j}}}} $ | (9) |
式(9)表明,公共数据资本的投入可使企业边际成本
6. 创新。为维持市场竞争优势,企业通过积极开展研发活动推动技术创新,提升专利产出水平,提高创新概率
| $ r{d^x}({x_i},{\mu _i}) = {\eta ^x}{x_i}^{{\vartheta ^x}}{\mu _i}^{ - \sigma } $ | (10) |
其中,
| $ {q_{ij}} = {q_{ - i\tilde j}}{\lambda _{ij}} $ | (11) |
在综合考虑消费者对产品质量与价格双重关注的情况下,实现真正成功的创新需满足以下条件:
| $ {\lambda _{ij}} \geqslant {p^c}({\varphi _i})/{p^c}({\varphi _{ - \tilde i}}) $ | (12) |
在激烈的市场竞争环境下,为获取竞争优势,众多企业积极投入研发创新。这种竞争突出表现为新进入企业通过研发活动试图抢占市场份额,并可能替代现有的行业参与者。新进入企业的研发投入成本模型可表示为:
| $ r{d^e}(e) = {\eta ^e}{e^{{\vartheta ^e}}} $ | (13) |
其中,
| $ \tau ({\phi }_{i})=\underset{创新成功率}{\underbrace{{\displaystyle \sum _{{\phi }_{h}\in \varphi }\mathrm{Prob}(}{\lambda }_{ih}\ge {p}^{c}({\phi }_{h})/{p}^{c}({\phi }_{i}))}}\underset{创新努力程度}{\underbrace{{\displaystyle \sum _{\mu }({M}_{\mu }({\phi }_{h}){x}_{\mu }({\phi }_{h})+eG({\phi }_{h})})}} $ | (14) |
式(14)表明,创造性破坏率主要由创新成功概率和创新努力程度决定。在位企业的竞争优势体现为创新成功概率,即成本参数为
创新的不确定性使其服从泊松分布,其累积分布函数以
| $ {\rm{Prob}}({\lambda _{ih}} \geqslant {p^c}({\varphi _h})/{p^c}({\varphi _i})) = H({p^c}({\varphi _h})/{p^c}({\varphi _i})) $ | (15) |
为确定企业价值最大化所对应的研发支出水平,本文基于Akcigit和Kerr(2018)的研究方法构建企业市场价值函数:
| $ r{V_t}({\varphi _i},{\tilde J_i}) - \bar V({\varphi _i},{\tilde J_i}) = \mathop {\max }\limits_{{x_{_i}}} \left\{ {\begin{array}{*{20}{c}} {\sum {_{j \in {{\tilde J}_i}}{\pi _t}({\varphi _i},{\lambda _{ij}}) + \tau ({\varphi _i})\left[ {{V_t}({\varphi _i},{{\tilde J}_i}/{\lambda _{ij}}) - {V_t}({\varphi _i},{{\tilde J}_i})} \right]} } \\ { + {x_i}P({\varphi _i}){E_{{\varphi _i}}}[{V_t}({\varphi _i},{{\tilde J}_i}{ \cup _ + }{\lambda _{ij}}) - {V_t}({\varphi _i},{{\tilde J}_i})]} \\ { - {\omega _t}{\eta _x}{{({x_i})}^{{\psi _x}}}{\mu _i}^{ - \sigma } - F({\varphi _i},{\mu _i})} \end{array}} \right\} $ | (16) |
其中,
| $ {V_t}({\varphi _i},{\tilde J_i}) = \sum\limits_{j \in {{\tilde J}_i}} {{\pi _t}({\varphi _i},{\lambda _{ij}}){{[r - g + \tau ({\varphi _i})]}^{ - 1}}} $ | (17) |
其中,
在位企业的最优创新率为:
| $ {x_{{\mu _i}}}({\varphi _i}) = {\left[P({\varphi _i}){E_{{\varphi _i}}}[\frac{{{\pi _t}({\varphi _i},{\lambda _{ij}})}}{{r - g + \tau ({\varphi _i})}}]{({\eta ^x}{\psi ^x}\omega )^{ - 1}}\right]^{\tfrac{1}{{{\psi ^x} - 1}}}}{\mu _i}^{\tfrac{\sigma }{{{\psi ^x} - 1}}} $ | (18) |
类似地,新进入企业的最优创新率为:
| $ e = {\left[\sum\nolimits_{{\varphi _e} \in \phi } {G({\varphi _e})P({\varphi _e})} {E_{{\varphi _h}}}[\frac{{\pi ({\varphi _e},{\lambda _{ej}})}}{{r - g + \tau ({\varphi _e})}}]{({\eta ^e}{\psi ^e}\omega )^{ - 1}}\right]^{\tfrac{1}{{{\psi ^e} - 1}}}} $ | (19) |
| $ Inno = \begin{array}{*{20}{c}} {\sum {{{\left[P({\varphi _i}){E_{{\varphi _i}}}[\dfrac{{{\pi _t}({\varphi _i},{\lambda _{ij}})}}{{r - g + \tau ({\varphi _i})}}]{{({\eta ^x}{\psi ^x}\omega )}^{ - 1}}\right]}^{\tfrac{1}{{{\psi ^x} - 1}}}}{\mu _i}^{\tfrac{\sigma }{{{\psi ^x} - 1}}}} } \\ { + \left[ \sum\nolimits_{{\varphi _e} \in \phi } {G({\varphi _e})P({\varphi _e})} {E_{{\varphi _h}}}[\dfrac{{\pi ({\varphi _e},{\lambda _{ej}})}}{{r - g + \tau ({\varphi _e})}}]{{({\eta ^e}{\psi ^e}\omega )}^{ - 1}}\right]{^{\tfrac{1}{{{\psi ^e} - 1}}}}} \end{array} $ | (20) |
综上分析,公共数据开放通过增强企业数据资源可得性、降低生产边际成本,有助于提升企业盈利能力
(二)作用机制的进一步阐述
1. 强化创新基础支撑。首先,增强数据资源获取能力。作为数字时代的新型公共服务,公共数据开放为企业提供了新的数据获取渠道,有助于提升企业数据资源获取能力,增强其对市场发展趋势的分析能力,从而优化产品与服务供给结构,提高市场竞争力,增强盈利能力
2. 提升创新意愿。首先,营造社会支持氛围。公共数据开放具有显著的政策引领功能,有助于破除“数据孤岛”,缓解企业因政策支持不明而产生的数字创新投入顾虑,为基于公共数据挖掘潜在技术需求方向与创新空间提供条件(王晓丹等,2024)。其次,提升地方政府数字关注度。根据政府注意力配置理论,公共数据开放政策通过正向的政治激励逻辑降低创新过程的不确定性(李泽宇等,2024),推动企业探索新的市场空间与创新领域,从而降低创造性破坏率
3. 增强创新动力。首先,促进创新人才投入。公共数据开放促进了数据流通与使用,提高了企业信息搜寻与匹配效率(蔡运坤等,2024)。这有助于弥合区域间数据要素禀赋差距,加速信息流通与知识共享,从而激励企业扩大创新人才使用规模,促进数字创新。其次,提升研发投入强度。作为促进要素优化配置的重要机制,公共数据开放增强了企业的政策识别与研判分析能力,弱化了管理者有限理性与机会主义倾向所导致的决策失误(李唐等,2020)。这有助于推动企业加大研发投入,形成以数据为支撑的动态技术创新模式,从而促进数字创新。最后,加快企业数字化转型。面对激烈的市场竞争,精准市场分析、科学管理决策、业务流程优化、售后服务智能化等数字化转型需求不断涌现,这有助于降低在位企业与新进入企业投入数字创新面临的市场风险,提高企业数字创新成功概率
四、研究设计
(一)模型构建
考虑到不同城市设立公共数据开放平台的时间存在差异,本文采用渐进双重差分法来检验公共数据开放对企业数字创新的影响,回归模型设定如下:
| $ \mathit{patent} _{ \mathit{it} } \mathit{=a} _{ \mathit{0} } \mathit{+a} _{ \mathrm{1}} \mathit{Data} _{ \mathit{it} } \mathit{+a} _{ \mathit{j} } \mathit{Controls} _{ \mathit{it} } \mathit{+Company\_{FE}+Year\_{FE}+\varepsilon } _{ \mathit{it} } $ | (21) |
其中,patentit表示公司i在第t年的数字创新产出,Datait为政策效应观测变量,表示在第t年公司i所在城市是否实施公共数据开放政策,a1为其回归系数(预期为正)。Controls表示控制变量集合,主要包括公司与城市层面的变量;Company_FE和Year_FE分别表示公司与年份固定效应;εit表示随机误差项。上市公司数据主要来自CSMAR数据库;企业数字专利数据来自中国国家知识产权局专利数据库,并依据《数字经济及其核心产业统计分类(2021)》匹配;城市层面数据主要来自《中国城市统计年鉴》。本文剔除了财务数据缺失严重、金融类以及ST、*ST、PT和*PT类公司样本。
(二)变量定义
1. 被解释变量:企业数字创新(patent)。数字专利涵盖数字技术、信息技术、软件等领域的创新成果,能够更准确反映企业在数字化转型与信息技术应用方面的创新水平。鉴于企业专利申请量存在较多零值,为规避异常值干扰,本文对数字专利申请量进行加1后取自然对数处理。
2. 核心解释变量:公共数据开放(Datait)。若在第t年公司i所在城市已开通公共数据开放平台,则Datait取值为1,否则为0。各城市公共数据开放年份通过查询城市数据开放平台确定。
3. 控制变量。参考王竹泉等(2023)的研究,本文主要控制了公司与城市两个层面的变量。公司层面变量包括资产负债率(lev)、资产结构(pta)、无形资产比重(psa)、审计质量(big4)、现金流量(cflow)、产权性质(soe)、公司规模(size)以及公司上市年限(age),城市层面变量包括人均GDP(rgdp)和第二产业占GDP的比重(indu)。
4. 描述性统计。为削弱极端值的干扰,本文采用缩尾法,仅对非自然对数形式的控制变量在1%分位两端进行缩尾处理。经筛选,本文最终得到37 893个样本。企业数字创新变量的均值为0.744,最大值为8.498,最小值为0,凸显上市公司数字创新产出的显著差异。
五、实证结果分析
(一)基准回归分析
为检验公共数据开放对企业数字创新的影响(即新质生产力效应),本文对式(21)进行了回归分析,结果见表1。列(1)未加入控制变量,公共数据开放变量的系数在1%的水平上显著为正;列(2)控制公司与年份固定效应,公共数据开放变量的系数仍显著为正;列(3)加入控制变量但未控制公司与年份固定效应,公共数据开放变量的系数在1%的水平显著为正;列(4)加入控制变量并控制公司与年份固定效应,公共数据开放变量的系数在5%的水平显著为正。上述结果表明,公共数据开放显著促进了企业数字创新,验证了假设1。
| (1) |
(2) | (3) | (4) | |
| patent | patent | patent | patent | |
| Data | 0.417*** | 0.033*** | 0.245*** | 0.028** |
| (29.336) | (2.697) | (15.827) | (2.292) | |
| Constant | 0.596*** | 0.733*** | −3.014*** | −0.680*** |
| (83.459) | (139.572) | (−22.780) | (−4.535) | |
| 控制变量 | 未控制 | 未控制 | 控制 | 控制 |
| 公司与年份固定效应 | 未控制 | 控制 | 未控制 | 控制 |
| N | 37 893 | 37 893 | 37 893 | 37 893 |
| R2 | 0.026 | 0.805 | 0.093 | 0.806 |
| 注:*、**和***分别表示10%、5%和1%的显著性水平,括号内为t值,下表同。 | ||||
(二)稳健性检验
第一,平行趋势检验。本文以政策当期为基期进行检验,结果显示事前1至5期的置信区间均跨越零轴,满足平行趋势假设。第二,替换被解释变量。参考金环和蒋鹏程(2024)的研究,本文采用数字发明专利申请量作为替代变量。第三,Heckman两步法。本文将企业数字专利申请量大于零设为1,否则为0,并引入Probit模型估计的逆米尔斯比率以纠正样本选择偏误,结论依然成立。第四,倾向得分匹配。本文选取模型控制变量作为协变量,采用最近邻匹配法,设定0.05为卡尺阈值,分别按1∶2和1∶3的配比规则匹配,结果与上文一致。第五,排除同期政策干扰(如国家智慧城市试点政策、国家级大数据综合试验区政策),结论依然成立。第六,调整样本时间窗口与控制行业差异。本文将样本时间窗口调整为2015—2021年,并控制行业固定效应。第七,安慰剂检验。本文通过500次和1 000次随机抽样,绘制安慰剂检验中解释变量估计系数及对应P值的核密度分布,结果表明通过了检验。
(三)机制分析
1. 强化创新基础支撑。首先是增强数据资源获取能力。参考路征等(2023)的方法,本文采用数据资产来测度数据资源获取能力,并引入交互项进行机制检验。表2列(1)显示,Data×asset的系数显著为正,表明在数据资源获取能力较强的企业中,公共数据开放对数字创新的促进效应更加显著。其次是降低交易成本。参考李卫兵和张星(2023)的研究,本文以销售费用与管理费用之和除以总资产来衡量交易成本,并引入交互项进行检验。列(2)显示,Data×cost的系数显著为负,表明在交易成本较低的企业中,公共数据开放对数字创新产出的促进效应更加显著。最后是优化资源配置。本文采用黄群慧等(2019)的方法测算企业资源配置效率,并引入交互项进行检验。列(3)显示,Data×resource的系数显著为正,表明在资源配置效率较高的企业中,公共数据开放对数字创新产出的促进效应更加显著。上述结果验证了假设2。
| (1) | (2) | (3) | (4) | (5) | (6) | |
| patent | patent | patent | patent | patent | patent | |
| Data | −1.999*** | 0.050*** | 0.014 | 0.005 | −0.544 | 0.004 |
| (−10.594) | (3.149) | (0.986) | (0.306) | (−1.543) | (0.087) | |
| Data×asset | 0.088*** | |||||
| (10.637) | ||||||
| Data×cost | −0.268** | |||||
| (−2.240) | ||||||
| Data×resource | 0.048** | |||||
| (2.040) | ||||||
| Data×enacci | 0.014*** | |||||
| (3.400) | ||||||
| Data×attention | 0.078* | |||||
| (1.947) | ||||||
| Data×market | 0.007* | |||||
| (1.847) | ||||||
| Constant | −0.090 | −0.662*** | −0.620*** | −0.645*** | −0.315 | −0.628*** |
| (−0.459) | (−4.379) | (−3.916) | (−4.174) | (−1.409) | (−4.304) | |
| 控制变量、公司与年份固定效应 | 控制 | 控制 | 控制 | 控制 | 控制 | 控制 |
| N | 36 856 | 37 893 | 33 089 | 37 235 | 35 939 | 37 013 |
| R2 | 0.808 | 0.806 | 0.809 | 0.808 | 0.776 | 0.780 |
2. 提升创新意愿。首先是增强创业活跃度。参考白俊红等(2022)的研究,本文以每百人新创企业数来测度创业活跃度,并引入交互项进行机制检验。表2列(4)显示,Data×enacci的系数显著为正,表明在创业活跃度较高地区的企业中,公共数据开放对数字创新的促进效应更加显著。其次是提升地方政府数字关注度。本文参考张森等(2023)的研究构建地方政府数字关注度指标,并引入交互项进行检验。列(5)显示,Data×attention的系数显著为正,表明在地方政府数字关注度较高地区的企业中,公共数据开放对数字创新的促进效应更加显著。最后是提升制度建设水平。参考孙伟增等(2023)的研究,本文以樊纲市场化指数中的市场中介组织发育和法律制度环境细分指数来衡量制度建设水平,并引入交互项进行检验。列(6)显示,Data×market的系数显著为正,表明在制度建设水平较高地区的企业中,公共数据开放对数字创新的促进效应更加显著。上述结果验证了假设3。
3. 增强创新动力。首先是增加创新人才投入。参考徐玉德和刘晓颖(2023)的研究,本文以企业研发人员数量的自然对数衡量,并引入交互项进行机制检验。表3列(1)显示,Data×human的系数显著为正,表明在创新人才集聚度较高的企业中,公共数据开放对数字创新的促进效应更加显著。其次是提升研发投入强度。参考张叶青等(2021)的研究,本文以企业研发投入与营业收入之比衡量,并引入交互项进行检验。列(2)显示,Data×RD的系数显著为正,表明在研发投入强度较高的企业中,公共数据开放对数字创新的促进效应更加显著。最后是促进企业数字化转型。参考张文文和景维民(2024)的研究,本文以国泰安数据库中的数字化转型综合指数衡量,并引入交互项进行检验。列(3)显示,Data×digital的系数显著为正,表明在数字化转型程度较高的企业中,公共数据开放对数字创新的促进效应更加显著。上述结果验证了假设4。
| (1) | (2) | (3) | |
| patent | patent | patent | |
| Data | 0.015 | 0.008 | −0.003 |
| (1.007) | (0.560) | (−0.195) | |
| Data×human | 0.022*** | ||
| (6.780) | |||
| Data×RD | 0.006** | ||
| (2.236) | |||
| Data×digital | 0.043*** | ||
| (5.804) | |||
| Constant | −0.331** | −0.742*** | −0.410*** |
| (−2.372) | (−4.945) | (−2.834) | |
| 控制变量、公司 与年份固定效应 |
控制 | 控制 | 控制 |
| N | 36 993 | 37 893 | 37 493 |
| R2 | 0.781 | 0.806 | 0.789 |
(四)异质性分析
1. 企业规模。基于样本企业总资产的年度中位数,本文将样本企业划分为大规模企业和小规模企业两组进行异质性分析。如表4列(1)和列(2)所示,公共数据开放对小规模企业数字创新的影响更加显著,而大规模企业组的回归系数虽为正但不显著。可能的原因在于:公共数据开放作为具有普惠性的公共服务,能够提升企业数据可得性与多元性,更有利于降低小规模企业的数据收集成本,弱化小企业数字创新的阻碍,提升数字创新的可行性。
| (1)小规模 企业 |
(2)大规模 企业 |
(3)非高新 技术企业 |
(4)高新 技术企业 |
(5)行业竞争 程度低 |
(6)行业竞争 程度高 |
(7)政策供给 强度低 |
(8)政策供给 强度高 |
|
| patent | patent | patent | patent | patent | patent | patent | patent | |
| Data | 0.031* | 0.019 | 0.041*** | 0.022 | 0.003 | 0.044*** | 0.063** | 0.001 |
| (1.736) | (1.042) | (3.044) | (1.165) | (0.147) | (2.627) | (2.416) | (0.074) | |
| Constant | −1.599*** | −1.651*** | −0.462*** | −1.983*** | −1.958*** | −0.176 | −0.565*** | −1.017*** |
| (−6.044) | (−4.317) | (−3.140) | (−6.986) | (−6.629) | (−0.902) | (−2.648) | (−3.126) | |
| 控制变量、公司 与年份固定效应 |
控制 | 控制 | 控制 | 控制 | 控制 | 控制 | 控制 | 控制 |
| N | 18 950 | 18 943 | 15 808 | 22 085 | 18 141 | 19 752 | 17 825 | 20 068 |
| R2 | 0.800 | 0.842 | 0.690 | 0.807 | 0.846 | 0.779 | 0.811 | 0.862 |
| Chow检验p值 | 0.000*** | 0.000*** | 0.000*** | 0.000*** | ||||
2. 行业技术属性。根据国家统计局发布的《高技术产业(制造业)分类》,本文将样本划分为高新技术企业和非高新技术企业两组进行异质性分析。如表4列(3)和列(4)所示,公共数据开放对非高新技术企业数字创新的影响更加显著,而对高新技术企业的作用不显著。可能的原因在于:非高新技术企业通常技术与资源相对匮乏,公共数据开放能为其提供丰富的信息资源,减少数据不足的禀赋劣势,降低创新门槛,从而促进数字创新。
3. 行业竞争程度。本文采用赫芬达尔指数作为企业所处行业环境的代理变量,按该指数中位数进行分组检验。如表4列(5)和列(6)所示,在行业竞争程度较高的企业组,公共数据开放对数字创新的促进效应更加显著;而在行业竞争程度较低的企业组,公共数据开放变量的回归系数为正但不显著。可能的原因在于:公共数据开放为企业提供了更广泛全面的数据资源,增强了企业对经济发展趋势、市场动态以及消费者需求等方面的理解能力,驱动企业为应对激烈的市场竞争,更快速地调整技术创新布局与研发战略。
4. 数字经济政策供给强度。本文采用2007—2021年省级政府工作报告中与数字经济相关的关键词词频作为数字经济政策供给强度的代理变量(陶长琪和丁煜,2022),并按中位数进行分组检验。如表4列(7)和列(8)所示,在数字经济政策供给强度较低的地区,公共数据开放对数字创新的促进效应更加显著。可能的原因在于:在数字经济政策供给强度较低的地区,企业在数据收集、处理、开发与利用方面的能力相对有限,而公共数据开放能为这些企业提供额外的数据来源,填补可用数据缺口,为其数字创新提供重要支持。
六、进一步研究
本文从数据开放整体质量、数据开放质量、平台建设质量与政策保障力度四个方面开展深入分析。公共数据开放整体质量集中体现城市的公共数据开放程度与水平;开放数据的质量直接影响企业对公共数据的可信度与可利用度;高质量的平台建设能为企业提供便捷的数据获取路径与管理服务,降低企业获取所需数据的时间成本,从而支撑基于数据的创新活动;政府对公共数据开放的支持举措体现了促进公共数据开放的政策导向与行动支持,为企业数字创新营造良好环境。本文采用开放数林指数(数据来源:https://ifopendata.fudan.edu.cn)的自然对数来衡量数据开放整体质量(quality),使用数据层指数、平台层指数和准备度指数的自然对数分别反映数据开放质量(mass)、平台建设质量(plat)和政策保障力度(policy)。
表5结果显示,数据开放整体质量的系数显著为正,表明提升公共数据开放整体质量能够促进企业数字创新;数据开放质量的系数为正但不显著,这可能与各地开放数据质量参差不齐有关;平台建设质量的系数显著为正,表明公共数据开放平台建设质量与企业数字创新正相关;政策保障力度的系数为正但不显著,这可能与政策保障力度不足有关。因此,公共数据开放后仍需持续强化政策保障力度,确保公共数据开放平台有效发挥数字基础设施功能,促进数字创新。
| (1)数据开放整体质量 | (2)数据开放质量 | (3)平台建设质量 | (4)政策保障力度 | |
| patent | patent | patent | patent | |
| quality | 0.072* | |||
| (1.872) | ||||
| mass | 0.022 | |||
| (0.704) | ||||
| plat | 0.117* | |||
| (1.758) | ||||
| policy | 0.038 | |||
| (1.495) | ||||
| 控制变量、公司与年份固定效应 | 控制 | 控制 | 控制 | 控制 |
| N | 7 506 | 6 887 | 6 831 | 6 855 |
| R2 | 0.925 | 0.927 | 0.927 | 0.927 |
| 注:自2017年起,开放数林指数数据可供分析,而准备度指数自2018年可用,样本区间为2018—2021年,导致样本量较基准回归有所缩减。 | ||||
七、研究结论与政策建议
公共数据开放是建设数据基础设施的内在要求,为释放公共数据要素的创新红利提供了动力。创新是新质生产力的显著特征,数字创新是数字时代的鲜明标志和培育新质生产力的核心内容。本文以中国城市陆续开通公共数据平台作为政策冲击,基于上市公司数字专利与公共数据开放的匹配数据,运用理论模型与渐进双重差分方法,分析了公共数据开放对数字创新的影响效应(即新质生产力效应)。研究发现,公共数据开放能够促进企业数字创新,该结论在多项稳健性检验后依然成立;机制分析表明,公共数据开放通过强化创新基础支撑、提升创新意愿和增强创新动力等渠道促进企业数字创新;异质性分析表明,公共数据开放对数字创新的促进效应因企业规模、行业技术与竞争特征以及地方数字经济政策强度而存在差异;进一步研发发现,公共数据开放的整体质量和平台建设质量能够促进企业数字创新,而数据开放质量和政策保障力度的作用尚未显现。基于上述研究结论,本文提出以下政策建议:
第一,充分发挥公共数据开放强化创新基础、提升创新意愿与增强创新动力的链式功能,为企业数字创新提供基础支撑。首先,聚焦数据要素开发利用,纵深推进全国统一数据市场建设,破除“数据孤岛”,夯实数字创新基础支撑。其次,坚持开放与安全并重,构建公共数据开放横纵向政策协同与工作联动机制,形成支持数字创新的法治供给与政策供给合力,增强企业数字创新意愿。最后,遵循数字经济时代多主体协作与创新生态系统迭代升级的内在规律,围绕公共数据资源应用场景,深化政府、企业、学界与社会组织合作,赋能数字经济与新质生产力培育。
第二,聚焦重点,完善公共数据开放的实施机制。首先,健全公共数据开放标准机制。科学界定公共数据开放范围,建立国家强制性标准与行业技术规范,提升公共数据的可用性与可访问性。其次,拓展公共数据利用场景。以“数据要素×”活动为载体,引导企业挖掘公共数据与自有数据的融合应用场景与创新应用。最后,提升公共数据开放质量。明确高质量开放的原则要求、政策导向和技术规范,以高质量公共数据开放支撑高水平数字创新,加速新质生产力培育。
第三,因地制宜,构建公共数据开放的分类支持政策体系。首先,出台面向小型企业的数据开放支持政策,缓解数字鸿沟带来的不利影响。其次,立足地区禀赋实施差异化支持政策。坚持全国统筹,为数字经济政策供给强度较低的地区建设公共数据开放平台和服务网络提供专项支持;对于数字经济政策供给强度较高的地区,聚焦数智化、绿色化等领域的战略性技术创新,打造公共数据利用的先行示范区。最后,强化协同创新。支持行业协会开展“公共数据+”专题培训,构建开放、共享、协同的数字创新生态系统,提升企业数字创新能力,加速新质生产力培育。
| [1] | 白俊红, 张艺璇, 卞元超. 创新驱动政策是否提升城市创业活跃度——来自国家创新型城市试点政策的经验证据[J]. 中国工业经济, 2022(6): 61–78. DOI:10.3969/j.issn.1006-480X.2022.06.004 |
| [2] | 蔡运坤, 周京奎, 袁旺平. 数据要素共享与城市创业活力——来自公共数据开放的经验证据[J]. 数量经济技术经济研究, 2024(8): 5–25. |
| [3] | 陈艳利, 蒋琪. 数据生产要素视角下开放公共数据与企业创新——基于建立公共数据开放平台的准自然实验[J]. 经济管理, 2024(1): 25–46. |
| [4] | 方锦程, 刘颖, 高昊宇, 等. 公共数据开放能否促进区域协调发展? ——来自政府数据平台上线的准自然实验[J]. 管理世界, 2023(9): 124–142. |
| [5] | 黄群慧, 余泳泽, 张松林. 互联网发展与制造业生产率提升: 内在机制与中国经验[J]. 中国工业经济, 2019(8): 5–23. |
| [6] | 江小涓, 宫建霞, 李秋甫. 数据、数据关系与数字时代的创新范式[J]. 中国社会科学, 2024(9): 185–203. |
| [7] | 蒋永穆, 薛蔚然. 新质生产力理论推动高质量发展的体系框架与路径设计[J]. 商业经济与管理, 2024(5): 81–92. |
| [8] | 金环, 蒋鹏程. 企业家精神的数字创新激励效应——基于数字专利视角[J]. 经济管理, 2024(3): 22–39. |
| [9] | 蓝发钦, 胡晓敏, 徐卓琳. 公共数据开放能否拓展资本跨区域流动距离——基于异地并购视角[J]. 中国工业经济, 2024(9): 156–174. DOI:10.3969/j.issn.1006-480X.2024.09.009 |
| [10] | 李唐, 李青, 陈楚霞. 数据管理能力对企业生产率的影响效应——来自中国企业—劳动力匹配调查的新发现[J]. 中国工业经济, 2020(6): 174–192. |
| [11] | 李卫兵, 张星. 数字化转型与企业交易成本[J]. 华中科技大学学报(社会科学版), 2023(6): 8–17. |
| [12] | 李泽宇, 王雪方, 陈新芳. 政府数据开放对企业创新的影响效应及机制研究[J]. 科研管理, 2024(7): 11–20. |
| [13] | 刘涛雄, 张亚迪, 戎珂, 等. 数据要素成为中国经济增长新动能的机制探析[J]. 经济研究, 2024(10): 19–36. |
| [14] | 路征, 周婷, 王理, 等. 数据资产与企业发展——来自中国上市公司的经验证据[J]. 产业经济研究, 2023(4): 128–142. |
| [15] | 彭远怀. 政府数据开放的价值创造作用: 企业全要素生产率视角[J]. 数量经济技术经济研究, 2023(9): 50–70. |
| [16] | 戚聿东, 徐凯歌. 数字经济时代企业社会责任的理论认知与履践范式变革[J]. 中山大学学报(社会科学版), 2023(1): 165–176. |
| [17] | 任保平, 郭晗. 新科技革命背景下形成新质生产力的战略逻辑与实践路径[J]. 商业经济与管理, 2024(8): 21–29. |
| [18] | 孙伟增, 毛宁, 兰峰, 等. 政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验[J]. 中国工业经济, 2023(9): 117–135. DOI:10.3969/j.issn.1006-480X.2023.09.007 |
| [19] | 唐要家, 王钰, 唐春晖. 数字经济、市场结构与创新绩效[J]. 中国工业经济, 2022(10): 62–80. DOI:10.3969/j.issn.1006-480X.2022.10.004 |
| [20] | 陶长琪, 丁煜. 数字经济政策如何影响制造业企业创新——基于适宜性供给的视角[J]. 当代财经, 2022(3): 16–27. |
| [21] | 佟家栋, 张千. 数字经济时代加快发展新质生产力[J]. 广西师范大学学报(哲学社会科学版), 2024(4): 88–96. |
| [22] | 王海, 叶帅, 尹俊雅. 公共数据开放如何提振企业有效投资——基于产能利用视角[J]. 中国工业经济, 2024(8): 137–153. DOI:10.3969/j.issn.1006-480X.2024.08.008 |
| [23] | 王晓丹, 石玉堂, 刘达. 公共数据开放能促进数字经济与实体经济融合吗? ——来自政府数据平台上线的准自然实验[J]. 南方经济, 2024(9): 25–44. |
| [24] | 王竹泉, 于小悦, 马新啸. 中国式现代化、公共资源市场化配置与创新驱动发展——来自城市公共资源交易中心设立的经验证据[J]. 管理世界, 2023(2): 100–121. DOI:10.3969/j.issn.1002-5502.2023.02.006 |
| [25] | 徐翔, 厉克奥博, 田晓轩. 数据生产要素研究进展[J]. 经济学动态, 2021(4): 142–158. |
| [26] | 徐玉德, 刘晓颖. 市场准入负面清单对企业劳动收入份额的影响研究[J]. 财政研究, 2023(11): 65–78. |
| [27] | 张森, 温军, 李旭东. 城市数字经济发展与企业技术创新[J]. 经济体制改革, 2023(2): 60–68. |
| [28] | 张文文, 景维民. 数字经济监管与企业数字化转型——基于收益和成本的权衡分析[J]. 数量经济技术经济研究, 2024(1): 5–24. |
| [29] | 张叶青, 陆瑶, 李乐芸. 大数据应用对中国企业市场价值的影响——来自中国上市公司年报文本分析的证据[J]. 经济研究, 2021(12): 42–59. |
| [30] | 郑浦阳. 政府数据开放、地区要素培育与企业数字技术创新[J]. 财经科学, 2024(9): 89–103. DOI:10.3969/j.issn.1000-8306.2024.09.008 |
| [31] | Akcigit U, Kerr W R. Growth through heterogeneous innovations[J]. Journal of Political Economy, 2018, 126(4): 1374–1443. DOI:10.1086/697901 |
| [32] | Ciampi F, Demi S, Magrini A, et al. Exploring the impact of big data analytics capabilities on business model innovation: The mediating role of entrepreneurial orientation[J]. Journal of Business Research, 2021, 123: 1–13. DOI:10.1016/j.jbusres.2020.09.023 |
| [33] | De Ridder M. Market power and innovation in the intangible economy[R]. Working Paper, 2021. |
| [34] | Jetzek T, Avital M, Bjørn-Andersen N. The sustainable value of open government data[J]. Journal of the Association for Information Systems, 2019, 20(6): 702–734. |
| [35] | Zhao Y P, Fan B. Effect of an agency’s resources on the implementation of open government data[J]. Information & Management, 2021, 58(4): 103465. |
| [36] | Zuiderwijk A, Janssen M. Open data policies, their implementation and impact: A framework for comparison[J]. Government Information Quarterly, 2014, 31(1): 17–29. DOI:10.1016/j.giq.2013.04.003 |