《财经研究》
2023第49卷第6期
企业的慷慨因何而来?——基于机器学习的证据
陈运森1 , 周金泳1 , 黄健峤2     
1. 中央财经大学 会计学院,北京 100081;
2. 浙江财经大学 会计学院,浙江 杭州 310018
摘要: 慈善捐赠是企业参与第三次分配和实现共同富裕的重要渠道,而现有研究仅关注单一特征与捐赠行为之间的联系,缺乏对不同捐赠动机的比较分析,企业捐赠的主导因素仍有待深入探究。文章基于机器学习中的集成学习方法,综合讨论了多维度捐赠动机特征对捐赠行为预测能力的差异,从而识别出影响企业参与捐赠的主要动机,并找出预测能力最强的特征。研究发现:(1)与战略性动机、政治动机和外部监督压力动机相比,企业慈善捐赠行为主要受内部治理动机驱使;(2)集成学习方法对慈善捐赠行为的预测能力优于传统线性研究方法,其中渐进梯度回归树具有最强的解释能力和最高的预测精度;(3)在多维度动机特征中,管理层薪酬激励、大股东资金占用行为、销售费用率、分析师关注程度、实际业绩表现和商业信用融资对慈善捐赠行为的预测效果最佳。文章不仅运用机器学习方法有效识别了企业慈善捐赠的关键因素,而且对完善三次分配制度、推进共同富裕具有重要启示。
关键词: 捐赠    共同富裕    机器学习    集成学习    社会责任    
How does the Generosity of Enterprises Come? Evidence from Machine Learning
Chen Yunsen1, Zhou Jinyong1, Huang Jianqiao2     
1. School of Accountancy, Central University of Finance and Economics, Beijing 100081, China;
2. School of Accountancy, Zhejiang University of Finance and Economics, Hangzhou 310018, China
Summary: Charitable donation is an important channel for enterprises to participate in the third distribution. As a micro way to achieve the goal of common prosperity, charitable donations have become increasingly important. Benefiting from the government attention and the widespread concern on ESG, Chinese enterprises have actively participated in charitable donations in recent years. However, the real motivation of corporate charitable donations in China has always been one of the most controversial topics in practical and academic levels. Existing literature mainly focuses on the relationship between single characteristic and donation behavior, and makes predictions only within the sample, lacking a comprehensive consideration of different charitable donation motivations. Therefore, the intrinsic driving factor of corporate charitable donations is still a fundamental issue and remains to be further explored. According to previous literature, this paper divides the charitable donation motivation into four categories, namely, strategic motivation, political motivation, internal governance motivation, and external supervision pressure motivation. By using XGBoost, gradient boosting regression tree and random forest in the integrated learning method, this paper finds that: (1) Compared with strategic motivation, political motivation, and external supervision pressure motivation, corporate charitable donations are mainly driven by internal governance motivation, which indicates that corporate donations are mainly affected by internal governance factors. (2) The predictive ability of ensemble learning method for corporate charitable donations is better than that of traditional linear research methods, and the gradient boosting regression tree has the strongest explanatory ability and the highest prediction accuracy. (3) Among the multidimensional motivational characteristics, management compensation incentive, large shareholders’ fund occupation behavior, sales expense ratio, analyst attention, real performance, and trade credit financing have the best prediction effect on corporate charitable donations. The possible contributions of this paper are as follows: At the theoretical level, by systematically testing corporate charitable donation motivation, it evaluates and compares the predictive ability of different dimensions of motivational characteristics for corporate charitable donations, and answers the basic question of the internal factors driving corporate donations, which enriches the research in the field of corporate charitable donation motivation. At the methodological level, it applies the ensemble learning in machine learning to the study of charitable donation motivation for the first time, and constructs a model with stronger explanatory ability and higher prediction accuracy for corporate donations, which enriches the application scope of machine learning in the field of accounting and finance, and lays a good foundation for further prediction analysis. At the practical level, it shows that in order to support more enterprises to participate in charitable donations, policymakers can guide listed companies to strengthen internal governance, and increase the emphasis on the dominant factors of charitable donations.
Key words: donations    common prosperity    machine learning    ensemble learning    social responsibility    

一、引 言

党的二十大报告指出要“着力维护和促进社会公平正义,着力促进全体人民共同富裕”。共同富裕是社会主义的奋斗目标,自提出以来便成为关注重点。而作为实现共同富裕目标的微观途径,慈善捐赠的重要性日益突出。企业从事慈善捐赠有助于带动贫困地区和贫困群体的发展,推动完善三次分配制度,从而达到兼顾效率和公平的目的。由于政府很重视且ESG理念得到广泛关注,近年来我国企业积极参与慈善捐赠。然而,中国企业慈善捐赠的真实动因一直是实务界和学术界争议很大的话题之一。现有文献主要聚焦于单一维度动机的某一特征与企业捐赠行为之间的关联,而且仅在样本内(within sample)进行预测(Bertrand等,2020梁建等,2010许年行和李哲,2016李四海等,2016),缺乏对企业捐赠动机的综合性考虑,因而得出的研究结论可能无法很好地推及至全样本,企业慈善捐赠行为的内在驱动因素仍是亟需了解但尚缺乏共识的基础性问题。

本文的研究目标是基于多维度捐赠动机特征来构建一个公司慈善捐赠行为的样本外(out of sample)预测模型,尝试分析不同类型动机对捐赠行为预测能力的差异,并识别出驱使企业参与捐赠的主要因素及影响模式。本文创新性地使用机器学习中的集成学习(ensemble learning)方法来探究企业慈善捐赠行为的主要动因,其优势在于:第一,关于慈善捐赠动机的现有文献主要采用多元线性回归进行研究,但数据间的实际关系往往是非线性的,这意味着线性模型难以准确解释变量间的复杂关系。相比而言,一方面,集成学习能够有效处理变量间的非线性关系以及可能存在的交互作用,由此构建出的模型能够更好地反映实际情况;另一方面,集成学习方法无需预先设定模型中变量间的函数形式,而是根据训练集数据尽可能地拟合出变量间的实际关系,因而比传统线性研究方法更适用于预测性分析(Kleinberg等,2015)。第二,集成学习利用相对重要性(relative importance)和部分依赖图(partial dependence plot)等手段,能够分析不同变量对慈善捐赠行为预测能力的差异,并描绘特定变量影响企业捐赠的具体模式,为变量间的对比分析提供便利。

本文参考现有文献的做法(Gautier和Pache,2015),将企业参与慈善捐赠的动机划分为以下四个维度:(1)战略性动机。公司慈善行为与绩效是相容的,公司参与慈善捐赠直接服务于企业战略目标并提升企业价值(Zhang等,2010)。典型的战略性动机包括企业借助慈善行为降低因业绩下滑而带来的外部风险(李四海等,2016),以及通过慈善捐赠来缓解资本市场绩效压力(王菁等,2014)。基于以往的文献,与这一动机相适应的公司特征有企业的财务战略、营销战略、研发战略和环保策略等。(2)政治动机。企业会将慈善行为视作建立或强化与政府之间关系的“政治献金”(张敏等,2013戴亦一等,2014)。虽然政治动机也具有战略性动机的属性,但是鉴于政商关系是我国资本市场中十分重要的研究话题,且政治动机是企业慈善捐赠动机中相对独立的研究领域,本文选择单独考虑政治动机。典型的政治动机是企业出于建立或维持政治关联而从事捐赠行为(贾明和张喆,2010薛爽和肖星,2011)。与这一动机相适应的公司特征有企业的政治关联、产权性质以及政府补助收入。(3)内部治理动机。高管或股东等公司内部治理主体的异质性会导致企业间的慈善捐赠行为存在差异。例如,持股比例高的CEO通过捐赠获得的私人收益更少,因而其所在公司的捐赠意愿更弱(Masulis和Reza,2015)。与这一动机相适应的公司特征主要分为高管个人特质、企业治理结构和股东特质三个方面。(4)外部监督压力动机。作为企业社会责任的重要组成部分,慈善捐赠还会受到机构投资者和分析师等公司外部利益相关者监督作用的影响(Zhang等,2015Adhikari,2016Chen等,2020)。例如,Chen等(2020)发现机构投资者会通过增加企业社会责任股东提案的方式来促进企业提高社会责任绩效,且这一效应在机构投资者持股比例高的公司中更加显著。与这一动机相适应的外部利益相关者特征包括机构投资者、分析师、审计师、监管机构和媒体等方面。

本文采用集成学习方法中的XGBoostextreme gradient boosting)、渐进梯度回归树(gradient boosting regression tree)和随机森林(random forest)展开研究,结果显示在多维度捐赠动机中,内部治理动机对企业捐赠行为的预测能力要优于战略性动机、政治动机和外部监督压力动机,这表明企业慈善捐赠主要受到内部治理因素影响。集成学习方法对捐赠行为的解释能力和预测精度均优于以多元线性回归为代表的传统线性研究方法,其中渐进梯度回归树具有最好的预测性能。在众多衡量捐赠动机的变量中,本文发现董事长薪酬、销售费用率、其他应收款资产比、分析师跟踪人数、实际业绩表现和商业信用融资对企业慈善捐赠行为的预测效果最佳。具体地,董事长薪酬水平较高时与企业慈善捐赠水平正相关;随着分析师跟踪人数的增加,企业捐赠水平呈现先上升后下降的模式;其他应收款资产比、销售费用率和实际业绩表现较低时与捐赠水平正相关;商业信用融资与企业捐赠水平负相关。在变更训练集划分方法、变更慈善捐赠水平的度量指标和使用滞后一期特征变量等稳健性分析后,上述结果依然不变。

本文可能的创新体现在:在理论层面,中国企业慈善捐赠的动因一直是争议很大的话题,而现有文献主要基于单一维度捐赠动机来讨论企业慈善捐赠行为,缺乏对不同动机的对比分析,企业从事捐赠的关键因素及具体影响机制仍有待探究。本文系统梳理和检验了企业慈善捐赠动机,不仅评估和比较了不同维度动机特征对企业慈善捐赠行为的预测能力,还回答了“驱使企业捐赠的内在因素”这一基础性问题,从而丰富了企业慈善捐赠动机领域的研究(Bertrand等,2020梁建等,2010高勇强等,2011曹海敏和孟元,2019)。在方法论层面,关于慈善捐赠动机的现有文献以基于多元线性回归的因果推断研究为主,本文首次将机器学习中的集成学习方法应用于慈善捐赠动机研究,构建了对企业捐赠行为解释能力更强且预测精度更高的模型。这丰富了机器学习方法在会计和财务领域的应用范畴,也为后续开展预测性分析奠定了良好的基础。在实践层面,实现共同富裕是一个长期过程,而构建公平合理的收入分配制度是其中的关键性环节。本文研究表明,政策制定者可以考虑引导上市公司加强内部治理建设,同时提高对慈善捐赠行为主导因素的重视程度,支持更多有意愿有能力的企业参与到慈善捐赠事业中,从而实现共同富裕。

二、文献评述

(一)机器学习在会计和财务领域中的应用

根据研究对象的不同,本文将海外学者对机器学习方法的应用分为以下三类:(1)在会计违规行为方面,Cecchini等(2010)以及Bao等(2020)分别利用支持向量机(support vector machine)和集成学习方法来识别公司财务舞弊行为,所构建的舞弊预测模型均显著优于逻辑回归模型。(2)在金融中介机构行为方面,Cao等(2021)运用财务信息、宏观经济指标等多维度数据,开发出在股价预测和超额回报率两方面均显著优于分析师的人工智能分析师。(3)在管理层行为方面,Chen等(2022)证实了集成学习方法在预测公司未来盈余变动方面的有用性。相比而言,国内学者对机器学习方法的应用处于起步阶段。李斌等(2019)检验了不同机器学习方法对市场异象因子的识别能力。陆瑶等(2020)采用提升法(Boosting)考察了高管特征与公司业绩之间的关系。胡楠等(2021)则利用词向量法构建了管理层短视主义指标。

机器学习方法在会计和财务领域尚未得到充分应用,国内仅有少数学者将机器学习应用于前沿研究。本文首次将机器学习方法运用于预测企业慈善捐赠行为,这不仅为探究企业捐赠行为提供了便利,还拓宽了机器学习在会计和财务领域的研究范畴。

(二)慈善捐赠动机

现有研究主要采用多元线性回归考察了慈善捐赠的以下四类动机:(1)战略性动机。慈善捐赠行为与公司获取广告效用的意愿及组织实际业绩和期望业绩的差距正相关(Brown等,2006)。此外,企业还会借助慈善捐赠掩盖自身不当行为,降低因业绩下滑而带来的外部风险(高勇强等,2012李四海等,2016)。(2)政治动机。企业家的政治参与以及公司与政府之间的政治关联都对慈善捐赠行为具有显著的正向效应(Bertrand等,2020梁建等,2010薛爽和肖星,2011张敏等,2013戴亦一等,2014)。(3)内部治理动机。CEO持股比例和任期等高管个人特质、董事会规模和独立董事比例等治理结构特征以及控股股东股权质押水平和掏空动机等股东特质都会显著影响企业捐赠行为(Marquis和Lee,2013Masulis和Reza,2015Chen等,2018梁建等,2010许年行和李哲,2016胡珺等,2020)。(4)外部监督压力动机。Chen等(2020)发现,企业社会责任绩效会随机构投资者持股比例的上升而增加。分析师对企业社会责任的影响则尚未达成共识,Adhikari(2016)发现分析师关注程度高的公司在社会责任方面的表现更差,而Zhang等(2015)则得出了相反的结论。此外,徐莉萍等(2011)发现媒体关注对公司捐赠行为具有显著的正向影响。

关于企业慈善捐赠动机的现有研究主要基于单一维度动机的某一特征展开讨论,缺乏对捐赠动机的综合考量和对比分析,而且大多仅讨论样本内预测结果,研究结论未必适用于全样本。本文则比较了不同维度动机特征的差异,并考察了其样本外预测能力。这有助于更加全面地探讨企业慈善捐赠动机,并找出企业参与慈善捐赠的关键驱动因素。 1

三、研究设计

(一)研究方法

集成学习通过构建并结合多个基学习器,能够获得比单一学习器更强的样本外泛化能力。按照基学习器间是否相互独立,集成学习方法可以分为基学习器相互联系的串行化方法和基学习器互相独立的并行化方法。本文参考现有文献的做法(Chen等,2022),选取两类方法下目前最先进的渐进梯度回归树、XGBoost和随机森林作为主要研究方法,并以线性研究方法中的多元线性回归和LASSO作为对照。与以线性假定为基础的多元线性回归和LASSO相比,集成学习方法允许变量间非线性和交互关系存在,而且更适用于样本外预测(Kleinberg等,2015)。本文预期集成学习方法对企业慈善捐赠行为的预测效果要优于多元线性回归等线性研究方法。

(二)模型性能评估方法

本文从模型解释能力和预测误差两个方面来考察模型性能。在模型解释能力方面,参考现有文献的做法(Bertomeu等,2021陆瑶等,2020),本文采用样本内拟合优度 $ {R}_{IS}^{2} $ 来评估各研究方法对训练集样本的训练效果,样本内拟合优度越高,模型对训练集样本的可解释性也越高。同时,本文采用样本外拟合优度 $ {R}_{OOS}^{2} $ 来考察模型的泛化能力。 2 此外,本文还采用可解释方差 $ {EVS}_{OOS} $ explained variance score)来评估预测值分散性与实际值分散性的相近程度,从方差的视角衡量模型的泛化能力。

在模型预测误差方面,本文参考Chen等(2022)的做法,采用样本外均方误差 $ {MSE}_{OOS} $ 来考察预测值与实际值的偏离程度,样本外均方误差越小,模型预测准确度越高。然而,如果测试集样本中存在偏离程度较大的离群值(outlier),则均方误差的估计会与实际情况不符。因此,本文还采用平均绝对误差 $ {MAE}_{OOS} $ 和绝对中位差 $ {MedAE}_{OOS} $ 来评估模型预测的准确性。其中,平均绝对误差减弱了离群值对估计结果的影响,绝对中位差则考察了预测误差的中位数。综合这三类预测误差方面的指标,可以比较全面地评估模型的预测准确性。评估指标的含义和计算方法见表1

表 1 模型评估指标与计算方法
评估指标 指标含义 计算方法
$ {R}_{IS}^{2} $ 样本内拟合优度,在训练集中,模型预测值对实际观测值的拟合程度 $ {R}_{IS}^{2}/{R}_{OOS}^{2}=1-\frac{\sum _{i=1}^{n}{\left({y}_{i}-\widehat{{y}_{i}}\right)}^{2}}{\sum _{i=1}^{n}{\left({y}_{i}-\stackrel{-}{y}\right)}^{2}} $
$ {R}_{OOS}^{2} $ 样本外拟合优度,在测试集中,模型预测值对实际观测值的拟合程度
$ {EVS}_{OOS} $ 可解释方差,在测试集中,模型预测值变异程度对实际观测值变异程度的拟合程度 $ {EVS}_{OOS}=1-var\left(\mathit{y}-\widehat{\mathit{y}}\right)/var\left(\mathit{y}\right) $
$ {MSE}_{OOS} $ 均方误差,样本外预测值与实际值之差平方的期望值 $ {MSE}_{OOS}=(1/n)\sum _{i=1}^{n}{\left({y}_{i}-\widehat{{y}_{i}}\right)}^{2} $
$ {MAE}_{OOS} $ 平均绝对误差,样本外预测值与实际值之差绝对值的期望值 $ {MAE}_{OOS}=(1/n)\sum _{i=1}^{n}\left|{y}_{i}-\widehat{{y}_{i}}\right| $
$ {MedAE}_{OOS} $ 绝对中位差,样本外预测值与实际值之差绝对值的中位数 $ {MedAE}_{OOS}=\mathrm{m}\mathrm{e}\mathrm{d}\mathrm{i}\mathrm{a}\mathrm{n}\;\;\mathrm{o}\mathrm{f}\;\;\left|{y}_{i}-\widehat{{y}_{i}}\right| $

(三)模型结果解释

由于集成学习方法包含多个基学习器,集成后的模型无法按单一学习器的方式解释(周志华,2016)。对此,本文利用相对重要性和部分依赖图来解读集成学习模型背后的经济学内涵。相对重要性是指在模型拟合过程中,某一变量相对于模型中其他变量的重要程度。根据Friedman(2001)的做法,给定模型中其他部分不变,通过度量在模型中加入某一变量所带来的损失函数的下降程度,即可获得该变量的相对重要性。相对重要性越大,这一变量对企业慈善捐赠行为的预测能力越强。此外,本文还利用部分依赖图来分析单个变量对慈善捐赠行为的预测模式(Friedman,2001),其主要思想为:假设其他特征不变,衡量某一变量的变化引起企业慈善捐赠水平的变化情况,然后将其用图像的形式展现出来。

四、数据来源与变量定义

(一)数据来源

本文以2010—2019年A股上市公司作为初始样本,在剔除金融类企业、ST和*ST以及数据缺失的样本后,最终得到17 507个观测值。政治关联数据手工收集获得,其他数据均来自国泰安(CSMAR)数据库,其中企业捐赠数据根据上市公司财务报表附注中“营业外支出”一栏披露的捐赠支出得到,主要包括“对外捐赠”“捐赠支出”“公益性捐赠支出”等。为了缓解极端值的影响,本文对所有连续变量进行了上下1%的缩尾处理。

(二)变量定义

借鉴戴亦一等(2014)以及曹海敏和孟元(2019)的研究,本文选择企业年度对外捐赠金额的自然对数(Donation)作为响应变量。 3 基于慈善捐赠动机和企业社会责任领域的现有研究,本文从以下四个维度选取模型中的捐赠动机特征:(1)战略性动机。虽然业绩表现越好的公司捐赠水平越高,但是业绩表现不佳的企业并未减少捐赠,反而更加注重参与慈善捐赠,这一策略有助于降低因业绩下滑而导致商业信用流失的风险(王菁等,2014李四海等,2016)。基于此,本文选择实际业绩表现(ROA)、相对业绩表现(Relativeperf)、业绩表现方向(DP)和商业信用融资(Payable)这四个变量来衡量公司因业绩变化而作出的战略性慈善行为。类似地,本文参考现有研究(Brown等,2006高勇强等,2012),采用环保投入(Environ)、销售费用率(Salefee_ratio)以及研发投入资产比(RD)来考察与公司环保策略、营销战略和研发战略相关的战略性慈善行为。(2)政治动机。企业会出于建立或维持政治关联的目的而从事捐赠(Bertrand等,2020贾明和张喆,2010薛爽和肖星,2011),而且基于“互惠交换”原则,获得政府补助越多的企业越可能参与慈善捐赠(李四海等,2012),而这一政企纽带效应在国有企业中相对更强。因此,本文采用政治关联虚拟变量(Politician)、政府补助资产比(Subsidy)和产权性质(Soe)来衡量企业捐赠的政治动机。(3)内部治理动机。一方面,高管个人特质会影响企业的慈善捐赠行为(Masulis和Reza,2015;李四海,2012;许年行和李哲,2016)。在中国,企业的决策核心通常是董事长(胡楠等,2021),本文考察董事长的年龄、性别、持股比例、任期、薪酬、背景经历等8个个人特质对捐赠行为的影响。另一方面,企业治理结构也会对慈善捐赠产生显著影响(Marquis和Lee,2013)。基于此,本文采用是否两职合一(Duality)、独立董事比例(Indep_ratio)和董事会规模(Bsize)来考察治理结构对企业捐赠的影响。此外,股东的行为决策也会影响公司慈善捐赠。参考现有研究(Tan和Tang,2016胡珺等,2020),本文采用第一大股东持股比例(Top1)、前十大股东持股比例(Top10)、大股东占款(Tunneling)和控股股东持股比例(Pledge)来考察股东对慈善捐赠的影响。(4)外部监督压力动机。机构投资者会通过参与公司治理的方式,促使企业更加积极地承担社会责任(Chen等,2020王海妹,2014)。基于此,本文采用机构投资者持股比例(Institution)来衡量机构投资者对企业捐赠行为的影响。分析师对企业捐赠行为的影响尚未达成共识。有研究发现,分析师跟踪人数与公司承担社会责任的意愿负相关(Adhikari,2016);但也有研究发现,分析师跟踪人数更多的企业慈善捐赠水平更高(Zhang等,2015)。对此,本文采用分析师跟踪人数(Analyst_num)来探究分析师关注与捐赠行为之间的关系。对审计师而言,高质量审计可以作为一种有效的外部监督机制。公司慈善捐赠等社会责任信息能够帮助审计师更好地了解被审计单位并评估重大错报风险,审计师对社会责任信息的关注反过来又会促进企业更好地履行捐赠等社会责任(陈丽红等,2015)。参考陈丽红等(2015)的做法,本文采用是否由国际“四大”事务所进行审计(Big4)作为审计质量的代理变量,考察审计师对企业捐赠行为的影响。对监管机构而言,本文使用公司是否违法违规(Violate)来探究监管部门对企业捐赠的潜在影响。考虑到公司可见度和外部治理环境也是影响企业慈善捐赠外部压力的重要因素(徐莉萍等,2011),本文还采用媒体关注度(Media)和市场化指数(Market_idx)分别衡量公司可见度和外部治理环境,考察其对捐赠行为的影响。

参考现有文献的做法(张敏等,2013李四海等,2016胡珺等,2020),本文在模型中加入了公司上市年数(Listage)、公司规模(Lnsize)、资产负债率(Lev)、销售增长率(Growth)、现金比率(Cash_ratio)和经营活动现金流比率(Cashflow_ratio)这6个控制变量。本文最终在模型中纳入了37个特征变量,变量定义见表2

表 2 变量定义
变量类型 变量符号 变量定义
响应变量 Donation 企业慈善捐赠水平,公司年度对外捐赠额加1后的自然对数
战略性动机特征 ROA 资产收益率=净利润/总资产
Relativeperf 相对业绩表现,公司年度资产回报率减去前三年资产回报率均值
DP 业绩表现方向,相对业绩表现小于0时取1,否则取0
Payable 商业信用融资=应付账款/总负债
Environ 环保投入,公司环保投入金额的自然对数
Salefee_ratio 销售费用率=销售费用/营业收入
RD 研发投入资产比=研发投入/总资产
政治动机特征 Politician 政治关联,若董事长、总经理中有1人现任或曾任政府官员则取1,否则取0
Subsidy 政府补助资产比,公司年度收到的政府补助/总资产×100
Soe 产权性质,若公司属于国有企业则取1,否则取0
内部治理动机特征 Bage 董事长年龄,董事长年龄加1后的自然对数
Bgender 董事长性别,若董事长为男性则取1,否则取0
Bshare 董事长持股比例=董事长持股数/总股本
Btenure 董事长任期,董事长任期月数加1后的自然对数
Bsalary 董事长薪酬,董事长薪酬加1后的自然对数
Finance_skill 若董事长有财务、金融、法律工作经验则取1,否则取0
内部治理动机特征 Market_skill 若董事长有市场、管理、人力资源工作经验则取1,否则取0
Product_skill 若董事长有生产、技术、设计工作经验则取1,否则取0
Duality 是否两职合一,若董事长与CEO为同一人则取1,否则取0
Indep_ratio 独立董事比例=独立董事人数/董事会总人数
Bsize 董事会规模,董事会人数的自然对数
Top1 第一大股东持股比例=第一大股东持股数/总股本
Top10 前十大股东持股比例=前十大股东持股数/总股本
Tunneling 大股东占款,以其他应收款占总资产比重衡量
Pledge 控股股东股权质押比例=控股股东股权质押数/总股本
外部监督压力
动机特征
Institution 机构投资者持股比例=机构投资者持股数/总股本
Analyst_num 分析师跟踪人数,年度跟踪公司的分析师(团队)数量加1后的自然对数
Violate 公司是否违法违规,若公司年度因违法违规受到处罚则取1,否则取0
Big4 若公司由国际“四大”审计则取1,否则取0
Media 媒体关注度,年度报刊媒体和网络新闻中标题出现公司的频率加1后的自然对数
Market_idx 外部治理环境指数,采用公司所在省份市场化得分衡量
控制变量 Listage 公司上市年数
Lnsize 公司规模,公司总资产的自然对数
Lev 公司资产负债率=总负债/总资产
Growth 公司销售增长率
Cash_ratio 现金比率=(现金+等值现金)/流动负债
Cashflow_ratio 经营活动产生的现金流量净额与总资产的比值

五、实证结果分析

(一)描述性统计 4

根据本文统计,企业慈善捐赠水平(Donation)的均值和中位数分别为9.126和11.695,标准差为5.959,这意味着不同企业间的慈善捐赠行为差异较大。所有特征变量的分布特征与以往文献基本一致,且数值均在合理范围内(李四海等,2016许年行和李哲,2016)。

(二)基于集成学习方法构建的模型对慈善捐赠水平的预测效果

表3列示了不同方法下模型的拟合结果。在模型解释能力方面,列(1)结果显示,XGBoost、渐进梯度回归树和随机森林的样本内拟合优度 $ {R}_{IS}^{2} $ 均显著高于多元线性回归或LASSO,其中随机森林具有最高的 $ {R}_{IS}^{2} $ ,这意味着集成学习方法能够获得比线性研究方法更好的样本内拟合效果。对于模型的泛化能力,列(2)和列(3)结果显示,渐进梯度回归树具有最高的样本外拟合优度 $ {R}_{OOS}^{2} $ 和可解释方差 $ {EVS}_{OOS} $ ,随机森林次之,XGBoost的模型表现较为平均。这说明集成学习方法不仅能更好地拟合训练集数据,还能更好地预测公司慈善捐赠水平。集成学习方法在泛化能力上的提升效果非常明显,以 $ {R}_{OOS}^{2} $ 为例,与多元线性回归模型相比,XGBoost、渐进梯度回归树和随机森林分别提升了31.45%、59.30%和53.49%。在模型预测误差方面,列(4)结果显示,集成学习方法的样本外均方误差 $ {MSE}_{OOS} $ 普遍较低,与多元线性回归相比,XGBoost、渐进梯度回归树和随机森林的样本外均方误差分别降低了6.56%、12.34%和11.15%。根据列(5)和列(6)的结果,渐进梯度回归树仍具有最低的平均绝对误差 $ {MAE}_{OOS} $ 和绝对中位差 $ {MedAE}_{OOS} $ ,但是随机森林在这两种指标上的表现并未明显优于多元线性回归,XGBoost也并未有效降低预测误差。这意味着在缓解离群值的干扰之后,随机森林在预测准确性方面的提升作用较小,XGBoost对于本文研究问题的适用性可能较差。

表 3 模型拟合结果
$ {R}_{IS}^{2} $ $ {R}_{OOS}^{2} $ $ {EVS}_{OOS} $ $ {MSE}_{OOS} $ $ {MAE}_{OOS} $ $ {MedAE}_{OOS} $
(1) (2) (3) (4) (5) (6)
多元线性回归 0.206 0.172 0.178 29.240 4.493 4.029
LASSO 0.199 0.170 0.176 29.322 4.544 4.078
XGBoost 0.565 0.226 0.240 27.322 4.495 4.175
渐进梯度回归树 0.821 0.274 0.282 25.632 4.184 3.631
随机森林 0.888 0.264 0.273 25.980 4.356 3.968

整体而言,以多元线性回归和LASSO为代表的线性研究方法在模型解释能力和预测误差两个方面的表现均不如集成学习方法。本文认为,这可能是因为线性研究方法忽略了变量间的非线性关系以及可能存在的交互作用,导致模型解释能力较低、预测误差较大。相比而言,集成学习方法采用更合适的函数形式对数据进行拟合,从而构建出对企业慈善捐赠行为解释能力更强且预测精度更高的研究模型。同时,本文通过找出对公司慈善捐赠水平预测相对更有效的集成学习方法,能够进一步基于这一方法探究企业从事慈善捐赠的主要动机和关键影响因素。

(三)不同捐赠动机对慈善捐赠行为预测能力的差异

为了探究不同维度动机特征对捐赠行为预测能力的差异,本文首先构建了仅包含公司上市年数(Listage)、公司规模(Lnsize)6个控制变量的基准模型,然后参考Bertomeu等(2021),计算并对比在基准模型中加入捐赠动机的不同组合后的预测性能。考虑到基于不同评估指标得出的研究结论基本一致,本文以样本外拟合优度 $ {R}_{OOS}^{2} $ 为代表展开分析,研究结果见表4 5

表 4 不同捐赠动机组合下模型的预测性能
$ {R}_{OOS}^{2} $ 多元线性回归 LASSO XGBoost 渐进梯度回归树 随机森林
(1) (2) (3) (4) (5)
基准模型 0.096 0.096 0.121 0.127 0.141
基准+战略 0.131 0.130 0.177 0.201 0.218
基准+政治 0.127 0.127 0.149 0.165 0.185
基准+治理 0.132 0.132 0.193 0.233 0.252
基准+监督 0.120 0.119 0.145 0.169 0.179
基准+战略+政治 0.154 0.153 0.191 0.224 0.237
基准+战略+治理 0.156 0.155 0.218 0.263 0.271
基准+战略+监督 0.146 0.146 0.187 0.225 0.227
基准+政治+治理 0.144 0.144 0.198 0.240 0.256
基准+政治+监督 0.144 0.143 0.162 0.197 0.202
基准+治理+监督 0.145 0.144 0.196 0.242 0.247
基准+战略+政治+治理 0.165 0.164 0.222 0.269 0.272
基准+战略+政治+监督 0.164 0.163 0.197 0.240 0.238
基准+战略+治理+监督 0.163 0.162 0.218 0.269 0.263
基准+政治+治理+监督 0.156 0.156 0.201 0.249 0.250
基准+战略+政治+治理+监督 0.172 0.170 0.226 0.274 0.264

第一,仅考虑单一维度捐赠动机对慈善捐赠行为预测能力的差异。与其他动机相比,在基准模型中加入内部治理动机特征能够获得最佳的表现。以渐进梯度回归树为例,在基准模型中分别加入战略性动机、政治动机、内部治理动机和外部监督压力动机后,模型的 $ {R}_{OOS}^{2} $ 分别提高了58.27%、29.92%、83.46%和33.07%。第二,考虑不同捐赠动机组合对慈善捐赠行为预测能力的差异。 6 可以看到,包含内部治理动机特征的特定组合具有最佳的表现:当组合两类动机特征时,在基准模型加入内部治理动机和战略性动机会获得最高的模型解释能力;当组合三类动机特征时,在基准模型加入内部治理动机、战略性动机和政治动机会获得最高的模型解释能力。上述结果意味着内部治理动机能够更有效且更准确地预测企业的慈善捐赠行为,因此可以从高管和股东等内部治理主体入手,引导其所在公司增强对外捐赠的意愿,促进更多上市公司参与到慈善捐赠事业中,从而实现共同富裕。

(四)不同特征对于捐赠行为预测能力的差异

本文进一步基于渐进梯度回归树和随机森林这两种方法,利用变量相对重要性比较了集成学习模型中不同特征变量对企业慈善捐赠行为预测能力的差异。表5Panel A报告了变量的相对重要性排序。在众多捐赠动机特征中,董事长薪酬、其他应收款资产比、销售费用率、分析师跟踪人数、实际业绩表现和商业信用融资对慈善捐赠行为的预测效果最好,这些变量在渐进梯度回归树和随机森林中的相对重要性均排在前10位,这说明这些特征更可能是影响企业参与慈善捐赠的关键因素。 7 表5Panel B列示了各维度捐赠动机特征在两种方法下的累计相对重要性。内部治理动机特征的累计相对重要性远高于其他维度动机特征,这进一步表明内部治理动机对慈善捐赠行为的预测能力要高于战略性动机、政治动机和外部监督压力动机。

表 5 变量相对重要性
Panel A:变量相对重要性排序
序号 渐进梯度回归树 随机森林
变量 相对重要性 变量 相对重要性
1 Lnsize 12.599% Lnsize 10.019%
2 Tunneling 5.572% Bsalary 5.213%
3 Bsalary 5.353% Analyst_num 4.930%
4 Salefee_ratio 5.282% Tunneling 4.896%
5 ROA 4.657% ROA 4.563%
6 Payable 4.527% Salefee_ratio 4.423%
7 Analyst_num 4.373% Media 4.265%
8 Cashflow_ratio 4.132% Payable 4.194%
9 Growth 3.874% Growth 3.852%
10 Tunneling 5.572% Bsalary 5.213%
Panel B:不同维度捐赠动机特征的累计相对重要性
战略性动机 政治动机 内部治理动机 外部监督压力动机
渐进梯度回归树 21.111% 4.553% 29.305% 14.409%
随机森林 20.439% 4.418% 30.885% 15.795%

(五)重要动机特征对慈善捐赠行为的预测模式

在众多捐赠动机特征中,本文发现董事长薪酬、其他应收款资产比、销售费用率、分析师跟踪人数、实际业绩表现和商业信用融资对慈善捐赠行为的预测效果最佳。那么,这些变量对公司捐赠行为的影响是怎样的?对此,本文利用部分依赖图回答这一问题。

1. 董事长薪酬激励

图1是董事长薪酬的部分依赖图,当薪酬水平较低时(0%—40%分位区间),董事长薪酬变动对企业慈善捐赠水平的影响不明显;而在此之后,随着董事长薪酬的增加,企业慈善捐赠水平迅速上升。一个可能的原因是,当董事长薪酬水平较高时(40%分位点对应的董事长薪酬约为30万元),董事长的基本物质需求容易达到满足,此时更倾向于追求身份上的认同,而慈善捐赠正是提升企业家社会形象和地位的重要手段之一 。

图 1 董事长薪酬的部分依赖图

2. 大股东资金占用行为

图2是其他应收款资产比的部分依赖图。当其他应收款资产比小于10%分位点时,随着其他应收款资产比的增加,企业慈善捐赠水平迅速上升。这说明在控制了其他捐赠动机后,管理层或股东倾向于通过慈善捐赠转移公众注意力,从而达到掩盖其资金占用等不当行为的目的。而在此之后,其他应收款资产比的变动引起捐赠水平的变化较小,这可能意味着企业慈善捐赠行为主要与公司是否存在大股东掏空行为相关,而大股东掏空行为的严重程度对捐赠水平的影响不明显。

图 2 其他应收款资产比的部分依赖图

3. 销售费用率

图3是销售费用率的部分依赖图。综合渐进梯度回归树和随机森林的部分依赖图,当销售费用率处于0%—40%分位区间时(此时相应的销售费用率区间为0%—3.5%),企业慈善捐赠水平随着销售费用率的增加而迅速上升;而在此之后,销售费用率对捐赠水平的影响比较微弱。这表明注重广告投入的企业更有可能进行慈善捐赠,从而达到建立公司品牌形象、提高公司知名度等目的;此外,这也说明销售费用率处于较低水平时对公司慈善捐赠水平的影响更加显著。

图 3 销售费用率的部分依赖图

4. 分析师关注程度

图4是分析师跟踪人数的部分依赖图。当分析师跟踪人数处于0%—80%分位区间时(约0—8名分析师或分析师团队),随着分析师跟踪人数的增加,企业慈善捐赠水平开始变化不明显,而后迅速上升,拐点出现在分析师跟踪人数的第六十分位点(约8名分析师或分析师团队)。这支持了声誉理论,即分析师的关注能够帮助企业通过从事捐赠来积累声誉资本,从而提高企业参与捐赠的积极性。当分析师跟踪人数处于80%—100%分位区间时,企业慈善捐赠水平并未随分析师跟踪人数的增加而上升,甚至有所降低。这支持了管理层投机理论,即在信息不对称的环境中,具有投机倾向的管理层可能会通过参与捐赠来谋取不当利益,而分析师的监督有助于抑制这一行为。从部分依赖图的结果看,本文为分析师与企业社会责任之间的关系存在争议提供了一种可能的解释:分析师跟踪人数会影响分析师与企业承担社会责任意愿之间的关系,当分析师跟踪人数低于一定数量时,分析师的声誉机制起主导作用;而当分析师跟踪人数高于一定数量时,分析师对管理层投机行为的监督机制起主导作用。

图 4 分析师跟踪人数的部分依赖图

5. 实际业绩表现与商业信用融资

图5是实际业绩表现与商业信用融资的部分依赖图。当资产收益率处于0%—70%分位区间时(此时相应的资产收益率为−27.5%—5.3%),业绩越好的企业慈善捐赠水平越高,这表明业绩表现好的公司更可能参与慈善捐赠。而当资产收益率处于70%—100%分位区间时,业绩表现对公司慈善捐赠水平的影响变得不明显。这可能是因为这些公司本身的盈利能力足够强,无需再通过更多的慈善捐赠向外界传递公司财务状况良好且现金流充裕的信号。本文采用应付账款占总负债的比重来衡量企业的商业信用融资,这一指标数值越大,企业的商业信用越好。可以看到,随着商业信用融资的增加,企业慈善捐赠水平呈现下降的趋势,这符合李四海等(2016)的预期,即商业信用良好的企业无需通过捐赠的方式来维持或增加商业信用资源。

图 5 实际业绩表现与商业信用融资的部分依赖图

(六)稳健性检验

第一,变更训练集划分方法。本文在主检验中通过滚动窗口的方式确定训练集和测试集,这种做法充分利用了研究样本,但损失了一定的随机性。对此,本文从随机性的角度出发,使用以下两种方法来重新确定训练集和测试集:(1)按7∶3的比例对公司进行随机划分,即选择样本中2 710家上市公司中的1 897家作为训练集,剩余公司作为测试集;(2)同样按7∶3的比例对全样本进行随机划分,即选择全样本中的12 255个观测值作为训练集,剩余5 252个观测值作为测试集。变更训练集划分方法后的分析结果见表6,研究结论保持不变。

表 6 变更训练集划分方法的模型拟合结果
Panel A:按公司随机划分
$ {R}_{IS}^{2} $ $ {R}_{OOS}^{2} $ $ {EVS}_{OOS} $ $ {MSE}_{OOS} $ $ {MAE}_{OOS} $ $ {MedAE}_{OOS} $
多元线性回归 0.197 0.156 0.157 30.515 4.660 4.268
LASSO 0.197 0.158 0.158 30.467 4.661 4.271
XGBoost 0.427 0.174 0.176 29.879 4.715 4.371
渐进梯度回归树 0.519 0.171 0.171 29.991 4.554 3.977
随机森林 0.915 0.167 0.167 30.119 4.690 4.299
Panel B:全样本随机划分
$ {R}_{IS}^{2} $ $ {R}_{OOS}^{2} $ $ {EVS}_{OOS} $ $ {MSE}_{OOS} $ $ {MAE}_{OOS} $ $ {MedAE}_{OOS} $
多元线性回归 0.189 0.180 0.181 28.399 4.473 4.067
LASSO 0.189 0.180 0.181 28.392 4.478 4.091
XGBoost 0.405 0.243 0.252 26.220 4.419 4.112
渐进梯度回归树 0.983 0.354 0.355 22.360 3.787 3.167
随机森林 0.908 0.311 0.313 23.852 4.104 3.664

第二,变更慈善捐赠的度量指标。为了消除企业规模等影响,本文参考现有文献的做法(张敏等,2013李维安等,2015),对企业捐赠额使用资产总额或营业收入进行规模化处理。规模化处理后的研究结论与上文基本一致。此外,本文还使用和讯网对企业慈善捐赠行为的评分作为替代变量重新拟合模型,基于这一评分的研究结论与上文一致。检验结果见表7

表 7 变更慈善捐赠度量指标的模型拟合结果
Panel A:将企业捐赠额使用资产总额进行规模化处理
$ {R}_{IS}^{2} $ $ {R}_{OOS}^{2} $ $ {EVS}_{OOS} $ $ {MSE}_{OOS} $ $ {MAE}_{OOS} $ $ {MedAE}_{OOS} $
多元线性回归 0.131 0.083 0.088 0.045 0.128 0.088
LASSO 0.101 0.078 0.084 0.045 0.128 0.088
XGBoost 0.297 0.094 0.118 0.045 0.138 0.097
渐进梯度回归树 0.861 0.144 0.160 0.042 0.127 0.081
随机森林 0.876 0.175 0.193 0.041 0.128 0.090
Panel B:将企业捐赠额使用营业收入进行规模化处理
$ {R}_{IS}^{2} $ $ {R}_{OOS}^{2} $ $ {EVS}_{OOS} $ $ {MSE}_{OOS} $ $ {MAE}_{OOS} $ $ {MedAE}_{OOS} $
多元线性回归 0.138 0.095 0.099 0.110 0.211 0.148
LASSO 0.119 0.093 0.098 0.110 0.209 0.147
XGBoost 0.395 0.109 0.125 0.108 0.218 0.151
渐进梯度回归树 0.851 0.137 0.151 0.105 0.207 0.134
随机森林 0.877 0.163 0.179 0.102 0.210 0.149
Panel C:使用和讯网对企业慈善捐赠行为的评分
$ {R}_{IS}^{2} $ $ {R}_{OOS}^{2} $ $ {EVS}_{OOS} $ $ {MSE}_{OOS} $ $ {MAE}_{OOS} $ $ {MedAE}_{OOS} $
多元线性回归 0.176 0.129 0.140 18.188 3.116 2.320
LASSO 0.168 0.130 0.141 18.173 3.109 2.318
XGBoost 0.598 0.327 0.333 14.084 2.641 1.845
渐进梯度回归树 0.848 0.327 0.338 14.074 2.651 1.898
随机森林 0.906 0.353 0.364 13.532 2.596 1.857

此外,本文还做了以下稳健性检验:采用特征变量滞后一期的数据,通过变更训练窗口期、变更训练集划分方法和变更慈善捐赠度量指标来比较不同捐赠特征组合下的模型预测性能,借助累计局部效应图(ALE plots)来检验部分依赖图的独立性假设。经过上述稳健性检验,研究结论未发生实质性改变。受篇幅限制,文中未列示这些稳健性检验结果。

六、结论与启示

慈善捐赠是企业参与实现共同富裕的重要途径。现有文献集中于讨论单一动机特征与企业捐赠行为之间的关联并仅在样本内进行预测(Bertrand等,2020许年行和李哲,2016李四海等,2016),缺乏对慈善捐赠动机的综合讨论和从样本外预测出发的系统性结论,捐赠行为的内在驱动因素仍是富有争议性且亟待研究的基础性问题。本文将慈善捐赠动机划分为战略性动机、政治动机、内部治理动机和外部监督压力动机四个维度。本文对慈善捐赠动机进行分类的目的是探究不同维度捐赠动机对企业捐赠预测能力的差异,并对各类捐赠动机进行比较分析,从预测的角度识别出相对关键的动机。在此基础上,本文的主要目标是识别出影响企业参与捐赠的关键因素,并分析这些重要特征影响企业捐赠行为的具体模式。本文创新性地使用集成学习方法展开分析,利用相对重要性和部分依赖图等手段,集成学习方法有助于实现本文的研究目的。本文通过对比在基准模型中加入不同维度捐赠动机组合后的拟合效果,发现内部治理动机能够更有效且更准确地预测企业慈善捐赠行为。这意味着与战略性动机、政治动机和外部监督压力动机相比,内部治理动机是影响企业捐赠行为的主导因素。与多元线性回归等线性研究方法相比,集成学习方法在模型解释能力和预测误差两个方面均获得了更好的表现,其中渐进梯度回归树具有最好的预测性能。在众多动机特征中,董事长薪酬、销售费用率、其他应收款资产比、分析师跟踪人数、实际业绩表现和商业信用融资对捐赠行为的预测效果最佳。

基于上述研究结论,本文具有以下政策启示:第一,相关部门应引导上市公司加强内部治理建设。党的二十大报告强调“坚持按劳分配为主体、多种分配方式并存,构建初次分配、再分配、第三次分配协调配套的制度体系”。慈善捐赠是三次分配的重要环节,而企业更是慈善捐赠的重要主体。本文研究表明,企业慈善捐赠行为较多地受到内部治理动机影响。政策制定者可以考虑引导上市公司改善内部治理环境,促进更多企业通过慈善捐赠的方式扎实推动共同富裕。例如,可以优化董事长薪酬体系,激励其所在公司增强捐赠意愿,引导更多有能力的企业积极参与公益慈善。第二,监管部门应合理调整慈善监管重心。党的二十大报告明确要“健全社会保障体系”,而慈善事业制度是社会保障体系的重要环节。监管部门可以提高对企业业绩表现、股东资金占用行为和分析师关注程度等慈善捐赠行为重要影响因素的重视程度,更加及时准确地把握企业参与慈善捐赠的现状及未来走向,推动慈善事业有序发展。第三,应持续推进机器学习在会计和财务领域中的应用。本文研究表明,与传统实证研究方法相比,机器学习方法能够对企业慈善捐赠行为进行更加有效的预测。作为一项应用前景广阔的技术,以机器学习为代表的人工智能技术是学术新思想、科学新发展的重要策源。本文的研究有助于进一步启发人工智能技术在会计和财务领域中的应用与落地。

1样本内预测先使用全部观测值来拟合模型,然后比较模型预测值与实际观测值的差异;样本外预测则先将观测值划分为训练集和测试集,在拟合模型时仅使用训练集数据,然后比较测试集中模型预测值与实际观测值的差异。

2泛化能力是指模型对未知数据的适应能力,泛化能力越强,说明训练后的模型对全样本的预测和解释能力越强。

3在机器学习领域研究中,通常将因变量称为响应变量,自变量称为特征变量。

4受篇幅限制,文中未列示描述性统计结果,如有需要可向作者索取。

5表中分别以“战略”“政治”“治理”“监督”表示战略性动机、政治动机、内部治理动机和外部监督压力动机。

6在模型中增加解释变量并利用改变后的模型重新进行估计时,模型的样本内拟合效果会相应提高,但由于过拟合风险的存在,加入更多的变量未必能有效提升模型的样本外预测能力,因此本文的结果有助于检验不同维度捐赠动机能否有效预测慈善捐赠行为。

7受篇幅限制,文中未列示其他变量的相对重要性排序。

主要参考文献
[1] 曹海敏, 孟元. 企业慈善捐赠是伪善吗——基于股价崩盘风险视角的研究[J]. 会计研究, 2019(4): 89–96. DOI:10.3969/j.issn.1003-2886.2019.04.012
[2] 陈丽红, 张龙平, 叶馨. 产权性质、审计质量、产品类型与慈善捐赠——基于战略慈善观的分析[J]. 审计研究, 2015(5): 68–75.
[3] 戴亦一, 潘越, 冯舒. 中国企业的慈善捐赠是一种“政治献金”吗? ——来自市委书记更替的证据[J]. 经济研究, 2014(2): 74–86.
[4] 高勇强, 陈亚静, 张云均. “红领巾”还是“绿领巾”: 民营企业慈善捐赠动机研究[J]. 管理世界, 2012(8): 106–114.
[5] 高勇强, 何晓斌, 李路路. 民营企业家社会身份、经济条件与企业慈善捐赠[J]. 经济研究, 2011(12): 111–123.
[6] 胡珺, 彭远怀, 宋献中, 等. 控股股东股权质押与策略性慈善捐赠——控制权转移风险的视角[J]. 中国工业经济, 2020(2): 174–192. DOI:10.19581/j.cnki.ciejournal.2020.02.010
[7] 胡楠, 薛付婧, 王昊楠. 管理者短视主义影响企业长期投资吗? ——基于文本分析和机器学习[J]. 管理世界, 2021(5): 139–156. DOI:10.3969/j.issn.1002-5502.2021.05.012
[8] 贾明, 张喆. 高管的政治关联影响公司慈善行为吗?[J]. 管理世界, 2010(4): 99–113. DOI:10.19744/j.cnki.11-1235/f.2010.04.011
[9] 李斌, 邵新月, 李玥阳. 机器学习驱动的基本面量化投资研究[J]. 中国工业经济, 2019(8): 61–79. DOI:10.19581/j.cnki.ciejournal.2019.08.004
[10] 李四海, 陈旋, 宋献中. 穷人的慷慨: 一个战略性动机的研究[J]. 管理世界, 2016(5): 116–127.
[11] 李维安, 王鹏程, 徐业坤. 慈善捐赠、政治关联与债务融资——民营企业与政府的资源交换行为[J]. 南开管理评论, 2015(1): 4–14. DOI:10.3969/j.issn.1008-3448.2015.01.002
[12] 梁建, 陈爽英, 盖庆恩. 民营企业的政治参与、治理结构与慈善捐赠[J]. 管理世界, 2010(7): 109–118. DOI:10.19744/j.cnki.11-1235/f.2010.07.011
[13] 陆瑶, 张叶青, 黎波, 等. 高管个人特征与公司业绩——基于机器学习的经验证据[J]. 管理科学学报, 2020(2): 120–140.
[14] 王海妹, 吕晓静, 林晚发. 外资参股和高管、机构持股对企业社会责任的影响——基于中国A股上市公司的实证研究[J]. 会计研究, 2014(8): 81–87. DOI:10.3969/j.issn.1003-2886.2014.08.011
[15] 王菁, 程博, 孙元欣. 期望绩效反馈效果对企业研发和慈善捐赠行为的影响[J]. 管理世界, 2014(8): 115–133. DOI:10.19744/j.cnki.11-1235/f.2014.08.011
[16] 徐莉萍, 辛宇, 祝继高. 媒体关注与上市公司社会责任之履行——基于汶川地震捐款的实证研究[J]. 管理世界, 2011(3): 135–143. DOI:10.19744/j.cnki.11-1235/f.2011.03.014
[17] 许年行, 李哲. 高管贫困经历与企业慈善捐赠[J]. 经济研究, 2016(12): 133–146.
[18] 薛爽, 肖星. 捐赠: 民营企业强化政治关联的手段?[J]. 财经研究, 2011(11): 102–112.
[19] 张敏, 马黎珺, 张雯. 企业慈善捐赠的政企纽带效应——基于我国上市公司的经验证据[J]. 管理世界, 2013(7): 163–171. DOI:10.19744/j.cnki.11-1235/f.2013.07.014
[20] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.
[21] Adhikari B K. Causal effect of analyst following on corporate social responsibility[J]. Journal of Corporate Finance, 2016, 41: 201–216. DOI:10.1016/j.jcorpfin.2016.08.010
[22] Bao Y, Ke B, Li B, et al. Detecting accounting fraud in publicly traded U.S. firms using a machine learning approach[J]. Journal of Accounting Research, 2020, 58(1): 199–235. DOI:10.1111/1475-679X.12292
[23] Bertomeu J, Cheynel E, Floyd E, et al. Using machine learning to detect misstatements[J]. Review of Accounting Studies, 2021, 26(2): 468–519. DOI:10.1007/s11142-020-09563-8
[24] Bertrand M, Bombardini M, Fisman R, et al. Tax-exempt lobbying: Corporate philanthropy as a tool for political influence[J]. American Economic Review, 2020, 110(7): 2065–2102. DOI:10.1257/aer.20180615
[25] Brown W O, Helland E, Smith J K. Corporate philanthropic practices[J]. Journal of Corporate Finance, 2006, 12(5): 855–877. DOI:10.1016/j.jcorpfin.2006.02.001
[26] Cao S, Jiang W, Wang J L, et al. From man vs. machine to man + machine: The art and AI of stock analyses[R]. NBER Working Papers No.28800, 2021.
[27] Cecchini M, Aytug H, Koehler G J, et al. Detecting management fraud in public companies[J]. Management Science, 2010, 56(7): 1146–1160. DOI:10.1287/mnsc.1100.1174
[28] Chen C, Ke B, Zhao Q. Measuring firm quality using machine learning[R]. Working Paper, 2022.
[29] Chen J, Dong W, Tong J, et al. Corporate philanthropy and tunneling: Evidence from China[J]. Journal of Business Ethics, 2018, 150(1): 135–157. DOI:10.1007/s10551-016-3166-y
[30] Chen T, Dong H, Lin C. Institutional shareholders and corporate social responsibility[J]. Journal of Financial Economics, 2020, 135(2): 483–504. DOI:10.1016/j.jfineco.2019.06.007
[31] Chen X, Cho Y H, Dou Y W, et al. Predicting future earnings changes using machine learning and detailed financial data[J]. Journal of Accounting Research, 2022, 60(2): 467–515.
[32] Friedman J H. Greedy function approximation: A gradient boosting machine[J]. The Annals of Statistics, 2001, 29(5): 1189–1232. DOI:10.1214/aos/1013203450
[33] Gautier A, Pache A C. Research on corporate philanthropy: A review and assessment[J]. Journal of Business Ethics, 2015, 126(3): 343–369. DOI:10.1007/s10551-013-1969-7
[34] Kleinberg J, Ludwig J, Mullainathan S, et al. Prediction policy problems[J]. American Economic Review, 2015, 105(5): 491–495. DOI:10.1257/aer.p20151023
[35] Marquis C, Lee M. Who is governing whom? Executives, governance, and the structure of generosity in large U.S. firms[J]. Strategic Management Journal, 2013, 34(4): 483–497. DOI:10.1002/smj.2028
[36] Masulis R W, Reza S W. Agency problems of corporate philanthropy[J]. The Review of Financial Studies, 2015, 28(2): 592–636. DOI:10.1093/rfs/hhu082
[37] Tan J, Tang Y J. Donate money, but whose? An empirical study of ultimate control rights, agency problems, and corporate philanthropy in China[J]. Journal of Business Ethics, 2016, 134(4): 593–610. DOI:10.1007/s10551-014-2386-2
[38] Zhang M, Tong L J, Su J, et al. Analyst coverage and corporate social performance: Evidence from China[J]. Pacific-Basin Finance Journal, 2015, 32: 76–94. DOI:10.1016/j.pacfin.2015.02.005
[39] Zhang R, Zhu J G, Yue H, et al. Corporate philanthropic giving, advertising intensity, and industry competition level[J]. Journal of Business Ethics, 2010, 94(1): 39–52. DOI:10.1007/s10551-009-0248-0

1样本内预测先使用全部观测值来拟合模型,然后比较模型预测值与实际观测值的差异;样本外预测则先将观测值划分为训练集和测试集,在拟合模型时仅使用训练集数据,然后比较测试集中模型预测值与实际观测值的差异。

2泛化能力是指模型对未知数据的适应能力,泛化能力越强,说明训练后的模型对全样本的预测和解释能力越强。

3在机器学习领域研究中,通常将因变量称为响应变量,自变量称为特征变量。

4受篇幅限制,文中未列示描述性统计结果,如有需要可向作者索取。

5表中分别以“战略”“政治”“治理”“监督”表示战略性动机、政治动机、内部治理动机和外部监督压力动机。

6在模型中增加解释变量并利用改变后的模型重新进行估计时,模型的样本内拟合效果会相应提高,但由于过拟合风险的存在,加入更多的变量未必能有效提升模型的样本外预测能力,因此本文的结果有助于检验不同维度捐赠动机能否有效预测慈善捐赠行为。

7受篇幅限制,文中未列示其他变量的相对重要性排序。