外国经济与管理  2016, Vol. 38 Issue (9): 93-112     
0

文章信息

外国经济与管理
2016年38卷第9期
肖浩, 詹雷, 王征
Xiao Hao, Zhan Lei, Wang Zheng
国外会计文本信息实证研究述评与展望
A Review of Foreign Empirical Research on Accounting Text Information and Prospects
外国经济与管理, 2016, 38(9): 93-112
Foreign Economics & Management, 2016, 38(9): 93-112.

文章历史

收稿日期: 2016-02-20
《外国经济与管理》
2016第38卷第9期
国外会计文本信息实证研究述评与展望
肖浩, 詹雷, 王征     
中南财经政法大学 会计学院,湖北 武汉 430073
摘要: 近年来,文本信息逐渐成为国外会计实证研究的热点,许多学者开始致力于运用文本分析方法来解决会计与财务问题,并取得了众多有价值的研究成果。与之相比,国内的此类研究却相当缺乏。为了弥补国内研究的不足,本文对国外近十年来取得的研究成果进行了系统的梳理和述评。首先,系统阐述了会计文本信息的定义、特征及其测量方法;其次,从不同层面出发,总结并分析了会计文本信息的影响因素及其作用结果;再次,指出了现今国外研究中存在的不足。在此基础上,本文提出了一个未来研究的框架,分别从基础、引入、拓展三个方向来展望国内研究,具体包括如何构建适合中文会计语言的文本分析方法、国外现有理论与问题在我国的本土化检验以及在中国情境下可以拓展的独创性研究。
关键词文本分析方法文本特征信息披露语调可读性
A Review of Foreign Empirical Research on Accounting Text Information and Prospects
Xiao Hao, Zhan Lei, Wang Zheng     
School of Accounting,Zhongnan University of Economics and Law,Wuhan 430073,China
Abstract: In recent years,text information has been a hot topic in empirical accounting research abroad,attracting lots of valuable studies based on text analysis method to address issues in accounting and finance. In comparison,such kind of research is quite scarce at home. In order to catch up in this field,this paper systematically reviews content analysis studies abroad in nearly a decade. Firstly,the definition,characters and measurements of accounting text information are introduced. Secondly,the determinant factors and economic consequences of accounting text information are summarized at different levels. The limitations in current research are then commented on. Based on the literature review,this paper also provides a framework for future research and a forecast for potential studies at home,including how to construct text analysis methods adaptable for Chinese accounting text,how to test western theories and hypotheses under the institutional background of China,and how to design well-fitted research in the unique context of China.
Key words: text analysis method; text character; information disclosure; tone; readability

一、 引 言

大约十多年前,国外学者就已开创以计算机手段为基础的文本分析方法来进行会计实证研究的先河,而这也成为当前会计研究的一种范式。文本分析的学习算法与Google公司的人工智能程序AlphaGo深度学习的基本原理是一致的,尽管两者采用的实际算法并不相同。目前,会计学者已经可以借助于类人工智能程序来阅读海量会计文本,通过专家式的信息解读、特征识别与变量构建来解决众多的会计财务问题。未来,基于更高端的人工智能系统来解读公司财报、理解分析师报告、参与甚至替代人类进行会计研究也并非不可能。

计算机技术在会计研究中的应用离不开会计文本的存在及其内在价值。与形式上简单的财务数据不同,会计文本包含了众多的信息,具有很高的研究价值。首先,公司披露的信息绝大多数属于会计文本。其次,会计文本具有结构化财务数据难以体现的丰富内涵。如语调和可读性等特征既可能体现公司业务特征,也可以反映高管的心理特征或者行为动机;竞争、风险、前瞻性等信息则反映出公司的各方面状态。再者,会计文本还可以成为调节变量,例如解释会计政策的具体应用。因此,学者们既可以分析文本信息的生成机制及其影响,还可以基于会计文本环境探讨财务数据与经济变量之间的联系,甚至研究原本无法解决的问题。在最初阶段,由于会计文本难以理解和量化,采用人工阅读的方法不仅耗费巨大,还会产生很强的主观性,因而被研究者所忽视,甚至其信息价值不被认可。但随着计算机语言和机器学习技术的发展,上述问题便迎刃而解。据Li(2010a)统计,截至2010年,发表在国际顶级期刊上的以计算机为基础的会计文本实证研究已超过数十篇,而笔者对近几年的文献跟踪则显示此趋势依然不减。相比之下,国内的此类研究却寥寥无几。

虽然已有国外学者对会计文本的实证研究进行了综述(Li,2010a),但其述评对象仅为2010年之前的文献,因而未能概括该领域最新的研究趋势;同时,相关文献也仅对语调和可读性特征进行了分析。事实上,最近几年产生了许多实证研究成果,而且挖掘出更多有价值的会计文本特征,使研究的广度和深度有了新的突破。因此,本文对近十年来国外会计文本的实证研究做系统的回顾与梳理,以期弥补国内研究的空缺。本文首先阐明了会计文本的内涵,归纳总结其特征和文本测量方法;其次,从不同层面分析会计文本的影响因素,分类论述会计文本的影响后果,并指出现有研究的不足;最后,提出一个研究框架,以便推进未来我国的会计文本研究。

① 文献筛选的标准有三个:一是在国外顶级会计金融类期刊上发表的文献,二是以探讨会计文本分析方法为主题的文献,三是一部 分相关性较强的工作论文。此外,文献必须采用以计算机技术为基础而非手工处理的文本分析方法。

二、 会计文本与文本分析方法 (一) 会计文本的内涵与特征

会计文本一般指由公司发布的具有会计相关性的文本信息。但会计学者的视野却更为开阔,关注对象还包括分析师研究报告、媒体新闻报道、互联网论坛上的帖子等。由于分析师研究报告、媒体新闻报道等与现代财务会计研究紧密相连,因此,本文将一切可纳入会计研究的文本归入广义会计文本的范畴,而将公司发布的会计文本界定为狭义会计文本。具体来说,狭义会计文本包括公司披露的年报、季报、招股说明书、季度盈余公告、管理层盈余预告以及电话会议纪要文本;广义会计文本还包括分析师的研究报告、媒体的新闻报道以及投资者通过各种渠道发表的观点与评论。

根据研究的需要,定性的会计文本须压缩为简单的文本特征。总结现有文献可以发现,已被量化的会计文本特征有9个,按照是否与内容相关可分为两类。显然,语调、可读性与文本内容无关,而风险、竞争则属于文本内容的一部分。表 1概括了最主要的5种会计文本特征。

表 1 主要会计文本特征的描述
特 征 基本含义 测量的常用方法 主要的研究主题 主要代表文献
语调 积极的或消极的、正面的或负面的、乐观的或悲观的等相对立的语调特征 1. 积极与消极的词语占文本总词语量的比例之差;2. 采用文本分类算法进行语调识别 1. 文本语调的度量方法;2. 语调的信息含量及其影响因素;3. 管理者对于语调的策略性管理;4. 管理者特征与文本语调的关系;5. 招股说明书的语调与IPO抑价;6. 语调对公司股价的影响;*7. 语调与公司未来业绩的关系;8. 文本语调对投资者的影响;9. 媒体报道的语调与CEO的薪酬;10. 信息披露的语调与公司风险;*11. 投资者情绪对证券市场的影响 Core等(2008);Davis等(2012a);Davis等(2015);De Franco等(2014b);Feldman等(2009);Henry(2008);Huang等(2014);Jegadeesh和Wu(2013);Kothari等(2009);Larcker和Zakolyukina(2012);Loughran和McDonald(2011);Price等(2012);Rogers等(2011)
可读性 文本是否便于理解,或者晦涩难懂的程度 1. Fog指数;2. 单词的数量;3. 文件的长度;4. 单词或句子的简单程度 1. 文本可读性的测量方法;2. 影响文本可读性高低的因素;3. 管理者特质、动机对文本可读性的影响;4. 文本可读性与企业的盈余管理;5. 文本可读性与信息披露的市场反应;6. 文本可读性对投资者的影响;7. 年报可读性对分析师行为的影响;8. 文本可读性与企业的法律诉讼;9. 分析师特征对文本可读性的影响 De Franco等(2014a);Lee(2012);Lehavy等(2011); Li(2008);Lo等(2014);Loughran和Mcdonald(2014a);Miller(2009);Nelson和Pritchard(2007);Tan(2014)
管理者特征 包括自我服务偏差、真实权利特征 1. 第一人称的使用频率;2. 电话会议中管理者语言的占比 1. 管理者的自我服务偏差与公司的财务决策;2. CEO实际权力与薪酬的关系 Li(2011);Li等(2009)
风险 不同类型的风险及其风险值的大小 1. 风险词汇的分类词频统计;2. 文本分类的统计算法 1. 风险的识别与度量;2. 风险文本披露的信息量;3. 风险信息披露的市场反应;*4. IPO风险陈述与IPO抑价;5. 企业诉讼风险与风险披露政策;6. 风险披露与投资者的风险理解;7. 风险信息披露对分析师的影响 Bao和Datta(2014);Campbell等(2014);Hanley和Hoberg(2009);Huang和Li(2011);Loughran和Mcdonald(2011);Loughran和McDonald(2013);Kravet和Muslu(2013)
竞争 公司所面临的特质性竞争程度 1. 有竞争含义的词语占总词语量的比例;2. 公司产品的文本描述与其他公司产品的文本描述的相似程度 1. 测量竞争的文本分析方法;2. 竞争对企业的会计政策、财务决策的影响;3. 竞争与企业的差异性战略的关系;4. 产品市场竞争与企业并购;5. 竞争与股票的定价偏误;*6. 企业竞争与分析师行为 Hoberg和Phillips(2009);Hoberg和Phillips(2014);Hoberg和Phillips(2015);Li等(2009);Li等(2013)
注:表中带*号的主题表示国内也有类似的研究文献。

1. 与文本内容无关的特征。(1)语调。语调是最基本的特征,由乐观或悲观、正面或负面、积极或消极两种对立的感觉构成。中性语调或可视为第三种语调,因为大部分词句既不乐观也不悲观(Li,2010a)。字典法是度量语调的基本方法,研究者通过对乐观和悲观两类单词进行词频统计和比较得到文本的整体语调。另一种度量方法是朴素贝叶斯算法(Li,2010b)。此外,Jegadeesh和Wu(2013)还提出一种新的算法,它规避对单词语调的分类及由此产生的偏差,并为单词设置不同的权重。(2)可读性。可读性也指文本的复杂性、模糊性或非生动性等特征。可读性较差的文本会增加投资者处理信息的成本。Fog指数是最常用的可读性度量指标(Gunning,1952;Li,2008)。Loughran和McDonald(2014a)却认为Fog指数并不准确,并将文件大小作为可读性的度量尺度。SEC将语言复杂性定义为非简明的语言。(3)重复性。重复性是指文本内容的重复表述,相似性(或差异性)是其另外一种表述。Brown和Tucker(2011)、Hoberg和Phillips(2016)基于将单词向量化的思想,用空间距离来测量文本的重复或者变化度。Li(2014)则巧妙地利用论文剽窃探测软件MOSS来评估文本的重合度。(4)管理者特征。包括自我服务偏差心理及权力特征。前者用文本中第一人称的使用频率来度量(Li,2011),或者用管理者在电话会议中发言的特征来度量其权力(Li等,2009)。

2. 与文本内容相关的特征。(1)风险。这是指公司风险的种类以及风险的高低。识别与度量风险的主要方法是字典法(Nelson和Pritchard,2007;Loughran和Mcdonald,2011;Campbell等,2014)。此外,Huang和Li(2011)基于K-最近邻算法,提出一种多标签文本分类算法;Bao和Datta(2014)构建出一种识别和度量风险的新的LDA模型。(2)竞争。这是指公司层面的特质性竞争程度。常用指标Herfindahl指数和产业集中度只能度量行业层面的竞争。Li等(2013)、Hoberg和Phillips(2016)基于对文本相似性程度的计算分别构建出新的公司层面的竞争指标。(3)前瞻性。这是指文本中包含与公司未来发展和业绩相关的信息含量。前瞻性信息一般包含在MD&A中,并采用字典法进行识别和度量(Li,2010b;Muslu等,2015;Bozanic等,2013)。与语调相比,涉及前瞻性的单词相对较少。(4)虚假性。这是指公司的财务数据是否真实,会计文本是否有欺骗性或误导性。通常采用有监督的机器学习算法进行虚假性的辨别,如向量机、贝叶斯算法和随机森林算法等(Goel等,2010;Humpherys等,2011;Purda和Skillicorn,2015)。另外,算法需要财务舞弊公司及其配比公司作为学习样本。(5)研发信息。这是指反映研发活动的文本信息数量,Merkley(2014)首先构建一个反映研发的词汇表,然后采用字典法来度量研发信息。(6)融资约束。这是指公司受到的融资约束程度的大小。Buehlmaier和Whited(2014)基于会计文本和朴素贝叶斯模型构建出一个新的融资约束度量。

① SEC,是Scurities and Exchange Commission的缩写。本文所指的SEC,均特指美国证券交易委员会。

(二) 文本分析方法

文本自由而丰富的表达方式,为多样化的信息提供了天然的载体。同时,文本的信息价值又隐藏在字里行间,不容易直接观察和测度,因而需要运用专门的技术手段进行提炼,进而量化为数值型的变量。早期的文本分析采用手工识别的方法,现今的文本分析方法则以计算机为基础,不仅降低人工成本,而且极大地提高了研究效率。按照Bao和Datta(2014)的分类,文本分析方法包括字典法和机器学习算法,后者又细分为有监督和无监督两类。表 2概括了主流的文本分析方法。

1. 字典法。字典法实质上是一种词频统计法,它基于预设的字典和规则将目标文档中的单词逐一映射到各个集合中,经过统计计算得到文本的量化特征(Li,2010a)。

表 2 主要文本分析方法的描述
类 型 具体方法 适用的特征 优 点 缺 点 主要代表文献
字典法 基于词汇分类表的词频统计方法 语调;可读性;管理者特征;风险;竞争;前瞻性;研发信息 1.方法简单,应用极为广泛;2. 可以度量大多数的文本特征,尤其是语调、可读性及前瞻性等文本特征;3. 相关研究文献极多,可研究的主题和范围很大 1.受到语言种类和专业领域的限制;2. 词语存在一词多义、语义模糊和上下文语境问题,引起度量偏差;3. 不具有自适应的学习能力;4. 难以识别虚假性特征 Henry(2008);Li(2008);Kothari等(2009);Feldman等(2010);Loughran和Mcdonald(2011);Li等(2013);Hoberg和Phillips(2016)
无监督的机器学习方法 贝叶斯模型;向量机方法;K-近邻算法;决策树算法;随机森林算法;其他的人工智能学习方法 语调;可读性;重复性;风险;竞争;虚假性;融资约束 1.可以基于不同的训练文本进行模型构建,具有动态和适应性强的特点;2. 适宜度量竞争、虚假性、语调、相似性等特征 1.相比字典法,该方法难度较大;2. 需要预先分类,分类过程中可能存在偏误 Antweiler和Frank(2004);Li(2010b);Cecchini等(2010);Huang和Li(2011);Humpherys等(2011);Zhou和Kapoor(2011);Purda和Skillicorn(2015)
有监督的机器学习方法 LDA文档主题生成模型 风险 1.无须预设分类集和培训样本,能够减少人工识别误差;2. 能够自我学习,归纳出文本的内在特征 1.方法十分复杂、难度大;2. 目前处于应用初期,应用面较窄;3. 目前只限于度量“风险”特征 Bao和Datta(2014);Campbell等(2014)

字典法包括计算机程序和字典两部分。程序部分既可以选择现成的文本分析软件(如GI、Diction和LIWC),也可以由研究者自己编程,Perl语言是文本分析最便利的程序语言。字典可分为通用、专用和自编三种类型。通用性字典广泛应用于众多研究领域,而不限于会计研究。由于某些词汇在会计用语中有其特定的含义,因此通用类字典的识别能力不强。哈佛字典、Diction和LIWC软件内置的字典是常用的英文通用字典。专用类字典由会计专业人士进行大量的人工阅读后编制而成,为会计文档量身定制,具有更高的单词分类准确度。当前最流行的会计专业类字典是Henry字典和L&M字典(Henry,2008;Loughran和Mcdonald,2011)。自编类字典是研究者根据特定研究需求而自己创建的字典,往往通过对已有字典的裁剪或者阅读特定类型的文档编制而成。例如,Nelson和Pritchard(2007)、Li等(2013)、Campbell等(2014)所用的字典。

2. 机器学习算法。机器学习方法本质是一种统计算法,具有类似于人工智能的自动学习能力。学习过程是利用培训样本进行反复的训练,获得有文本处理能力的数学模型。研究者将目标文本输入该数学模型即可输出文本的量化特征。

(1)有监督的学习算法。如果培训数据已经定义好分类的标签,即为有监督学习,否则就是无监督学习。有监督的机器学习算法起源于统计学中的分类算法,如朴素贝叶斯算法、向量机、K-近邻算法等。这些算法都已被会计学者改进成对应的文本分类算法。其中,朴素贝叶斯算法是最早也最成功的文本分析方法(Li,2010a)。与字典法相同,它也假设单词之间相互独立;该假设虽然不符合实际,但算法准确性很高,且显著高于GI和LIWC字典(Huang等,2010)。向量机则是将文本中的单词集按照某种规则映射成n维空间中的向量,然后构建一个超平面对向量进行分类。向量机常用于公司财务报告真实性的识别。而将词频映射为向量的方法在文本分析中已广为使用,例如测量文本之间的相似性或者差异度。

(2)无监督的学习算法。无监督的学习算法属于一种聚类算法,它不需要给定的分类规则和训练样本,完全通过算法的自我学习归纳出潜在的某种规则进而实现文档的自动归类。其实,聚类的含义也就是指无监督的“分类”。由于能够辨识未曾知晓的文档结构,因而无监督学习算法具有较高的应用价值。目前无监督的学习算法尚处于应用的初期,会计领域的少量研究均基于LDA文档主题生成模型(Campbell等,2014;Bao和Datta,2014),风险则是这些研究的唯一主题。

3. 字典法与机器学习算法的比较。本文在Li(2010a)的基础上,对字典法和机器学习算法作进一步的比较:第一,字典法忽略单词或句子所处的语境。同一单词在不同的上下文中可能表达不同甚至相反的含义。例如,“增加”若与成本相关,为负面含义;若与销售相关,则应是正面含义。第二,字典法不考虑已有的先验信息,而朴素贝叶斯等算法则吸收样本信息,将先验概率转化为后验概率,因而判断更准确。第三,字典法对语言有极强的依赖性,而机器学习方法对语言的依赖较小,往往只与语法规则相关,更容易移植到其他语言。第四,字典法只是对局部的特征进行累加,当词典设定后便不能自动进化;而机器学习方法具有自我学习和演化能力,可以提取文档全局性、非线性的结构特征。参照表 2,不同的文本特征应选择与之相匹配的文本分析方法。对未来的研究者而言,定制字典或是机器学习方法将更具有吸引力。

现有研究对会计文本的使用有两种主要方式,一是将会计文本作为研究的主要变量,二是将它作为情境变量。前者中,会计文本既可作为被解释变量,探寻文本信息的影响因素;也可作为解释变量,研究文本信息披露的后果。本文的三、四部分即分别从影响因素和影响效应两方面对相关文献进行梳理,具体框架与流程参见图 1

图 1 会计文本实证研究框架

② 其中,General Inquirer是第一款用于自动化文本分析的计算机软件,50多年前由哈佛大学心理学教授Philip J Stone研发。Diction是由德州大学奥斯汀分校的Roderick P Hart教授在上世纪70年代末研发的一款语言软件,最新版本Diction 7能够处理html、docx、txt、pdf等多种文档格式,也允许选择文本的类型,如发言稿,诗歌、新闻社论、商业报告、科学文档、电话交谈等,并能够识别乐观、确定、活动、现实与共性5种语义特征以及35种子特征。Linguistic Inquiry and Word Count是由心理学家James W Pennebaker、Roger J Booth和Martha E Francis设计开发的一种文本分析软件,能够在数秒内完成对上百个ASC II文本文件和MS文档的文本分析任务。

三、 会计文本信息的影响因素

尽管统计结果表明,影响公司文本信息的因素很多,但大致可以归为两大类:外部环境因素和公司内部因素。

(一) 外部环境因素

企业的生存与发展离不开外部的制度环境,而无论是美国证券交易委员会(SEC)规定、法律条款还是证券市场的内在需求,都会影响企业行为,并最终影响会计文本信息的披露。

1. SEC规定。为了保护投资者的利益,提高会计信息的透明度,证券监管部门会对上市公司会计文本信息的披露提出各种规定或建议。由于SEC的规定具有权威性和强制性的特征,因而必然影响会计文本的内容和特征。与此同时,非强制性的建议也可能对会计文本信息的披露产生影响。

若干实证研究的结果均支持上述论断。例如,SEC在1980年强制要求上市公司在年报中增加MD&A部分,用于评估企业的流动性、资本以及经营状况。结果,MD&A毫无争议地成为年报中最具可读性和最重要的部分。再如,SEC在1998年颁布规定,明确要求上市公司在招股说明书中必须使用简明英语。于是,Loughran和McDonald(2014b)研究发现,不仅是招股说明书,连未被强制性要求的年报的可读性也得到显著的提高。又如,从2005年开始,SEC要求上市公司在其年报中披露风险因素。Campbell等(2014)发现,强制性披露政策确实促进了公司对特质性风险的揭示,并且此信息对投资者是有用的。Kravet和Muslu(2013)也认为,风险信息的披露促进了投资者对风险的理解。另外,SEC还建议公司在年报文本中包含对竞争形势的描述。结果,Li等(2013)在分析描述公司竞争形势的文本时发现,其中包含与盈余质量相关的信息。

2. 法律要求。在1995年的美国私有证券诉讼改革法中,安全港条款鼓励公司在年报或季报的MD&A中进行更多的前瞻性表述。因安然公司丑闻案而产生的美国塞班斯法案也要求MD&A增加更多的信息披露。Li(2010b)认为,安全港条款的要求可能提高MD&A中的信息含量。研究发现,MD&A中前瞻性描述的语调与公司未来盈利以及流动性均正相关,对未来的业绩具有增量的解释力。因此,法律要求也是会计文本特征的外部因素。

3. 市场环境。资本市场的基本功能是实现对经济资源的最优配置,而这需要股票价格正常发挥其信号机制的引导作用。如果公司的信息环境较差,股价并不能充分反映公司未来盈利信息,公司很可能调整信息披露策略,以缓解外部环境的影响。Muslu等(2014)发现,当公司股价不能充分反映未来盈利信息时,公司会选择在年报MD&A文本中进行更多的前瞻性信息披露,而这种策略确实能有效缓解股价信息效率低的问题。因而,市场环境也会影响会计文本信息的披露。此外,Hanley和Hoberg(2010)发现,作为市场的组成部分,承销商的声誉能够提高招股说明书的信息量。

(二) 公司内部因素

会计文本以反映公司特质层面的信息为主,因此公司自身特征必然会影响执笔者如何撰写会计文本,即对会计文本的内容与特征产生重要影响。然而,管理者未必一定是会计文本的执笔者。Li(2010a)认为,在很多情形下,会计文本实际上是由经理人、审计师、律师和公关部职员等多方协同完成。尽管如此,由于会计文本在撰写时需要征求管理者的意见、采纳其观点,完成后也必须通过管理者的审阅,并且最终也由管理者负责承担相应的法律责任。因此,管理层的行为动机以及个人特征将决定会计文本披露的内容与特征。公司外部因素也正是借助于管理者之手来间接影响会计文本的生成。

1. 公司特征。公司特征在一定程度上决定了会计文本的特征。例如,业务越复杂的公司,其文本自然更难以阅读。甚至有时很难将公司复杂性与年报可读性加以区分(Loughran和McDonald,2014a)。此外,会计文本所包含的信息可能是公司业绩、诉讼风险等变量的函数。Li(2010b)发现,公司未来的盈利状况和流动性越好,会计文本的语调也就越乐观;即使控制其他与未来业绩相关的因素,结论依然成立。Brown和Tucker(2011)对不同时期MD&A的内容进行比较后发现,公司经济状况的变化越大,MD&A内容的改变也就越大。Merkley(2014)的研究表明,业绩的下滑会导致公司增加对R&D信息的披露,以降低信息不对称程度。结果还显示,对于外部监督更强以及更加强调R&D的公司而言,这种效应更加明显。

在国外的公司诉讼案中,投资者经常会将公司披露的定性文本作为诉讼证据。例如,Rogers等(2011)发现,原告经常会指责被告公司发布了与同类公司相比异常乐观的盈余宣告。如果法院判定这些定性文本对投资者产生了实质性误导,那么公司将难以摆脱其法律责任。Nelson和Pritchard(2007)研究也证明,当公司面临更大的诉讼风险时,它会在年报中采用更多的警告性语句,并运用更易读的语言,以求获得法律的保护和减少诉讼成本。

2. 管理者特征。管理者不仅直接影响会计文本信息的披露,而且这种影响存在个体差异。例如,管理者的工作经历、心理特征等因素会影响文本信息量以及语调特征。Hanley和Hoberg(2010)发现,勤勉工作的管理者能够提高招股说明书的信息含量。Bonsall等(2013)认为,盈余宣告时的文本信息或是具有信息增量,或者是对盈余消息的信息补充。实证结果表明,当管理者任期更长或是信息来源更可靠时,会计文本信息具有更高的信息含量。Davis等(2015)发现,管理者特质的乐观或悲观趋向会影响管理者在盈余电话会议中使用的语调,进而,管理者早期的工作经历以及是否参与慈善组织也会显著影响管理者所采用的语调。Li(2011)发现,具有自我服务偏差的经理人在公司业绩较好的时候,更倾向于在年报MD&A中使用第一人称。而Li等(2009)认为,CEO的真实权力会影响他在公司电话会议中发言的多少。

3. 管理者动机。出于对薪酬、契约或是资本市场等因素的考虑,管理者有动机影响或者操控会计文本信息的披露。现有研究表明,存在 “信息供给”和“信息模糊”两种不同的管理者动机。

(1)“信息供给”假说认为,管理者往往具有信息披露的权利、责任或意愿,会主动或被动地披露文本信息,并对数据信息形成有益的补充。公司外部和内部因素都会促使管理者产生信息供给动机。例如,公司信息环境较差时,管理者会披露更多的前瞻性信息以提升股价信息效率;而为了向投资者提供有价值的信息,管理者会根据盈余业绩来调整研发信息披露的细节、语调以及可读性。当公司面临更大的诉讼风险时,管理者又会在年报中披露更多的警示性文本或者提高文本的可读性来应对(Nelson和Pritchard,2007)。此时文本的信息含量往往较高(Bonsall等,2013)。此外,Li(2014)还发现,管理者通过重复披露信息的方式来强调新的新闻信息或不确定性的事件。

(2)“信息模糊”假说认为,如果市场不能够充分反应公司披露的模糊信息,那么当公司业绩较差时,管理者就具有强烈的动机发布模糊的信息,以达到向投资者隐瞒公司负面信息的目的。首先,信息模糊的最基本手段是降低会计文本的可读性。Li(2008)发现,公司当年的业绩越差,那么年报的可读性也越低;而对盈余为正的公司而言,年报的可读性越低,则意味着未来盈余的持续性也越差。因此,管理者存在机会主义的信息操纵行为。Lo等(2014)发现,为了达到上年度的盈余水平,管理者有很强的动机进行盈余操纵,进而导致年报中MD&A可读性的下降。此外,年报可读性对财务报告重述事件也具有增量的预测能力。Bushee等(2015)在分析管理者在盈余电话会议中的用语时发现,语言的复杂性与较低的盈余反应系数也即更高的信息不对称程度相关。众多的实证结果都支持管理者存在“信息模糊”的动机,会降低会计文本的可读性。其次,管理者对文本语调的策略性管理也会误导投资者对公司基本价值的判断。例如,Larcker和Zakolyukina(2012)发现,财务舞弊公司的CEO在盈余电话会议的陈述中通常会较多地使用极端正面感情的词汇,而较少使用焦虑性的词汇。Huang等(2014)对公司年度盈余公告文本的调查发现,异常积极的语调不仅能够预测公司未来的负盈余和负现金流,而且还与MBE、财务重述、SEO、M&A等引发正向盈余管理的事件正相关,并与期权授予这类引起负面盈余管理的事件负相关。结果表明,管理者对文本语调存在策略性管理的行为。再次,管理者还存在对前瞻性信息进行策略性披露的行为。为了满足投资者的信息需求,公司会披露大量的前瞻性信息。然而,Bozanic等(2013)发现,大多数的前瞻性信息与盈余信息并不直接相关;特别当公司面临的不确定性较高时,管理者会披露更多的与盈余无关的前瞻性信息。因此,管理者“信息模糊”的动机和策略性披露的行为,不仅在实质上影响文本信息的真实性表达,同时对会计文本的可读性、语调和前瞻性特征产生显著的影响。反过来,这也为研究者分析管理层的动机、行为及其经济后果创造了条件。

四、 会计文本信息的影响效应

会计文本既可以是研究问题的主要对象,也可以是研究中考虑的辅助因素。后文在梳理会计文本的影响效应时,根据其所处环节将相关研究划分为直接影响与间接效应;前者将会计文本作为解释变量,后者则视为代理变量和调节变量。

(一) 会计文本披露的直接影响

公司会计文本信息披露可以分为如实性披露和操控性披露两类。前者指管理层并不追求操控信息,而是如实披露。相反,后者是管理者有意地操控信息的内容与特征,包括信息数量与类型,以及语调、可读性以及真实性等特征。由于两者的原因或动机不同,因而导致的直接结果也存在明显差异。

1. 会计文本如实性披露的影响。

(1)对资本市场的影响。最初的观点认为,会计文本只是基于通用模板所做的信息披露,仅仅包含样板式的文字、免责的声明、标准化的语句以及其他无关紧要的细节,并不具有信息价值(Li,2010a)。因此,研究者所面临的首要挑战就是证明会计文本具有信息含量而非只是充当摆设的“稻草人”。

现有大量的研究结果已经证明,会计文本对资本市场有显著的影响,主要表现在股票的异常收益、交易量、IPO抑价、市场异象等方面。首先,文本的语调具有信息含量,会引起市场的显著反应。Davis等(2012a)认为,经理人通过乐观或悲观的语言来向投资者暗示公司未来的业绩,因此,季度盈余公告的语调越乐观,市场的短期反应就越强烈。Feldman等(2010)、Price等(2012)分别对年报和季度盈余电话会议加以研究,同样发现语调具有信息量,会引起市场价格的短期变化。除了异常收益外,语调还会引起股票交易量的变化(Loughran和McDonald,2011;Price等,2012)。Kothari等(2009)则发现,公司如果在年报中发布好消息,就能够减少风险,同时降低股价的波动性。其次,文本可读性也会影响市场对信息的反应。Loughran和McDonald(2014a)认为可读性的目标是实现对价值信息的有效沟通,而投资者更可能投资年报可读性更强的公司。Brochet等(2015)对电话会议的研究发现,管理者语言越复杂,引起市场反应越小,无论是股价反应还是交易量均如此。Bushee等(2015)同样发现,由管理者驱动的文本复杂性扩大了投资者的信息不对称程度。Lee(2012)对季报的研究也证实,文本的复杂性会降低股价信息效率。此外,Brown和Tucker(2011)发现,由于经济状况的较大变化会引起各年MD&A文本的显著变化,进而在年报公告时导致市场更大的反应。

招股说明书的文本特征则可以解释IPO抑价现象。首先,招股说明书文本中包含信息增量,因而能够提高定价的准确性,并降低IPO抑价(Hanley和Hoberg,2010;Jegadeesh和Wu,2013)。其次,对风险信息的乐观披露能够降低IPO风险,因此语调越积极,IPO抑价越弱(Jegadeesh和Wu,2013)。再次,模糊的语调反映出未来更大的风险。当招股说明书中有更多的不确定性文本时,对未来的现金流的预测将更加模糊,这将降低投资者对IPO的估价能力,并导致更高的IPO抑价现象出现(Loughran和McDonald,2013)。

调查会计文本的市场反应,除了可以判断会计文本是否具有信息含量,还可以用于检验资本市场的效率。与财务数据相比,投资者需要耗费更多的精力来理解文本信息,而投资者的精力是有限的,因此对会计文本的反应不足会更加明显,市场错误定价的可能性也更大。盈余公告后股价漂移(PEAD)作为资本市场的经典异象,投资者反应不足是这种异象发生的重要原因。Feldman等(2010)和Price等(2012)均证明,会计文本的语调对于PEAD现象有显著的增量解释能力,结果支持市场对文本信息反应不足的假设。另外,You和Zhang(2009)还发现,公司年报或季报的可读性越差,市场反应不足的现象就越显著,股价所吸收的盈余信息也越少。Li(2006)则从风险信息的角度证明,市场并未完全理解年报风险披露对于公司未来盈利所具有的含义。

尽管众多的实证研究证明,会计文本具有相当的信息量会引起市场的明显反应,但是,也有少数研究发现,某些会计文本的公告效应十分微弱,并质疑其信息含量。例如,Li和Ramesh(2009)发现,只有当季报中的盈余信息为首次披露时,才会引起市场的明显反应。同样,只有在季度末公布的年报才会引起市场的反应。因此,他们认为,相比市场已知的信息,年报和季报中包含的信息增量十分微弱。

(2)对投资者的影响。会计文本首先影响投资者对信息的理解,进而影响投资者的行为。由于会计文本对市场的影响需要通过投资者的交易行为实现,因此,所有对市场的影响实质上也可归结为对投资者的影响。因此,无论是文本的语调、可读性还是不确定性的风险特征,都会对投资者的信息理解以及交易行为产生显著影响。

此外,研究发现,会计文本对投资者的影响可以从信息学和心理学两种角度来进行解释。首先,从信息学角度,Kravet和Muslu(2013)发现,公司增加风险信息披露能够增强投资者对风险的认识和理解。Hope等(2014)也支持,公司对特质性风险的信息披露有益于投资者对财务报表数据的理解。Li(2014)的研究则表明,文本的重复性披露不仅能为投资者提供有用的信息,而且能够增强投资者对非重复性文本信息的理解。Davis等(2015)发现,电话会议中管理者特质的语调也会影响投资者对文本信息的理解。由于复杂的文本信息会增加投资者尤其中小投资者的信息处理成本,因此年报可读性越差,相应的股票交易量也越少(Miller,2010)。其次,从心理学角度,Rennekamp(2012)、Tan等(2014)基于实验研究的方法证明,会计文本的可读性对小投资者的判断产生显著影响。原因在于,信息的可读性越强,投资者处理信息的过程就会越流畅;这给投资者一种心理暗示:此类信息披露更可靠、更值得信赖。

(3)对分析师的影响。尽管分析师相比普通投资者有更强的信息分析能力,然而公司会计文本依然会影响分析师的行为,包括影响分析师的关注度以及预测的准确性和分歧度。Lehavy等(2011)研究发现,公司年报的可读性越差,关注该公司的分析师就越多;由于分析师需要耗费更多的努力来工作,因此其研究报告的信息含量也更高。而公司披露更多的R&D信息,不仅能够吸引更多的分析师关注,而且能够提高分析师预测的精度、减少分析师预测分歧(Merkley,2014)。Kothari等(2009)发现,公司披露好消息会减少公司风险,因而能够降低分析师的预测分散度。相反,当公司增加风险信息披露时,分析师预测的离散度会变大(Kravet和Muslu,2013)。与此一致,管理者在电话会议中使用的语言越复杂,会后分析师的预测分歧就越大(Brochet等,2015)。

与多数结论不太一致的是,Brown和Tucker(2011)发现,分析师的盈余预测修正与MD&A文本的变动无关,表明分析师并没有采用MD&A中的文本信息。Li(2010a)认为,文本信息的变化可能对于分析师盈余预测修正有不同的影响。

2. 会计文本操控性披露的影响。

作为会计信息的直接披露人,管理者会有意识地操控会计文本信息的发布,以达到自身的目的。虽然管理者出于“信息供给”的动机,也可能有意识地披露更多真实有用的信息、提高文本的可读性来降低信息不对称程度,引导外部投资者对公司价值的正确理解,但研究者更为关注的却是与之相反的一面,即管理者出于“信息模糊”动机而进行的对投资者不利的信息操控行为。管理者通过降低会计文本的信息含量、对语调的策略性管理以及增加文本复杂性等诸多手段来向投资者隐瞒公司的负面信息,从而误导投资者对公司基础价值的判断。

Li(2008)、Bushee等(2015)、Lo等(2014)研究证明,管理者采用降低文本可读性的手段来操控会计文本信息的披露。Larcker和Zakolyukina(2012)、Huang等(2013)发现,对语调的策略性管理已经成为管理者进行盈余管理的一种新手段。Bozanic等(2013)发现,管理者通过披露更多与盈余无关的前瞻性信息从形式上满足投资者的信息需求。上述研究表明,公司管理者为了实现个人目的而进行会计文本的操控性披露,会产生显著的负面效果。它不仅误导投资者对公司基本价值的判断,损害投资者利益,也会降低证券市场的股价信息效率,进而使得异常的语调和可读性等特征与盈余管理、财务重述等事件产生显著的相关性。事实上,对会计文本的操控性披露为管理者提供了一种更为隐蔽的盈余管理手段。

(二) 会计文本信息的间接效应

间接效应有两方面含义:其一,会计文本作为其他经济变量的代理变量,用于分析与该经济变量相关的财务会计问题,而该问题与会计文本并不直接相关;其二,作为调节变量或者情境变量,用于度量因变量与解释变量之间的传导作用或者环境因素。与直接影响一样,间接效应也能够证明会计文本的信息价值。

(1)代理变量。首先,会计文本可以作为竞争环境的代理变量,帮助分析公司经营战略和财务行为。公司间产品的相似度刻画出产品市场的竞争程度。Hoberg和Phillips(2016)基于年报对产品的文本描述构建出一个公司特征性的竞争指标,并在此基础上证明了公司广告和研发投入与其产品差异化战略显著相关的经济理论。Hoberg和Phillips(2014)采用同样的竞争指标,证明公司的财务政策受到外部产品市场压力和驱动的显著影响。Hoberg和Phillips(2010)基于产品相似度研究公司并购行为,发现产品更相似的公司更可能发生并购交易,因为资产的互补可以产生协同效益。Hsu等(2015)发现,公司竞争程度越高,越会吸引更多的分析师关注,分析师预测的准确性和一致性也越高。其次,会计文本可以作为管理者特征的代理变量。例如,Li(2011)发现,管理者自我服务偏差与过度自信相关,并且影响公司的财务决策。Li等(2006)发现,CEO在电话会议中的发言刻画出其真实权力。研究发现,CEO真实权力不等于形式上的权力,它受到企业组织因素的影响。

(2)调节变量。首先,会计文本可能影响盈余数据与股价之间的关系,比如降低应计异象的发生,因为会计文本和应计都可以视为公司向外部发出的公司未来业绩的信号。Li(2010b)证明,当公司在对应计的含义发出警告时,市场减少了对应计的定价偏误。Li等(2009)则利用年报对竞争的文本描述来解释应计异象,发现公司竞争越激烈,未来业绩的不确定性也越大,导致市场对应计的定价偏误也越高。其次,会计文本可以增强财务数据的信息作用。Bochkay和Levine(2013)发现,融合MD&A文本和财务数据的新模型较单纯的财务数据模型有更准确的盈余预测。Bonsall等(2013)认为,盈余宣告时的文本信息不只是盈余数字的替代,也会是其有益的补充。Li(2014)发现,重复性的文本信息披露能够提高非重复性信息的信息含量。而公司对特质性风险的披露也有益于投资者对财务报表的理解(Hope等,2014)。再次,会计文本描述了财务数据的生成环境,包括具体的会计原则和管理者动机。Li(2010a)认为,只有明确收入确认原则,才能知道销售收入数字的准确含义。Levine和Smith(2011)发现,当公司重要会计政策涉及资产负债表具体科目(例如应收账款)时,不仅该科目在总资产中的占比更高,而且其时序波动性也会更大。另外,管理层的模糊动机也会降低财务数据的真实性。

研究者在对会计文本的影响效应进行分析和检验的同时,实质上也回答了如下几个问题:第一,会计文本是否具有信息量?无论是直接影响还是间接效应,实证结果均表明,各类会计文本包含有丰富的有价值的信息。第二,能否检验市场有效性?会计文本被证明具有宣告效应,能够引起市场的明显反应,无论是股票价格还是交易量在短期内都会发生变化。同时,投资者对复杂文本信息表现出较明显的反应不足,会计文本还能解释PEAD现象,因此,市场并不能充分地理解文本信息并将其迅速融入股价之中。第三,会计文本与盈余管理是否相关?会计文本中与盈余质量、未来的公司业绩、财务重述以及其他盈余管理相关事件显著相关,这既证明了会计文本与盈余管理之间的联系,也间接地证明了管理者的动机。第四,外部环境对公司财务政策有何影响?无论是外部竞争环境影响公司的并购、研发、广告投入还是媒体新闻报道改变公司CEO薪酬结构的结果(Kuhnen和Niessen,2012)均给出了积极的回答。第五,财务数据是如何产生的?会计文本中对具体会计准则的解释、对重大会计政策的披露以及对未来发展和业绩的前瞻性预测都使得枯燥的财务数据有了更生动、丰富、准确的涵义。

五、 广义会计文本信息的相关研究

除了由公司披露的会计文本之外,会计学者对分析师报告、媒体新闻报道以及投资者在互联网论坛上发表的意见和观点也表现出较强的兴趣,并产生了不少的研究成果。不可否认,这几类广义会计文本中包含有与公司、市场以及投资者相关的信息,因而对于理解公司的财务政策以及投资者的行为具有重要的意义。与狭义会计文本不同,在分析财务会计以及资本市场的问题时,广义会计文本具有较强的外生性,因此,大多数研究探讨的是广义会计文本的影响结果。

(一) 分析师的研究报告

分析师是资本市场的重要参与者,也是沟通上市公司与投资者的信息中介。分析师的行为对市场、投资者以及上市公司产生显著的影响,而研究报告则是发挥作用的最主要手段。Huang等(2010)对分析师报告的语调进行了研究,发现与盈余预测数字同时发布的文本信息能够产生显著的市场反应,负面文本产生的市场反应要远远大于正面文本,这就表明文本中包含与价值相关的增量信息。另外,文本信息量大小依赖于分析师与公司经理人的私人关系。由于REG-FD法案限制证券分析师与经理人的私人联系,因此当该法案颁布后,分析师报告中的文本信息含量减低了。此后,De Franco等(2014)以债务分析师报告为样本,发现分析师对于债权—股权冲突事件所采用的语调具有信息含量,负面的语调不仅与债券交易量的增加相关,而且能预示更高的债券发行收益。

De Franco等(2015)则对分析师报告的可读性特征进行研究。结果发现,研究报告的可读性越强,目标公司在短期时间窗口内的交易量就越高。原因在于,文本软信息中包括公司经营和经济环境的介绍,对投资者具有指导作用。而可读性的高低会影响投资者对于研究报告的判断,因而也影响其交易行为。反过来,分析师报告的可读性特征受到分析师自身能力与目标任务复杂性的影响,分析师的能力越强,跟踪的公司数量越多,报告的可读性就越好;相反,研究的任务越复杂,可读性则越差。

(二) 媒体的新闻报道

作为信息的传播者和市场的监督者,媒体的报道对于市场、投资者或者公司的内部政策是否产生影响,也是财务学者所关注的重要问题。

1. 对外部市场和投资者的影响。Tetlock(2007)最早研究了媒体与股票市场指数之间的关系。他将《华尔街日报》每日专栏报道的文本语调作为媒体情绪的度量,发现媒体的悲观情绪能够预测市场指数的下行压力以及之后回归基本面的趋势,而过高或过低的悲观情绪则能够预测市场较高的交易量。反过来,较低的市场回报将导致较高的媒体悲观情绪。研究结果表明,媒体报道并不包含与市场价值相关的信息;相反,它们度量出投资者的情绪,并且支持噪声交易者理论。Tetlock等(2008)将视角从市场整体转向单个公司层面。研究发现,媒体对公司报道的语调能够预测该公司未来的会计盈余和市场回报;语调越是负面,未来盈余就越低。特别当新闻内容聚焦于公司价值时,负面语调的预测能力最强。然而,公司股价对语调的反应不足。原因在于,虽然媒体报道中包含有与公司价值相关且难以数字化的软信息,但投资者并不能将这些信息迅速地融入股价之中。进而,Tetlock(2011)研究证实,投资者对旧新闻还存在过度反应现象,并导致股价的短时性波动。他们用新闻之间的文本相似度作为其陈旧程度的度量,发现陈旧的新闻所引起的市场反应较弱,但却与未来一周的回报负相关。个体投资者由于信息辨识能力较弱,由旧新闻引发的交易行为以及伴随的股价反转现象也更加明显。另外,Kothari等(2009)发现,媒体发布赞许性的报道能够降低公司的风险。综上所述,媒体报道的情绪会影响市场指数的波动,而公司层面的报道则包含真正有价值的信息,但投资者对于新闻报道同时表现出反应不足和过度反应的现象。

2. 对公司内部政策的影响。CEO薪酬是一个十分有意思的话题,最容易受到媒体的关注。因此,当研究者分析媒体对公司内部政策的影响时,首先的切入点就是CEO的薪酬。Core等(2008)采用文本分析方法研究新闻报道对CEO薪酬的作用,结果发现,负面的新闻既不能降低CEO过高的薪酬,也不会增加CEO变更的可能。Kuhnen和Niessen(2012)发现,尽管负面的新闻并不会影响CEO的薪酬总额,但能改变其薪酬结构,容易受诟病的期权部分会明显减少,而争议较少的工资则会增加。现有的研究并没有媒体报道对于公司其他政策,如投融资、股利分红等政策的影响,因而未来研究可关注这些问题。

(三) 投资者的观点与评论

作为证券市场上最重要的参与者,投资者的行为特征和信息处理能力将影响整个市场的效率以及公司的市场行为。由于网络技术的发展,互联网论坛、社交媒体等已经成为投资者分享证券信息和个人观点的电子化场所。投资者在这类网络媒体上发表许多与股票相关的帖子和跟帖,其中可能包含投资者自身对股票的分析或者某种非理性的情绪。Antweiler和Frank(2004)基于对上百万条股民留言进行计算机文本分析后发现,股民对行情的看法能够预测股市的波动性;股民观点的分歧度越高,市场的交易量就越大。Chen等(2014)进一步将研究视角深入到公司层面,通过对社交媒体上投资者发表的文章以及评论进行文本分析后发现,无论是文章还是评语,其中的观点均能够预测公司未来的股票收益以及未预期的会计盈余。因此,互联网已经成为股票信息的一种来源。投资者的观点不仅包含有价值的信息,而且可以测量投资者的情绪,两者的作用机制虽然不同,但都可以预测市场以及公司股价的趋势。

六、 结论与未来研究展望

会计文本具有较高的信息涵义,能够对财务报表数据起到解释、补充以及验证的作用。凭借以计算机为基础的文本分析方法,会计学者可以对会计文本进行深入的研究。本文对国外近十年来获得的研究成果进行了系统的梳理和述评,在此基础上我们发现,相关研究存在以下不足:(1)现有文献均以英文文本为分析对象,文本分析方法尤其是字典法自然也以英文词汇与语法规则为依据。由于不同的语言之间存在显著的差异,现有的研究方法并不能直接应用于非英语书写的会计文本中。对中国的会计学者而言,构建中文文本分析方法是开展会计文本研究的基本前提。(2)现有的会计文本研究主要以美国为对象,因而没有考虑国家间文化和制度的差异性。对其他国家而言,不同的文化与制度可能影响公司会计文本信息的披露,基于美国的研究结论并不能直接照搬。因此,未来对单一国家的研究需要考虑本国的制度和文化特征,跨国研究则需要考虑会计文本信息披露的国家间差异。(3)会计文本研究也面临内生性的难题。现有的许多研究都属于相关性研究,对内生性的考虑较少。例如,Li(2008)发现,公司业绩越糟糕,年报可读性就越差。然而,相反的解释也可能成立,即两者之间可能存在较强的内生性。因此,未来研究需要更好地解决潜在的内生性问题。(4)基于会计文本来分析管理者特征和动机的研究结果并不十分可靠。因为公司披露的会计文本并非一定由管理者一人完成,也可能是多方协同完成的结果。因此,采用管理者在电话会议的个人发言或者以高管团队为对象,研究者可能得到更可靠的结论。

基于上述分析,本文构建了一个未来的研究框架。如图 2所示,未来研究可分为三个层面:基础类研究、复制类研究以及创新类研究。

图 2 未来我国会计文本研究的框架
(一) 基础类研究

应构建适用于中文会计语言的文本分析方法。中文文本分析方法是我国会计文本研究不可或缺的前提,但我国现有的研究均未曾系统性地编制会计专用的中文字典。事实上,由于汉语和英语在词汇或语法等方面差异显著,依靠直接翻译英文词典来创建中文词汇分类字典的方法并不合适,而文本分类的偏差则将直接影响研究结果的可靠性。于是,研究者需要依赖会计专家对会计文本的人工阅读、甚至汉语言学者的帮助来建立会计专用的中文词库,这也是字典法的核心与关键。另外,由于英文由单词构成,而中文以字组句,因而字典法首先要对中文资料做分词处理。与字典法比较,机器学习方法虽然对语言的依赖度较低,但依然需要遵循某些语法规则,并且也需要文档分类样本以及词汇分类表来完成文本分析的任务。因为机器学习方法的难度较大,目前国内研究还很少使用。但未来,如何对原有的机器学习方法进行修正以适应中文会计文本的分析是会计学者需要应对的挑战。对会计学者而言,机器学习方法的难点在于对计算机技术和统计方法的掌握。而处在大数据时代的会计文本研究,无论是海量数据的网络抓取、文档的结构解析以及机器学习模型的构建,均可以依赖计算机专家的协助

(二) 复制类研究

将国外已提出的理论和研究问题放置于中国情境下进行本土化分析和验证,这类研究不仅能证明我国会计文本信息的价值具有重要意义,同时也是创新类研究的起点。目前国内少有的几篇研究多数属于此类研究。表 2所统计国外会计文本研究的众多主题,除少数主题带星号表明国内已有相应的研究,剩下的许多主题均可能作为未来研究的问题。

(三) 创新类研究

这是指基于我国现实的制度背景下进行的有独特性和拓展性的研究。本文认为,未来的拓展性研究可从以下六个方面展开:

1. 积极探索中国特殊情境下的会计文本研究。与欧美成熟市场不同,我国是处在转型发展中的新兴市场,因而会计文本研究不仅要借鉴国外的研究框架和理论成果,更须以我国自身特殊的制度背景为前提进行现实性的研究。首先,与英美分散的股权结构不同,我国股权高度集中的现象十分明显。公司不仅有第一类代理问题,第二类代理问题也十分严重。管理者既存在个人私利也代表控股股东利益,可能对中小股东利益形成侵害。信息的不对称、不透明可能影响管理者对会计文本信息的处理。而以散户为主、机构缺乏的投资者结构则影响市场对会计文本的理解和反应。

其次,我国资本市场对公司IPO、配股和增发行为有严格的要求,也有ST特殊处理等规定,都可能引发企业会计信息操纵的强烈动机,相应地可能导致会计文本的策略性管理。而且,我国公司除A股外,还可以发行B股和H股,甚至在香港和美国等市场交叉上市。当面临其他市场更强的市场监管、更严厉的信息披露要求时,公司的文本信息披露及市场的反应可能产生异质性。另外,我国市场在迅速发展过程中,发生了一系列制度变革,其中有新会计准则实施、IPO制度变迁、股权分置改革、会计师事务所改制,以及会计信息披露新规定等。这就为验证新政策实施对会计文本信息披露及其经济后果的研究创造了外部条件。例如,新的会计准则借鉴IFRS框架,由规则导向转为原则导向,扩大了管理者判断的空间和机会主义行为的契机,从而影响会计信息的供给和需求。

再次,我国的投资者法律保护存在显著的地区差异。在投资者法律保护较差的地区,管理者“信息模糊”的动机更强,可能影响会计文本语调、可读性、风险披露等特征。而投资者缺乏用法律手段来保护自身权益的意识,因而诉讼风险对于我国文本信息披露的影响可能并不明显。

2. 将政治属性纳入会计文本的分析框架。国外的会计文本实证研究并没有考虑到政治因素,而我国的研究可以考虑将产权的国有属性、国企高管的行政级别以及民企政治关联等因素纳入到会计文本的整个分析框架中。首先,国企有比民企更健全的财务制度以及更弱的盈余管理动机,央企相比地方国企有更专业的人才和更强的政府监管。因此,三方对会计信息的供给能力和操纵动机有明显的差异,国有属性和政治层级将可能影响到文本信息的披露。其次,国企高管拥有与职位相对应的行政级别,这意味着其行为既有经济动因也有政治动因。政治身份的声誉机制和高管追求政治晋升的动机可能会影响企业会计文本信息的生成机制。再次,政治关联能够降低企业面临的外部压力,对民企会计信息的操纵也会起到相当的保护作用,这可能也会影响企业文本披露的策略和会计文本的特征,如倾向于采用更极端的乐观语调、更差的可读性以及更少披露风险信息。

3. 拓展已有理论基础:从有效市场理论到行为金融理论。现有会计文本研究主要以投资者理性和有效市场理论为基础,尤其是在考量其经济后果时,习惯采用股价、交易量等指标来研究会计文本的信息效率。关于语调、可读性和风险等特征与IPO抑价的研究也均是如此。然而,投资者并非完全理性,我国市场也未达到强式有效。未来研究的理论基石可能从有效市场理论拓展到行为金融理论。首先,采用网络信息手段搜集社交媒体上数据,基于大数据方法和文本分析技术构建投资者情绪等指标,进而以行为金融理论为指引对IPO抑价、股价崩盘等众多问题进行分析。其次,通过统计管理者的语言信息,可以构建管理者特质(如过度自信等)的相关心理学指标,并探究心理特征对企业财务与会计行为的影响;也可以调查管理者心理特征与企业文本信息特征之间的关系。

4. 引入高阶梯队理论,探究高管团队特征对会计文本信息特征及其经济后果的影响。国外研究证实,管理者存在“信息供给”和“信息模糊”双重动机,并可能对文本特征进行策略性管理,即文本信息披露和盈余管理、财务重述一样,可能成为管理者操纵会计信息的手段。而我国的公司年报形式上由董事长负法律责任,但实际上往往是由证券部门负责人牵头,由证券、财务部门和其他经营部门协同完成。于是,高管团队特征可能直接影响文本信息的特征,不仅性别、年龄、规模等团队背景特征可能解释文本的特征,团队异质性也可能影响信息披露的文本特征,例如,学历差异、任职时间差异、职能经验的差异等。更具体地说,团队权力差距是否影响会计文本披露的特征,法律、会计专业的高管是否采用更谨慎的语言并影响文本的可读性,管理者控制风险的能力是否影响风险信息的披露数量和种类,等等。而且,团队特征还可能作为调节变量,影响文本特征与其他经济变量之间的关系,这也是未来可以探究的问题。

5. 将文本分析与非财务信息披露的研究框架相融合。证监会要求并鼓励公司在管理层讨论与分析中披露非财务信息。但是,非财务信息具有叙述性和可鉴性较差的特征,即使采用选取具体项目并人工评分的常用研究方法,依然具有主观性和人工量大的缺点。而实际上,非财务信息可视为归属文本信息的范畴,前瞻性、竞争性、研发信息、融资约束等均包含于非财务信息的内涵之中。因此,在原有的研究框架下,采用文本分析方法来探究非财务信息披露的内在机制和经济后果,可以自然地融入和发展已有研究。例如,量化非财务信息的各类文本特征并检验非财务信息披露时的市场反应,可以判断非财务信息的披露动机究竟是为了降低交易成本,还是为了掩盖盈余操纵行为(程新生等,2015)。而采用文本方法构建企业社会责任指标,则可用于研究企业的社会责任行为。此外,还可以对自愿性和强制性的披露规则等问题进行研究等。

6. 基于特有数据的可获得优势,开展中国独特性的研究。在某些特定领域,我们具有国外不可获取的数据优越性,例如审计师和卖方分析师的个人信息。以分析师为例,首先,他们的研究报告会披露姓名;通过搜索证券业协会官网等可以获得其个人特征、从业经历等公开信息,这些信息披露较美国更全面详细。国外研究仅仅发现了优秀的分析师将发布可读性更强的研究报告,未来研究则可以拓展到更多的分析师特质与其文本特征之间的关系。例如,哪种类型的分析师语调更为谨慎或乐观,不同的语调又是否会影响盈余预测的精度等。其次,统计显示国内约一半的研究报告由分析师团队发布。而通过对独立分析师与分析师团队的文本特征进行比较,衡量团队成员在研究报告中所起的作用,了解其合作模式与团队特征,判断后者的文本中是否包含更多信息含量,进而回答分析师团队是否能够发布质量更高的盈余预测。此外,国内的分析师每年以单独形式发布大量研究报告,然而他们的背后往往有一个团队,许多报告其实由其他资质较低的匿名成员代为撰写。通过文本分析方法对同一分析师不同研究报告进行文本特征的相似性检验,能够更准确地度量该分析师勤勉程度,以及评估其研究报告的质量。

主要参考文献
[1] Antweiler W, Frank M Z. Is all that talk just noise? The information content of internet stock message boards[J].The Journal of Finance,2004,59(3) : 1259–1294.
[2] Bao Y, Datta A. Simultaneously discovering and quantifying risk types from textual risk disclosures[J].Management Science,2014,60(6) : 1371–1391.
[3] Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J] .Journal of Machine Learning Research,2003,3 : 993–1022.
[4] Bochkay K,Levine C B.Using MD & A to improve earnings forecasts[R].Working Paper,2013.
[5] Bonsall S B,Bozanic Z,Fischer P E.The informativeness of disclosure tone[R].Working Paper,2013.
[6] Brochet F,Naranjo P,Yu G.The capital market consequences of language barriers in the conference calls of non-U.S.firms[R].Working Paper,2015.
[7] Brown S V, Tucker J W. Large-sample evidence on firms' year-over-year MD & A modifications[J].Journal of Accounting Research,2011,49(2) : 309–346.
[8] Bushee B J,Gow I D,Taylor D J.Linguistic complexity in firm disclosures:Obfuscation or information?[R].Working Paper,2015.
[9] Campbell J L, Chen H, Dhaliwal D S, et al. The information content of mandatory risk factor disclosures in corporate filings[J].Review of Accounting Studies,2014,19(1) : 396–455.
[10] Cecchini M, Aytug H, Koehler G J, et al. Making words work:Using financial text as a predictor of financial events[J].Decision Support Systems,2010,50(1) : 164–175.
[11] Chen H L, De P, Hu Y J, et al. Wisdom of crowds:The value of stock opinions transmitted through social media[J].Review of Financial Studies,2014,27(5) : 1367–1403.
[12] Core J E, Guay W, Larcker D F. The power of the pen and executive compensation[J].Journal of Financial Economics,2008,88(1) : 1–25.
[13] Davis A K, Ge W L, Matsumoto D, et al. The effect of manager-specific optimism on the tone of earnings conference calls[J] .Review of Accounting Studies,2015,20(4) : 639–673.
[14] Davis A K, Piger J M, Sedor L M. Beyond the numbers:Measuring the information content of earnings press release language[J].Contemporary Accounting Research,2012a,29(3) : 845–868.
[15] De Franco G, Hope O K, Vyas D, et al. Analyst report readability[J].Contemporary Accounting Research,2015,32(1) : 76–104.
[16] Feldman R, Govindaraj S, Livnat J, et al. Management's tone change,post earnings announcement drift and accruals[J].Review of Accounting Studies,2010,15(4) : 915–953.
[17] Goel S, Gangolly J, Faerman S R, et al. Can linguistic predictors detect fraudulent financial filings?[J].Journal of Emerging Technologies in Accounting,2010,7(1) : 25–46.
[18] Hoberg G, Phillips G M. Product market synergies and competition in mergers and acquisitions:A text-based analysis[J].Review of Financial Studies,2010,23(10) : 3773–3811.
[19] Hope O K,Hu D Q,Lu H.The benefits of specific risk-factor disclosures[R].Working Paper,2014.
[20] Hsu C,Li X,Ma Z M,et al.Does product market competition influence analyst coverage and analyst career success[R].Working Paper,2015.
[21] Huang X, Teoh S H, Zhang Y L. Tone management[J].The Accounting Review,2014,89(3) : 1083–1113.
[22] Humpherys S L, Moffitt K C, Burns M B, et al. Identification of fraudulent financial statements using linguistic credibility analysis[J].Decision Support Systems,2011,50(3) : 585–594.
[23] Jegadeesh N, Wu D. Word power:A new approach for content analysis[J].Journal of Financial Economics,2013,110(3) : 712–729.
[24] Kothari S P, Li X, Short J E. The effect of disclosures by management,analysts,and business press on cost of capital,return volatility,and analyst forecasts:A study using content analysis[J].The Accounting Review,2009,84(5) : 1639–1670.
[25] Kravet T, Muslu V. Textual risk disclosures and investors' risk perceptions[J].Review of Accounting Studies,2013,18(4) : 1088–1122.
[26] Kuhnen C M, Niessen A. Public opinion and executive compensation[J].Management Science,2012,58(7) : 1249–1272.
[27] Larcker D F, Zakolyukina A A. Detecting deceptive discussions in conference calls[J].Journal of Accounting Research,2012,50(2) : 495–540.
[28] Lee Y J. The effect of quarterly report readability on information efficiency of stock prices[J].Contemporary Accounting Research,2012,29(4) : 1137–1170.
[29] Li E X, Ramesh K. Market reaction surrounding the filing of periodic SEC reports[J].The Accounting Review,2009,84(4) : 1171–1208.
[30] Li F. Annual report readability,current earnings,and earnings persistence[J].Journal of Accounting and Economics,2008,45(2-3) : 221–247.
[31] Li F. Textual analysis of corporate disclosures:A survey of the literature[J] .Journal of Accounting Literature,2010a,29 : 143–165.
[32] Li F. The information content of forward-looking statements in corporate filings-a naïve Bayesian machine learning approach[J].Journal of Accounting Research,2010b,48(5) : 1049–1102.
[33] Li F, Lundholm R, Minnis M. A measure of competition based on 10-K filings[J].Journal of Accounting Research,2013,51(2) : 399–436.
[34] Li F,Lundholm R,Minnis M.The impact of perceived competition on the profitability of investments and future stock returns[R].Working Paper,2010.
[35] Loughran T, McDonald B. Measuring readability in financial disclosures[J].The Journal of Finance,2014a,69(4) : 1643–1671.
[36] Loughran T, McDonald B. Regulation and financial disclosure:The impact of plain English[J].Journal of Regulatory Economics,2014b,45(1) : 94–113.
[37] Loughran T, McDonald B. When is a liability not a liability? Textual analysis,dictionaries,and 10-Ks[J].The Journal of Finance,2011,66(1) : 35–65.
[38] Merkley K J. Narrative disclosure and earnings performance:Evidence from R & D disclosures[J].Accounting Review,2014,89(2) : 725–757.
[39] Miller B P. The effects of reporting complexity on small and large investor trading[J].The Accounting Review,2010,85(6) : 2107–2143.
[40] Muslu V, Radhakrishnan S, Subramanyam K R, et al. Forward-looking MD & A disclosures and the information environment[J].Management Science,2015,61(5) : 931–948.
[41] Price S M, Doran J S, Peterson D R, et al. Earnings conference calls and stock returns:The incremental informativeness of textual tone[J] .Journal of Banking & Finance,2012,36(4) : 992–1011.
[42] Purda L, Skillicorn D. Accounting variables,deception,and a bag of words:Assessing the tools of fraud detection[J].Contemporary Accounting Research,2015,32(3) : 1193–1223.
[43] Rogers J L, Van Buskirk A, Zechman S L C. Disclosure tone and shareholder litigation[J].The Accounting Review,2011,86(6) : 2155–2183.
[44] Tan H T, Wang E Y, Zhou B O. When the use of positive language backfires:The joint effect of tone,readability,and investor sophistication on earnings judgments[J].Journal of Accounting Research,2014,52(1) : 273–302.
[45] Tetlock P C. All the news that's fit to reprint:Do investors react to stale information?[J].Review of Financial Studies,2011,24(5) : 1481–1512.
[46] Tetlock P C. Giving content to investor sentiment:The role of media in the stock market[J].The Journal of Finance,2007,62(3) : 1139–1168.
[47] Tetlock P C, Saar-Tsechansky M, Macskassy S. More than words:Quantifying language to measure firms' fundamentals[J].The Journal of Finance,2008,63(3) : 1437–1467.