《外国经济与管理》
2020第42卷第3期
招股说明书可读性影响IPO抑价了吗?
周佰成1,2 , 周阔2     
1.吉林大学 中国国有经济研究中心,吉林 长春 130000;
2.吉林大学 经济学院,吉林 长春 130000
摘要:本文以上市时间在2014—2017年的A股上市公司的招股说明书为文本分析对象,构建了中文金融文本可读性指标,从印象管理和信息不对称视角,实证分析了招股说明书文本可读性对IPO抑价的影响。研究发现,招股说明书文本可读性越低,IPO抑价程度越高,且上述结论在进行稳健性检验后仍然成立;招股说明书文本可读性对IPO抑价的影响在机构投资者持股比例高、非国有企业样本组内更为显著。进一步研究表明,招股说明书文本可读性越低,上市首日换手率越高;招股说明书文本信息可读性与上市公司财务表现呈现正相关关系。本研究工作拓宽了中文金融文本分析的研究范畴,从信息披露角度进一步丰富了IPO抑价问题的相关研究,同时为监管当局完善信息披露制度提供了新思路。
关键词可读性IPO抑价信息不对称招股说明书文本分析
Does Prospectus Readability Affect IPO Underpricing?
Zhou Baicheng1,2 , Zhou Kuo2     
1.China Research Center for State-owned Economy, Jilin University, Changchun 130000, China;
2.School of Economics, Jilin University, Changchun 130000, China
Summary: This paper takes 822 prospectuses as the textual analysis object, and constructs the readability index of Chinese financial text. From the perspectives of impression management and information asymmetry, we conduct the first empirical analysis on the impact of the readability of prospectus text on IPO underpricing. We find that prospectus readability has a significantly negative correlation with IPO underpricing. More specifically: in the sample group of high institutional investors, prospectus readability can effectively reduce the degree of IPO underpricing. From the perspective of property right, prospectus readability is negatively correlated with IPO underpricing only in the sample group of non-state-owned enterprises. At the same time, prospectus readability is negatively related to the IPO first-day turnover rate, that is, the higher the prospectus readability, the lower the degree of disagreement among investors; the lower the prospectus readability, the worse the financial performance of the IPO company after its listing. The result shows that the obscure prospectus makes managers effectively achieve the company’s impression management objectives. By reducing the ability and quantity of investors to extract information extracted from the prospectus, the degree of information asymmetry between the issuer and the investor is affected, and the IPO underpricing level is improved to some extent. The professional investors and property right will affect the mechanism of prospectus readability on IPO underpricing.The prospectus with poor readability increases the cost of investors’ information processing, and deepens the information asymmetry between investors and issuers in a short period of time. However, the market will eventually identify the true quality of the listed company, and the complex information in the prospectus will not play a deceptive role. The management’s information disclosure strategy for impression management gradually fails. This study broadens the scope of Chinese financial text analysis, and further enriches the relevant research on IPO underpricing from the perspective of information disclosure.
Key words: readability; IPO underpricing; information asymmetry; prospectus; textual analysis

一、引 言

长期以来,中国IPO抑价率高于发达国家成熟资本市场的平均水平,这使得投资者承受较大的后市流通性风险(Ellul和Pagano,2006),进一步加大了股票价格偏离内在价值即虚高泡沫化所致的金融风险。党的十九大报告明确提出,要提高直接融资比重,促进多层次资本市场健康发展,守住不发生系统性金融风险底线。在此背景下,围绕中国IPO抑价问题开展学理研究,对于提高中国资本市场的资源配置能力,全面建设现代金融体系和现代化经济体系,具有十分重要的学术意义和现实价值。

已有研究发现,提高信息披露质量有利于降低信息不对称程度进而缓解IPO抑价(Arnold等,2010;Hanley和Hoberg,2010)。招股说明书,作为拟上市公司首次正式提供给公众有关公司经营信息和财务信息的全面披露材料,其信息披露质量直接影响着IPO市场效率。除财务报表和附注等数据类“硬信息”外,招股说明书所含文字陈述部分的“软信息”也是决定IPO市场效率的重要因素(Loughran和McDonald,2013)。近年来,不少学者分别从信息含量(Hanley和Hoberg,2010)、信息模糊性(Arnold等,2010)、管理层语气(Ferris等,2013;Loughran和McDonald,2013;Brau等,2016)等方面,探讨了招股说明书文本“软信息”如何影响IPO抑价。然而,目前国内外鲜有文献从招股说明书可读性影响投资者信息解读成本的角度研究IPO市场效率问题。进一步来说,如果投资者不能够准确接收并重构招股说明书中所披露的文字信息,就无法掌握公司的基本情况并做出合理的投资决策。那么,中文招股说明书可读性是否会通过改变投资者有效信息获取继而影响IPO抑价程度,这一问题亟待研究。

本文采用文本分析方法,以上市时间在2014—2017年的A股上市公司的招股说明书为文本分析对象,从语义复杂性和词义陌生度两个维度构建中文金融文本可读性指标体系,基于印象管理与信息不对称理论,考察中文招股说明书可读性与IPO抑价二者关系。研究发现,招股说明书文本信息可读性越低,IPO抑价程度越高,该结论在进行稳健性检验后仍然成立。同时,招股说明书文本可读性对IPO抑价影响的方向和程度会受到机构投资者持有比例以及产权性质的影响,在机构投资者持股比例较高的样本组内,招股说明书文本可读性与IPO抑价具有显著负相关关系;招股说明书可读性与IPO抑价负相关仅在非国有企业成立,在国有企业内不存在。同时发现:招股说明书文本可读性越低,上市首日换手率越高;招股说明书可读性越强的公司,上市后的业绩越好、股票收益率越高。

本文的边际贡献可能体现在以下三个方面:第一,从研究对象来看,本文以中文招股说明书全文作为文本挖掘对象,进一步拓宽了中文金融文本分析的研究范畴。第二,从研究内容来看,提出了中文金融文本可读性的度量方法。本文从语义复杂性和词义陌生性两个维度创建了中文金融文本可读性指标,进一步发展了文本可读性研究。第三,从理论创新来看,本文尝试探讨招股说明书文本信息可读性对IPO抑价的影响机理,丰富了IPO抑价理论。本文从IPO公司印象管理的角度,以信息不对称理论为基础,具体解释了招股说明书文本信息的可读性是否影响以及如何影响新股定价效率及其市场表现。

二、相关文献及理论假设

(一)招股说明书可读性度量

可读性,又称文本易读性、可理解性。Loughran和McDonald(2014)最先明确将金融文本可读性定义为个人投资者以及分析师从公司信息披露中获取价值信息的能力,同时指出在评估金融财务文件信息质量时,可读性可作为重要的评估变量。Li(2008)最先使用雾指数(fog index)作为上市公司年报可读性代理变量,并被大量学者沿用。但Loughran和McDonald(2014)研究发现,由于雾指数构成成分中,平均句子长度难以测度,复杂词汇的定义也并不符合金融文本特点,故该雾指数并不能较好完成金融文本信息可读性的测度任务,因此提出用年报文档大小作为可读性的代理变量。

与国外学者相比,国内学者对于中文金融文本可读性的研究起步较晚,且尚未得到充分开展。孙蔓莉(2004)最早用学生实验法对中国上市公司中文年报的可理解性进行测度。随后,学者们一般计算文本中所含单词数、整句数、平均每句单词数等指标以测定上市公司年报可读性。丘心颖等(2016)采用Yang(1970)提出的完整句占比、基础词汇占比以及汉字平均笔画数三因素以度量年报复杂性,研究发现分析师发挥信息解读的能力十分有限。但Yang基于中文繁体字语料所提出的可读性测度方法,对于简体中文的适用性需要进一步商榷、考察。陈霄等(2018)对网贷借款描述进行可读性研究,考察其文本可读性是否可缓解交易双方的信息不对称。王克敏等(2018)统计了转折词汇、会计术语、生僻字占比以测度年报信息复杂度,并从管理者自利角度检验了公司业绩与年报文本复杂度之间的负向关系。从文本分析对象来看,目前鲜有文献对中文招股说明书文本信息可读性展开深入研究。

(二)IPO抑价与信息不对称

学术界对于IPO抑价现象的理论阐述和来源解释,多是基于信息不对称理论进行展开(Ritter和Welch,2002)。已有研究发现,可通过加强IPO公司信息披露的方式来均衡信息分布,降低IPO抑价程度。Beatty和Ritter(1986)指出,拟上市公司向投资者所提供的对外公开信息越少,公司价值的不确定性越大,而事前不确定性对于投资者来说预示着风险,同时也进一步促成了投资者信息获取的劣势地位,因此IPO抑价程度会随之上升。Ljungqvist和Wilhelm(2003)研究发现,拟上市公司有关所得款项用途的特定信息披露越多,IPO首日超额回报率越低。Cook等(2006)实证表明,IPO之前,公司提高信息披露频率可以显著降低IPO抑价程度。汪昌云等(2015)选取2009—2011年我国沪深IPO公司为样本得到上述相同结论,但熊艳等(2014)等使用经市场调整后的IPO抑价率并扩大样本数据后却得到了相反的结论。以往研究主要将IPO公司公开财务会计信息、新闻媒体报道作为研究对象以测度拟上市公司信息披露情况,而以招股说明书文字陈述部分作为文本分析对象来考察IPO公司非财务信息的信息含量研究却相对不足。

(三)招股说明书可读性与IPO抑价

近年来,有关公司策略性信息披露的研究得到广泛关注。公司印象管理理论(impression management)认为,管理层试图构建积极正面的公司形象以期策略性地操纵利益相关者意见与决策,而避免负面信息对公司价值及自身利益的损害(Melloni等,2016)。已有研究发现,管理层确实会出于自利动机,存在操纵文本信息可读性行为以隐藏公司的负面消息(Li,2008;王克敏等,2018)。特别地,拟上市公司在IPO过程中会积极采取一系列有效措施隐藏或消除一切与公司价值有关的负面信息,被认为是管理层进行有偏信息披露的机会主义行为(Merkl-Davies等,2011)。因此,我们有理由认为,IPO公司管理层很可能通过操纵招股说明书文本可读性进而进行公司印象管理。本文认为,管理层极有可能通过故意混淆、自利归因和技术解释三个渠道,影响了招股说明书文本可读性,进而实现公司信息的策略性披露目标。第一,从管理层故意混淆的角度看,为满足监管部门强制性信息披露要求及相关会计准则,业绩较差的IPO公司管理层可能故意使用复杂语言、书写较长篇幅招股说明书来掩盖与公司价值密切相关的信息。Tversky(1979)研究发现,由于人类认知中易记性偏差的存在,投资者在信息加工阶段很容易只关注自己能够记住的信息,而轻视或忽略冗长复杂的信息。IPO公司通过使用并不必要的海量词汇和复杂修辞来降低招股说明书文本信息可读性,以此增加投资者信息处理的时间和成本,“模糊”公司当前和未来的真实表现进而减少有效披露信息含量(Li,2008)。同时,现代企业制度中委托代理关系的存在,使得上述管理层机会主义行为会更加显著。第二,从管理层自利归因的角度看,心理学大量研究表明,由于认知偏差的存在,人总是倾向于把好的结果归于主观个人能力,而把坏的结果归于客观外部因素(Miller和Ross,1975)。因此,将该结论延伸至公司信息披露领域中,学者们发现,出于超额薪酬、业界地位等自利动机(Kothari等,2009;王克敏等,2018),管理层在公司业绩较好时习惯使用简洁的语言归功于自己对市场的准确把握、合理决策、风控得当等,而在公司业绩差时用冗长的篇幅讨论经济环境的复杂多变、不可预知的国际市场情况或者非可控因素的出现。第三,从管理层解释技术的角度来看,上市公司披露信息的“原始”复杂性导致了文本信息可读性下降(Hirshleifer,2001)。新股发行人和承销商想要“诚心诚意”针对公司复杂业务对外做出适当性披露及合理性解释。例如,技术和经营情况复杂的公司在进行信息披露时所使用的语言就相对复杂,数量也会相对较多。在这种情况下,管理者想要通过增加披露的信息量来缓解与投资者之间的信息不对称关系,然而投资者面对如此厚重的披露文件,很可能选择放弃阅读。

当管理层从以上三个角度对招股说明书进行策略性信息披露时,均改变了招股说明书文本可读性,而文本可读性会影响投资者从招股说明书文件中提取信息的能力和数量。本文的逻辑分析框架如图1所示。根据Bloomfield(2002)所提出的不完全披露假说(IRH),投资者从公司信息披露提取有效价值信息时需要付出一定的时间和精力,被概括为信息提取成本(exaction cost),即反映阅读者从已收集的结构化、非结构化数据中提取信息的认知困难,提取成本越高的信息越难以被正确的市场价格所完全反映。因此,管理者会通过操纵招股说明书可读性以改变外部投资者对公司披露信息的处理成本,继而影响信息受众对公司的价值评估和预期收益,以期进行有效公司印象管理(王克敏等,2018)。

图 1 逻辑分析框架

不难理解的是,当管理层通过操纵文本信息使得招股说明书可读性越差时,投资者掌握IPO公司的信息越少,发行者和投资者双方信息不对称程度会进一步加深,因而投资者在股票上市后要求的信息赔偿越高,IPO抑价程度也就越高。反之,招股说明书文本可读性较高时,信息不对称程度降低会使IPO抑价率下降。基于以上分析,我们提出主体假设:

假设1:拟上市公司招股说明书文本可读性与IPO抑价程度负相关。

不同种类的投资者对于同一难度信息的处理能力和挖掘能力并不相同。相比于个体投资者,经过专业化训练的机构投资者对于信息的收集、处理以及反馈能力更强(丁慧等,2108),信息来源更为广泛,理性投资意识和投资能力也更胜一筹。Rennekamp(2012)指出,对同一信息披露文本可读性的主观感知可能会随着阅读者知识和经验的不同而变化,从而导致异质性投资者对给定披露的反应可能存在差异。例如,对经验丰富的机构投资者来说,金融文本所使用的专业术语使得该文本阅读起来通顺流畅、简洁易懂,同时提供了更多与股票内在价值相关的重要信息。从这一角度来说,专业术语的大量使用对于个人投资者来说导致文本可读性降低,而对于机构投资者来说则使可读性上升。现阶段,我国实行IPO询价制,机构投资者作为IPO重要的询价对象,其报价是确定IPO发行价格的主要参考因素,也对二级市场IPO抑价程度产生重要影响。机构投资者更愿意、更有能力阅读招股说明书以挖掘更多有关新股价值判断的相关信息。已有研究表明,上市公司机构投资者持股比例与信息披露效率呈正比(D’Souza等,2010)。因而随着机构投资者持股比例的提高,招股说明书复杂文本中有关新股内在价值的有效信息会被阅读者极大挖掘,投资者与发行公司双方的信息不对称程度进一步降低,进而使得IPO抑价水平有所下降。鉴于此,我们有必要从机构投资者持股比例角度来刻画投资者信息处理能力,以此推断招股说明书可读性与IPO抑价关系是否会受到异质投资者影响。因此,本文提出如下假设:

假设2:相比于机构持股比例较低的公司,机构持股比例较高的新股发行公司招股说明书文本可读性对IPO抑价的负向影响更大。

只有当信息不对称是IPO抑价产生的根源时,招股说明书可读性才会通过影响投资者信息获取进而形成IPO抑价。在我国,国有企业与非国有企IPO抑价形成的深层原因不尽相同,产权性质是上市公司的重要属性,会显著影响新股IPO抑价程度(于富生和王成方,2012)。相比非国有企业,国有企业上市既承担着深化国有企业改革的政治任务,也夹杂着国企高管提高声誉、“美化”政绩等利益诉求。国有企业凭借政府授权(赵岩和孙文琛,2016)、政治关联(田利辉和张伟,2014)等天然优势获取优质资源,但上述优势也扭曲了IPO定价效率。国有上市企业IPO抑价的形成,更深层原因是国企通过新股发行以完成政治、经济等政策性任务而非最大限度在资本市场中筹措资金。同时,国有企业对于中国投资者而言,更是一种价值信号,会在一定程度上刺激投资者,因而轻视甚至忽视招股说明书的内在信息。因此,招股说明书文本信息可读性与IPO定价效率间的推论关系仅应在非国有企业间适用。

假设3:相比于国有企业,非国有企业的招股说明书可读性与IPO抑价负相关关系更加显著。

三、研究设计

(一)样本选择和数据处理

本文选取2014年7月到2017年12月全部A股IPO公司的相关数据以及招股说明书作为初始研究样本。2013年11月30日,证监会发布了第42号公告《中国证监会关于进一步推进新股发行体制改革的意见》(下文简称《改革意见》),该办法提出要淡化行政干预,要加强自主定价、协商定价、信息披露等一系列创新意见。同时强调,证券交易所应进一步完善新股上市首日开盘价格形成机制及新股上市初期交易机制,建立以新股发行价为比较基准的上市首日停牌机制,加强对“炒新”行为的约束。2014年6月13日,沪深交易所于分别发布了《关于新股上市初期交易监管有关事项的通知》和《关于完善首次公开发行股票上市首日交易机制有关事项的通知》,进一步落实了证监会《改革意见》精神,完善了股票上市首日交易机制。因此,为控制制度因素影响,本文选取2014年7月作为研究样本的初始点。本文所用IPO公司上市之前的财务数据和新股发行市场数据来自Wind数据库、CSMAR数据库,部分缺省数据通过东方财富网以及和讯网手工查询补充,本文所用招股说明书PDF文档来自巨潮资讯网,证券主承销商的排名情况来自中国证券业协会网站。

初始样本仍需经过如下处理过程:考虑到金融行业的特殊性,剔除金融行业上市公司样本;考虑到招股说明PDF文档的可得性和可转性,剔除无法下载、无法复制、无法进行自动PDF转换TXT加密文本样本;剔除因缺失相关观察值变量的样本。本文经过上述筛选,最终获取样本数量共计822个。

(二)变量定义

1. 被解释变量。已有文献一般选取2012年以前的IPO数据作为研究样本,用新股首日上市收益率或经市场调整后的首日收益率作为IPO抑价程度的初步度量。但本文选取2014—2017年作为样本区间,此区间受到新股上市首日涨幅限制,根据上交所和深交所的文件规定:“股票上市首日全日投资者的有效申报价格不得高于发行价的144%且不得低于发行价的64%”。基于我国新股上市后首日基本涨停的现实(经统计,样本区间内首日涨停比例高达97%),投资者非理性热情会在上市初期逐日释放,因此,为考虑后续涨幅影响,本文借鉴张卫东等(2018)做法,将IPO抑价程度(UP)按如下公式计算:

$U{P_{i,n}} = \frac{{{P_{i,n}} - {P_{i,0}}}}{{{P_{i,0}}}}$

其中,

${P_{i,0}}$
为第i只新股的初始发行价格,
${P_{i,n}}$
代表第i只新股上市后第n天第一次非涨停或非跌停当日的收盘价格。

2. 解释变量。一方面,衡量文本信息可读性需要对文本语义复杂性进行测度。受人脑处理信息能力的限制,人类一次性处理的词汇或事物仅限在5至9个之间。因而,招股说明书中表达信息的完整句子所含词汇越多、每次停顿的越长,投资者越难理解文本所表达的意思和传递的信息,相应地,处理价值信息的成本显著提高,招股说明书文本可读性降低。招股说明书文本语义复杂性指标的具体设计如下:整句平均含词量(ASW),即一个完整句子所含平均词数,这里以中文分词处理后的词汇为对象,定义以句号、感叹号、问号为结尾符号的句子即是完整语句;句顿平均含词量(APW),即每次停顿所包含的平均词数,以句号、感叹号、问号、逗号、分号、冒号为停顿标识符进行统计。

另一方面,阅读者对词汇的了解程度也是影响理解文本信息的重要因素。根据《上海证券交易所统计年鉴(2018卷)》统计,截至2017年年底,我国A股开户总数为1.93亿户,其中自然人投资者19 270.9万,占比高达99.68%,2017年度自然人投资者买卖净额交易占比为82.01%。因此,在以散户为市场交易主体的证券市场中,招股说明书中会计金融术语和不常用低频词汇的大量出现,会大幅提高多数散户投资者的阅读难度,导致招股说明书文本可读性降低。招股说明书文本语义复杂性指标的具体设计如下:专业术语占比(TP),即招股说明书中出现的会计金融专业术语占全文词汇的比例,使用上海外语教育出版社编译出版的《牛津英汉双解会计词典》以及中国金融出版社出版《最新汉英经济金融常用术语》两本词典作为会计金融专业术语词库;低频词汇占比(LFWP),即低频词汇占招股说明书全文词汇比重,已有语言学相关研究指出,掌握3 000个常用词汇基本可理解语料中86.7%内容(王又民,1994),因此本文以北京语言学院语言教学研究所编纂的《现代汉语频率词典》的前3 000个高频词作为常用词汇列表,其余出现的词汇皆为低频词汇。

这里需要说明的是,本文所构建的中文金融文本可读性指标与已有研究的差别。第一,与陈霄等(2018)构建的可读性指标不同,本文仅以单个汉语词汇作为最小计量单位,并不对单个汉字进行测度,例如“中华人民共和国”一词,阅读者并不会将其拆分成7个字进行理解,也不会因为字数较多而比理解“本票”“盘亏”等短字数词语更有难度,因此以词汇为单位进行计数更符合中文阅读者的阅读习惯,同时加入会计金融专业术语测度指标,对于度量金融类文本的可读性更具针对性。第二,与丘心颖等(2016)采用了Yang提出的可读性公式不同,本文仅以指标逐一测度文本可读性,并不做可读性公式将其指标进行整合而得到具体数字,以避免系数设定错误而造成测度偏差。此外,本文也不考虑Yang提出的笔画因素对于可读性的影响。Yang以中文繁体字为分析对象,故笔画多少确实是影响文本可读性的重要因素,但现在大陆通用的文字都是简体中文,况且本文分析的是A股中文招股说明书,笔画是否在多大程度上影响阅读者对于文本的理解程度有待研究,比如“藏”这个字,虽然笔画较多,但却是人教版小学一年级生词表中的必识生字。

(三)模型设定

本文建立如下模型对招股说明书文本可读性与IPO抑价程度之间的关系进行实证分析,以检验上文提出的假设。

$U{P_i} = {\beta _0} + {\beta _1}Readabilit{y_i} + + {\beta _i}ControlVariable{s_i} + \varepsilon $

其中,

$U{P_i}$
为新股发行长期的IPO抑价程度;
$Readabilit{y_i}$
为招股说明书可读性指标,包括整句(句顿)平均含词量和专业术语(低频词汇)占比;ControlVariables代表控制变量,借鉴以往研究,本文从影响抑价的众多因素中选取了中介机构因素、公司特征以及发行特征三类控制变量,同时控制年度效应(Year)和行业效应(Industry)对结果的影响。各变量的具体说明如表1所示。

表 1 变量说明
变量类型 变量名称 变量符号 变量定义
因变量 IPO抑价率 UP 新股上市后第一次非涨停或跌停当日的收盘价格与发行价格之差,除以发行价格
自变量 整句平均含
词量
ASW 招股说明书全文词数除以句号、感叹号、问号之和,其数值越大,可读性越低
句顿平均含
词量
APW 招股说明书全文词数除以所有标点符号的总数,其数值越大,可读性越低
专业术语占比 TP 招股说明书中金融会计专业词汇占总词数的比例,其数值越大,可读性越低
低频词汇占比 LFWP 招股说明书中低频词汇占总词数的比例,其数值越大,可读性越低
控制变量 承销商声誉 Reputation 该变量为哑变量,主承销商位列前十名则被视为高声誉,则取值为1,否则取值为0
公司规模 Size IPO发行前最新公司总资产自然对数
公司年龄 Age IPO公司从成立到上市时的整年份
发行价格 Offerprice 以人民币计价的新股发行价格
中签率 Lottery 网上申购中签率
第一大股东持有比例 Largech 发行公司上市首日前十大股东中排名第一位的股票持有比例
发行市盈率 PE 发行价格与每股收益的比率
内部留存比例 Insider 新股发行前公司原有总股数与新股发行后公司总股数之比
加权净资产收益率 ROE IPO发行前加权净利润与所有者权益的比率,部分缺省数据由IPO发行前最新公司净利润与净资产的比率计算所得
资产负债率 Lev IPO发行前最新公司总负债与总资产的比率
四、实证结果

(一)描述性统计

首先,本文对实证研究中所涉及到的所有变量进行描述性统计,统计结果如表2所示。可以看到,中国证券市场的IPO抑价率(UP)均值为340.20%,标准差为2.567 1,可见与发达国家成熟资本市场相比,中国IPO市场属于存在典型高抑价现象的新兴资本市场。招股说明书可读性指标方面,整句平均含词量(ASW)和句顿平均含词量(APW)的均值分别为25.678 6和6.303 3,低频词汇占比(LFWP)平均高达71.92%,标准差为0.127 1,这表明中文招股说明书偏好使用较长句子和陌生性词汇。

表 2 描述性统计结果
变 量 样本量 均 值 标准差 中位数 最大值 最小值
UP 822 3.402 0 2.567 1 2.637 4 20.988 8 0.469 9
ASW 822 25.678 6 1.753 4 25.549 9 31.380 3 20.370 0
APW 822 6.303 3 0.349 5 6.295 2 7.669 8 5.176 6
TP 822 0.058 1 0.007 1 0.057 9 0.081 7 0.036 5
LFWP 822 0.719 2 0.127 1 0.754 6 0.809 9 0.450 0
Reputation 822 0.476 9 0.499 8 0.000 0 1.000 0 0.000 0
Size 822 20.593 6 0.919 4 20.406 7 26.128 0 18.931 0
Age 822 13.428 2 5.300 4 13.000 0 35.000 0 1.000 0
Offerprice 822 14.043 9 8.595 4 12.120 0 88.670 0 1.260 0
Lottery 822 0.001 7 0.002 7 0.000 4 0.018 0 0.000 1
PE 822 27.832 1 5.279 3 28.620 0 70.970 0 8.580 0
Largesh 822 0.379 6 0.142 4 0.369 2 0.811 8 0.044 2
Insider 822 0.767 0 0.042 9 0.750 0 0.920 0 0.745 0
ROE 822 0.142 6 0.095 9 0.122 9 0.713 6 -0.058 7
Lev 822 0.397 5 0.166 8 0.393 3 0.982 0 0.046 2

(二)招股说明书可读性与IPO抑价

为避免解释变量与控制变量多重共线性对本实证分析的影响,我们计算各变量的方差膨胀因子(VIF),计算结果均小于10。考虑到上述各变量的标准差较大,为消除极端值对本文实证结果的影响,我们对所有变量进行了1%和99%的winsorize的尾部处理,通过多元回归分析来考察模型中招股说明书文本可读性与IPO抑价现象之间的关系。

表3第(1)列为各控制变量与IPO抑价的回归结果,其中公司规模(Size)、发行价格(Offerprice)、网上中签率(Lottery)、市盈率(PE)、第一大股东持有比例(Largesh)和加权净资产收益率(ROE)与IPO抑价程度具有显著负向统计关系,即公司规模较大、第一股东持占比较高、公司盈利能力较强,其市场认可度和信赖度会有所提高,有关公司价值判断的信息就越加清晰,降低了发行者与投资者双方的信息不对称程度,因此,投资者会要求新股给予较低水平的风险补偿,降低了IPO抑价程度;而发行价格(Offerprice)越高、市盈率(PE)越高,投资者追涨意愿不强,导致IPO抑价程度越低。同时,内部留存比例(Insider)和资产负债率(Lev)与IPO抑价程度显著正相关。

表 3 招股说明书可读性与IPO抑价
(1) (2) (3) (4) (5)
ASW 0.094 8**
(2.419 4)
APW 0.379 4*
(1.813 0)
TP 17.445 4*
(1.787 2)
LFWP 1.706 5***
(3.606 0)
Reputation 0.159 6
(1.080 3)
0.168 3
(1.142 0)
0.159 8
(1.085 1)
0.151 2
(1.031 9)
0.161 3
(1.097 4))
Age −0.020 3
(−1.557 4)
−0.020 0
(−1.548 3)
−0.018 1
(−1.402 8)
−0.020 8
(−1.595 3)
−0.019 3
(−1.497 1)
Size −0.837 5***
(−6.730 9)
−0.835 9***
(−6.763 1)
−0.821 4***
(−6.614 7)
−0.848 0***
(−6.789 8)
−0.787 9***
(−6.462 0)
Offerprice −0.055 0***
(−5.639 7)
−0.053 9***
(−5.503 3)
−0.055 8***
(−5.706 2)
−0.055 4***
(−5.720 9)
−0.050 8***
(−5.315 7)
Lottery −2.800***
(−5.286 7)
−2.800***
(−5.323 0)
−2.700***
(−5.265 8)
−2.800***
(−5.262 0)
−2.700***
(−5.154 8)
PE −0.096 8***
(−5.270 3)
−0.096 8***
(−5.230 0)
−0.097 1***
(−5.282 7)
−0.096 5***
(−5.262 3)
−0.095 6***
(−5.228 9)
Largesh −0.890 6*
(−1.679 9)
−0.802 8
(−1.524 0)
−0.939 6*
(−1.758 8)
−0.823 9
(−1.539 8)
−0.928 6*
(−1.770 7)
Insider 6.536 7***
(2.848 0)
6.576 5***
(2.864 5)
6.534 8***
(2.868 1)
6.724 2***
(2.926 7)
6.185 7***
(2.730 8)
ROE −4.437 5***
(−4.656 8)
−4.565 4***
(−4.752 9)
−4.504 3***
(−4.715 5)
−4.401 4***
(−4.658 2)
−4.321 2***
(−4.556 8)
Lev 1.196 6**
(2.320 7)
1.175 5**
(2.290 5)
1.197 3**
(2.324 7)
1.280 3**
(2.466 4)
1.207 2**
(2.366 1)
Cons 20.269 8***
(9.992 6)
17.748 7***
(7.651 1)
17.550 5***
(6.810 3)
21.285 5***
(9.884 8)
18.131 1***
(8.862 3)
Year 控制 控制 控制 控制 控制
Industy 控制 控制 控制 控制 控制
样本量 822 822 822 822 822
调整后R2 0.306 8 0.310 5 0.308 8 0.308 4 0.313 2
F 21.86. 21.11 20.34 21.40 20.29
  注:括号中为t值,******分别表示估计参数在1%、5%、10%水平上显著。

表3第(2)—(5)列分别显示的是各可读性指标对IPO抑价的影响。其中,整句平均含词量(ASW)和句顿平均含词量(APW)与IPO抑价显著正相关,回归系数分别为0.094 8(t值为2.419 4)、0.379 4(t值为1.813)。可见,招股说明书整句平均含词量、句顿平均含词量越多,文本信息的可读性越差,投资者从招股说明书中可获得的价值信息越少,进而使得新股上市抑价率显著提高,验证了假设1。专业术语占比(TP)的回归系数为17.445 4,由此可知,专业术语占比与IPO抑价存在显著正相关关系,即专业术语占比越高、招股说明书可读性越低,投资者与发行人双方信息不对称进一步加深,IPO抑价程度会相应提高。低频词汇占比(LFWP)的回归系数在1%水平显著为正,这表明招股说明书所用非常用词汇对文本可读性具有负向影响,在一定程度上提高了IPO抑价水平。以上结论都进一步支持了假设1。

(三)分样本回归结果

为考察机构投资者持股比例对招股说明书可读性与IPO抑价关系是否具有调节作用,本文利用机构投资者持股比例(Ins)高低作为分组变量,对可读性与抑价率进行分组回归,回归结果见表4。由于新股上市前其机构投资者持股比例数据大多难以获取,借鉴已有研究(王垒等,2018),本文以公司首次发行上市时前十大股东中各类机构投资者持股占比之和作为样本数据。表4第(1)—(4)列检验了低机构投资者持有组内可读性对IPO抑价的影响,第(5)—(8)列则揭示了高机构投资者持有组内可读性对IPO抑价的影响。通过比较两个样本可知,可读性对IPO抑价影响在高机构持股比例组显著成立,整句平均含词量、句顿平均含词量、专业术语占比、低频词汇占比的系数依次是0.145 6、0.395 7、−30.862 3、2.053 8。值得注意的是,专业术语占比系数为负,说明招股说明书中专业术语占比越高,IPO抑价程度越低。

表 4 机构投资者持股比例的影响
变量 低机构持股比例组 高机构持股比例组
(1) (2) (3) (4) (5) (6) (7) (8)
ASW 0.074 1
(1.450 1)
0.145 6**
(2.339 5)
APW 0.242 8
(0.962 2)
0.395 7*
(1.813 0)
TP 8.365 0*
(1.698 7)
−30.862 3**
(−2.405 2)
LFWP 1.115 9*
(1.767 1)
2.053 8***
(2.893 2)
控制变量 控制 控制 控制 控制 控制 控制 控制 控制
样本量 411 411 411 411 411 411 411 411
调整后R2 0.327 1 0.325 0 0.324 3 0.327 1 0.313 7 0.308 2 0.312 4 0.314 5
  注:括号中为t值,******分别表示估计参数在1%、5%、10%水平上显著。

可见,招股说明书可读性对IPO抑价的影响效果受到机构投资者持股比例的影响。究其根本,相比于低机构持股比例的IPO公司,高机构持股比例的IPO公司其招股说明书复杂文本中有关新股内在价值的有效信息会被包括机构投资者在内的阅读者极大挖掘,投资者与发行公司双方的信息不对称程度进一步降低,进而使得IPO抑价水平有所下降,假设2得到印证。

根据上市公司产权性质,我们将全样本分为国有企业、非国有企业两个子样本,试图进一步分析招股说明书文本信息可读性与不同产权性质企业IPO抑价的关系,实证分组回归结果如表5所示。研究表明,国有企业样本组中,各可读性指标回归系数均不显著,而在控制诸多影响抑价率主要影响因素之后,非国有企业样本组内四项可读性指标均与IPO抑价具有显著相关关系,假设3得到验证。这说明招股说明书文本信息可读性对于IPO抑价的限制作用仅在非国有企业中显著。

表 5 产权性质的影响
变量 非国有企业 国有企业
(1) (2) (3) (4) (5) (6) (7) (8)
ASW 0.085 8**
(2.116 5)
0.131 1
(0.591 5)
APW 0.427 3*
(1.887 5)
0.939 2
(1.356 8)
TP 15.679 9*
(1.744 6)
−35.256 3
(−0.815 1)
LFWP 1.761 4***
(3.628 8)
0.352 3
(0.164 4)
控制变量 控制 控制 控制 控制 控制 控制 控制 控制
样本量 752 752 752 752 70 70 70 70
调整后R2 0.311 8 0.311 6 0.310 2 0.315 9 0.271 5 0.282 6 0.268 2 0.262 0
  注:括号中为t值,******分别表示估计参数在1%、5%、10%水平上显著。

(四)稳健性检验

为了验证研究结论和变量选取的可靠性,本文进行如下稳健性测试。

1. 改变解释变量。Loughran和McDonal(2014)指出,上市公司年报文件的大小可以较好地衡量金融文本可读性水平。因此,本文采用招股说明书的文档大小作为其文本信息可读性的代理变量。招股说明书文档越小,投资者和分析师所需消化、理解的材料信息越少,得到相关价值信息的难度就越低,所以该文本的可读性就越高,可见,文件大小与文本可读性负相关。这里,定义Filesizei为第i个招股说明书文档大小,以MB为计量单位。用上述重新定义的解释变量来估计模型,控制变量保持不变。主体假设H1的实证结果为,Filesize的回归系数为0.219 9,t值为2.093 1。结果表明,招股说明书文档越大,其文档可读性越低,IPO抑价程度越高。

2. 改变被解释变量。前文使用新股上市后第一次非涨停或非跌停当日的收盘价格与发行价格之差除以发行价格衡量IPO抑价程度。在稳健性检验中,本文使用如下两种方法进行重新测度。第一,参考魏志华等(2019),仅考虑新股上市的连续涨停,当涨停结束时,此时IPO抑价率表示市场真正消化了新股的相关信息。具体计算公式为:UP2=(新股上市后首个收盘未涨停日的收盘价−发行价格)/发行价格。第二,由于新股发行定价确定日与新股上市首日有一定时间间隔,为剔除这一段期间的市场价格因素对IPO抑价程度的度量,我们使用经市场调整后的IPO抑价率(UP3)作为因变量,具体计算如下:UP3=IPO抑价程度(UP)−(新股上市日市场收盘指数−新股发行日市场收盘指数)/新股发行日市场收盘指数。本文使用新构建的IPO抑价指标,其他变量与上文相同。改变IPO抑价率的测度方式后,本文主体结论仍然稳健。

3. 改变样本长度。前文研究采用2014年7月至2017年12月底IPO新股数据及其招股说明书文本进行分析。2018年共有105个新股在A股市场发行上市,剔除金融企业以及相关数据不可得16个IPO,本文将剩余89个样本添加到原有822个样本中,在稳健性检验部分,用上述911份IPO公司样本数据重新进行回归。实证结果表明,改变样本长度后,上文结论仍然成立。

4. 内生性检验。Hanley和Hoberg(2010)研究发现,IPO定价效率受到信息披露质量的极大影响,信息披露质量越高的公司,误导性或虚假性信息越少,由此投资者对其新股要求的IPO抑价补偿越低。因而,本文所得研究结论可能由于存在遗漏重要变量而导致内生性问题。2015年12月30日,证监会发布了第32号公告《公开发行证券的公司信息披露内容与格式准则第1号——招股说明书(2015年修订)》,在原有内容基础上新增了保荐机构先行赔付的承诺,“招股说明书扉页应载有如下声明及承诺:保荐人承诺因其为发行人首次公开发行股票制作、出具的文件有虚假记载、误导性陈述或者重大遗漏,给投资者造成损失的,将先行赔偿投资者损失”。本文预期此次修订会促使保荐机构充分发挥其信息审查职能,招股说明书的信息质量和信息真实性会得以进一步提高。该修订文件的出台,为本文研究提供了天然的政策冲击和实验条件。本文将全样本分为公告前(2014—2015年)和公告后(2016—2017年)两组,分别考察文本可读性指标与IPO抑价程度二者关系,即可知内生性问题对于已有结论的影响。回归结果如表6所示,在修订公告出台后的2016—2017年样本组内,招股说明书文本信息可读性与IPO抑价仍然存在显著相关关系。因此,可以认为在采用政策冲击方法控制由遗漏信息质量这一变量可能引起的内生性问题之后,本文结论仍然稳健。

表 6 修订公告的影响
变量 2014—2015年 2016—2017年
(1) (2) (3) (4) (5) (6) (7) (8)
ASW 0.118 5*
(1.134 2)
0.200 5***
(2.623 1)
APW 0.521 4*
(0.931 5)
06122*
(1.887 0)
TP 22.990 6
(0.912 7)
24.428 0**
(2.470 0)
LFWP 1.818 0**
(2.568 8)
2.069 8**
(2.012 3)
控制变量 控制 控制 控制 控制 控制 控制 控制 控制
样本量 239 239 239 239 583 583 583 583
调整后R2 0.305 6 0.304 6 0.304 8 0.313 1 0.237 5 0.232 6 0.235 9 0.234 0
  注:括号中为t值,******分别表示估计参数在1%、5%、10%水平上显著。
五、进一步分析

(一)招股说明书可读性与上市首日换手率

由于不同投资者对IPO公司的市场交易情况和内部信息缺乏充分了解,所以即使面对同样的信息集也会对其未来市场表现表达不同的意见。IPO初期时,这种意见分歧在卖空限制下表现为市场中乐观投资者远强势于悲观投资者,因而形成了新股抑价现象。IPO首日换手率可以简单地度量投资者对于新股的异质信念,也是反映市场情绪和市场流动性的重要代理变量。接下来,本文以IPO上市首日换手率替代IPO抑价率作为实证研究的被解释变量,从投资者意见分歧角度出发,来考察招股说明书可读性对于IPO上市首日换手率的影响。

表7的回归结果可以看到,招股说明书整句平均含词量(ASW)、句顿平均含词量(APW)和低频词汇占比(LFWP)的回归系数分别为0.000 01、0.000 02、0.000 009 22,这表示招股说明书中所包含的整句、停顿的词汇量越多,使用的生僻词汇越频繁,投资者既可以理解为IPO公司为提供给投资者更多信息增量而使用冗长句式,也可以理解为IPO公司对于市场环境和经营状况的信心不足而混淆视听,这两方面就加深了投资者之间的意见分歧程度,使得该新股的交易频率和交易量大幅提高。

表 7 招股说明书可读性与上市首日换手率
变量 (1) (2) (3) (4)
ASW 0.000 01*(−1.860 5)
APW 0.000 02*(1.851 0)
TP 0.002 3(1.495 1)
LFWP 0.000 009 22*(1.706 1)
控制变量 控制 控制 控制 控制
样本量 822 822 822 822
调整后R2 0.633 4 0.632 2 0.632 8 0.631 9
  注:括号中为t值,******分别表示估计参数在1%、5%、10%水平上显著。

(二)招股说明书可读性与上市后财务表现

本文已发现,可读性较低的招股说明书会显著提高IPO抑价率的结论。那么,晦涩难读的招股说明书能否是业绩较差的IPO公司故意而为之?已有研究表明,中国A股IPO公司存在财务“包装”现象(熊艳和杨晶,2017),因此,我们无法根据上市时公司财务业绩表现,找到其与招股说明书文本可读性关联的直接证据。而公司业绩管理层作为公司内部人,依靠信息优势对公司未来财务业绩更具有预测优势(曾庆生等,2018)。当管理层对IPO公司未来业绩有悲观预期时,可能会使用可理解性较差的复杂词汇和冗余文字来“瞒天过海”,隐匿公司真实运营情况。接下来,本部分借鉴姚颐和赵梅(2016)方法,以上市后一年公司净资产收益率(AROE)为公司未来财务业绩表现的代理变量,进一步考察对招股说明书文本可读性与IPO公司上市后业绩表现的关系。

表8回归结果可知,ASWAPWLFWPAROE均显著负相关,回归系数在5%的显著性水平下分别为−0.024 9、−0.278 2、−0.516 3。研究表明,招股说明书文本信息的可读性越低,IPO公司上市后财务业绩越差。可见,虽然短时期内文本可读性较差的招股说明书增加了投资者信息处理成本,加深了投资者与发行人的信息不对称关系,但是长期来看,市场终会识别出上市公司的真实质量,招股说明书中复杂信息将无法发挥迷惑性作用,管理层出于印象管理的信息披露策略逐渐失效。

表 8 招股说明书可读性与未来业绩表现
变量 (1) (2) (3) (4)
ASW −0.024 9**(−2.273 6)
APW −0.278 2**(−2.315 7)
TP −5.170 3(−0.329 5)
LFWP −0.516 3**(−2.037 7)
控制变量 控制 控制 控制 控制
样本量 822 822 822 822
调整后R2 0.267 8 0.268 2 0.267 8 0.268 0
  注:括号中为t值,******分别表示估计参数在1%、5%、10%水平上显著。
六、结论与启示

(一)研究结论

本文试图从投资者获取拟上市公司发布的招股说明书信息的能力出发,判断投资者能否准确把握上市公司公开披露文本中所承载的信息,并考察招股说明书文本可读性对于IPO抑价的影响机制。研究发现,招股说明书文本可读性与IPO抑价具有显著负相关关系。更具体地说:在机构投资者持股比例较高的样本组内,招股说明书文本可读性能够有效降低IPO抑价程度;从区别产权性质来看,招股说明书可读性与IPO抑价负相关关系仅在非国有企业样本组内成立。同时,招股说明书可读性与IPO首日换手率负相关,即招股说明书可读性越高,投资者意见分歧程度越低;招股说明书文本信息的可读性越低,IPO公司上市后财务业绩越差。本研究表明,晦涩难懂的招股说明书能使管理者有效达到公司印象管理目标,通过降低招股说明书文件中提取信息的能力和数量,影响发行人与投资者之间的信息不对称程度,在一定程度上提高了IPO抑价水平;专业投资者及上市公司产权性质均会影响招股说明书文本可读性对IPO抑价的作用机制;虽然短时期内文本可读性较差的招股说明书增加了投资者信息处理成本,加深了投资者与发行人的信息不对称关系,但是长期来看,市场终会识别出上市公司的真实质量,招股说明书中复杂信息将无法发挥迷惑性作用,管理层出于印象管理的信息披露策略逐渐失效。

(二)实践启示

从本文研究结论来看,中文招股说明书的文字部分在不同程度上使用冗长句式、晦涩语言等问题,加深了新股交易市场中投资者与发行公司二者的信息不对称程度,最终导致较高的IPO抑价水平。这一研究结论具有以下实践指导意义。第一,必须进一步加强招股说明书中的非财务信息披露,提高招股说明书信息质量,避免拟上市公司管理层使用晦涩难懂的文字“混淆视听”“蒙混过关”。第二,监管部门应进一步强化上市公司信息披露文字易读性要求。可编制一套中文招股说明书可读性的定量度量方法,将所有拟上市公司的招股说明书在发布之前进行检测,只有符合要求的招股说明书才能发布,以保证招股说明书语言直白、简单易懂,其文本所含信息便于投资者识别理解,充分发挥资本市场有效配置资源的功能。

(三)研究展望

金融文本研究尚处于起步探索阶段,特别是中文招股说明书中的非财务信息的文本研究还有待进一步拓展。本文仅考察了部分时间段的中文招股说明书可读性,今后可扩大实证研究的时间范围,并将研究对象拓展至财经报道、盈余报告、分析师报告等不同文本信息源。

主要参考文献
[1] 陈霄, 叶德珠, 邓洁. 借款描述的可读性能够提高网络借款成功率吗[J]. 中国工业经济, 2018(3): 174–192.
[2] 汪昌云, 武佳薇, 孙艳梅, 等. 公司的媒体信息管理行为与IPO定价效率[J]. 管理世界, 2015(1): 118–128.
[3] 王克敏, 王华杰, 李栋栋, 等. 年报文本信息复杂性与管理者自利——来自中国上市公司的证据[J]. 管理世界, 2018(12): 120–132.
[4] 王垒, 刘新民, 吴士健, 等. 创业企业IPO后所有权类型集中度、董事会主导功能与多元化战略选择[J]. 南开管理评论, 2018(3): 103–115.
[5] 熊艳, 李常青, 魏志华. 媒体报道与IPO定价效率: 基于信息不对称与行为金融视角[J]. 世界经济, 2014(5): 135–160.
[6] 姚颐, 赵梅. 中国式风险披露、披露水平与市场反应[J]. 经济研究, 2016(7): 158–172.
[7] 曾庆生, 周波, 张程, 等. 年报语调与内部人交易: “表里如一”还是“口是心非”?[J]. 管理世界, 2018(9): 143–160.
[8] Brau J C, Cicon J, McQueen G. Soft strategic information and IPO underpricing[J]. Journal of Behavioral Finance, 2016, 17(1): 1–17.
[9] Ferris S P, Hao Q, Liao M Y. The effect of issuer conservatism on IPO pricing and performance[J]. Review of Finance, 2013, 17(3): 993–1027.
[10] Loughran T, McDonald B. IPO first-day returns, offer price revisions, volatility, and form S-1 language[J]. Journal of Financial Economics, 2013, 109(2): 307–326.
[11] Loughran T, McDonald B. Measuring readability in financial disclosures[J]. Journal of Finance, 2014, 69(4): 1643–1671.
[12] Loughran T, McDonald B. Textual analysis in accounting and finance: A survey[J]. Journal of Accounting Research, 2016, 54(4): 1187–1230.
[13] Melloni G, Stacchezzini R, Lai A. The tone of business model disclosure: An impression management analysis of the integrated reports[J]. Journal of Management & Governance, 2016, 20(2): 295–320.
[14] Merkl-Davies D M, Brennan N M, McLeay S J. Impression management and retrospective sense-making in corporate narratives[J]. Accounting, Auditing & Accountability Journal, 2011, 24(3): 315–344.
[15] Rennekamp K. Processing fluency and investors’ reactions to disclosure readability[J]. Journal of Accounting Research, 2012, 50(5): 1319–1354.