识别虚假财务报表十分困难。从审计师的角度,大量的做假案例表明:财务报表做假大都是公司最高管理当局授意下的做假。在我国“国有股一股独大”的特殊背景下,财务报表做假还是大股东控制和配合下的做假。做假公司上下串通一气欺骗审计师,公司的内控制度如同摆设。同时,我国做假公司往往采用虚构交易和事实的手段,通过伪造原始凭证恶意欺诈,审计师若单纯采用从报表向总账、明细账、记账凭证及原始凭证追索的审查方法,则难以发现做假行为。从监管层和中小投资者的角度,审计师、承销商、律师、银行,甚至地方政府也经常参与上市公司做假,或出谋划策,或提供便利。做假者的做假动机不尽相同,手段层出不穷,使得虚假财务报表呈现出个案化的特征。在资源和信息有限的条件下,监管层和中小投资者也难以辨别真伪。
但这并不意味着面对虚假财务报表就束手无策。首先,尽管建立在内控信任和抽样为基础上的审计程序失效,但在审计风险评价阶段的分析性复核的审计程序在发现和检查财务报表做假方面仍然是个有效的方法。一个健康、真实的企业,一般来说,经过一年的生产经营、投资和融资活动,从期初的状态转换为期末状态,企业重要的财务指标之间应该保持一定的勾稽关系、均衡和惯性。一旦企业做假,这种均衡状态将被打破,可能就会在一组或几组财务指标之间出现异常或矛盾。如果这种异常和矛盾无法解释,则预示着会计做假的可能。分析性复核就是用来调查财务指标之间是否异常变动的审计程序。其次,尽管做假公司采用不同的做假手段,有着不同的做假动机,但对上市公司而言,做假行为对财务报表的影响方向基本一致,都是虚增资产,隐藏负债,虚构利润。因此,虚假财务报表可能会表现出一些与真实报表不同的特征。另外,从犯罪心理学可知,做假公司的做假行为往往是由同一群人在操纵和实施,其在一定时期内所能动用的资源和经验是有限的,这就必然在做假手段上表现出一定的惯性、反复性和模仿性。有经验的专业人士就可能通过财务报表发现冰山的一角。
用数据挖掘技术识别虚假财务报表的研究在国外已得到一定的应用。这些研究尽管所选择的识别变量不同,数据挖掘的技术不同,所使用的软件也不同,但大都能得出类似的结论,即数据挖掘技术是一种有效的识别工具。
数据挖掘在识别虚假财务报表方面具有很独特的优点。相对于专业人士的经验判断,用数据挖掘技术识别虚假财务报表面对海量的上市公司财务数据,在缩短反应时间、合理配置资源、减少主观和随意判断及提高判断准确率上都有其独有的优势。这对于监管层加强打击力度,提高监管效率;投资者减少投资损失;审计师控制审计风险,减少法律诉讼都具有重要的实用价值。监管层在资源有限的条件下只有建立仔细分析、明智决策、衡量成本和产出的新型情报侦察系统,而数据挖掘技术建立的虚假财务报表识别模型在这方面用处很大,它可以自动从上市公司年报、中报、季报等财务数据中提取识别指标变量,计算每家公司财务报表做假的概率。监管人员设定一个对虚假财务报表的容忍率,就可得到做假概率大于容忍率的所有上市公司的列表。这些公司可初步判断为高风险公司,是监管层需要密切关注的对象。通过专家分析等侦查手段在掌握了初步证据后可对这些公司实地调查。同样,监管层根据公司做假概率和容忍率将上市公司进行分类,不同的类别采用不同的侦查手段和分配不同的资源和时间,这样监管层在对上市公司违法违规的调查中就掌握了主动权。如果监管层、投资者和审计师借助数据挖掘技术等手段及时有效识别虚假财务报表,必将改变造假者的预期,使其造假时心有余悸,从而减少做假行为的发生。数据挖掘技术有助于增强对做假行为的识别能力,使潜在的做假者时刻存在危机感,从而防范做假行为的发生。
二、数据挖掘技术建立识别虚假财务报表的模型
(一)样本选择
虚假财务报表呈现多种途径,如资产评估、非经常损益和主业增长等,由于前两种在短期内都会明显改变企业的财务结构,因此很难从财务指标异动中区分欺诈公司和正常公司。而对于主业增长型企业,自然增长企业的财务结构理应体现一定的规律性,其指标异动往往蕴涵了一定的财务风险。由于不同类型会计欺诈的识别指标迥异,将其归为一类会弱化指标的识别作用,因此本文对会计信息欺诈的识别模型定为主业增长型利润操纵。基于此,笔者选择了41家财务欺诈公司中单纯涉及营业利润操纵的25家作为欺诈公司的样本,参照公司则在深沪两市历史上无虚假陈述现象,历年被会计师出具标准无保留审计意见的上市公司中选取了与上述欺诈公司行业、资产规模、会计期间均匹配的25家公司。在选择样本时,为尽量统一标准,同时减少缺省值,做假的财务报表都是年度报表或基本报表,中报做假的公司不予考虑。为消除时间对指标值的系统性影响,尽量使真实财务报表样本公司的财务报表所属年度与做假公司虚假财务报表的年度分布保持一致。
(二)数据处理(行业标准值的选择)
分析性复核是调查各项比率或趋势的异常变动。显然,要确认是否异常关键是找到正常或标准值。行业标准值选择不当,可能会对分析产生误导。行业标准值的选择可以针对每一家样本公司在所有上市公司中去寻找与其处于同一行业和规模的公司,计算这些公司的各项指标,取其均值或中位数作为行业标准值。这种方法存在的问题是:做假样本做假年度大多集中在1996、1997、1998三年,而在2001年证监会的《上市公司行业分类指引》发布前,国内上市公司的行业分类极为混乱,在已有系统下,难以找到满意的计算行业标准的公司。2002年财政部统计司出版的《2002年企业绩效评价标准值》在国民经济十大门类的基础上共划分了160个行业,揽括了做假公司所在的行业,本文将其作为行业标准值的来源。考虑到上市公司大多是业绩较好的国有大中型企业,所以取值时以大型企业的良好值为基础(对文化艺术业、广播电影电视业等由于未划分规模,则取全行业的良好值)。同时,考虑到指标计算时本身会剔除前期的影响,因此忽略不同时间年度对标准值的影响。
(三)指标体系设置
本文的目的是识别虚假财务报表,而不是作为财务预警或分析做假公司做假的原因,所以识别变量的选择大都是针对采用做假手段后对财务报表的异常影响和经过掩饰后的虚假报表,而不是针对做假前做假公司的财务状况的异常和经过还原后的真实报表。在分析前,事先并不知道哪个指标在做假中出现最频繁,表现最突出,因此将利润类、资产负债类、现金流量类的主要指标列示如下:(1)利润类指标有:收入,包括主营业务收入、其他业务收入、投资收益、营业外收入;费用,包括主营业务成本、其他业务支出、营业费用、主营业务税金、管理费用、财务费用、营业外支出、所得税;净利润。(2)资产负债类指标有:资产类,分为流动资产、长期投资、固定资产、无形资产等,包括现金、银行存款、应收账款、存货、短期投资等;负债类指标,分为流动负债和长期负债,包括短期借款、应付账款、预收账款、应付工资、应交税金、预提费用等;所有者权益类指标,是所有者对企业的投资,包括国家投资、法人投资、个人投资、外商投资等。(3)现金流量类指标有:经营活动现金流量,分为现金流入、现金流出、经营活动的净现金流量;投资活动现金流量,分为现金流入、现金流出、经营活动的净现金流量;筹资活动现金流量,分为现金流入、现金流出、经营活动的净现金流量;本期现金净增加(净减少);期初现金余额;期末现金余额等。(4)由于本文总的样本数只有25个(其中17个用于训练,8个用于模型评价),所以可能的识别变量就只有20个。因此,本文结果中的指标变量只有10个左右。