数据分析在审计监察中的应用
随着大数据时代的到来,审计人员将会面对越来越庞大的数据,数据分析和其他技术工具的使用在极大地影响着审计人员的工作质量,还决定着审计人员为企业所创造的价值。
我们将在本文中就常见的数据分析方式进行阐述,希望内审部门能够将数据分析嵌入审计流程,并扩大内部审计对重要数据的关注程度。
01 聚类分析
聚类原本是统计学上的概念,现在属于机器学习中非监督学习的范畴,大多都被应用在数据挖掘、数据分析的领域,简单来说可以用一个词概括——物以类聚。
如果把人和其他动物放在一起比较,我们可以轻松地找到一些判断特征,比如肢体、嘴巴、耳朵、皮毛等等,根据判断指标之间的差距大小划分出某一类为人,某一类为狗,某一类为鱼等等,这就是聚类。
从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。
举例:在会员积分系统中,聚类分析的模型优势很容易展现。假设我们去快消品店买东西,其实我们买这些东西金额已经足够可以办一张VIP卡,但店员并未告诉我们这个政策。那我们在不知晓的情况下,并未办理VIP卡,直接离开了,而店员利用这一单办理了VIP卡并获得积分,这样他就会获取大量原本属于各个顾客的积分,并通过积分兑换公司的福利,这是最为常见的一种积分系统的舞弊。
02 时间序列
时间序列简单的说就是各时间点上形成的数值序列。时间序列分析就是通过观察历史数据预测未来的值,研究内容包括长期变动趋势、季节性变动规律、周期变动规律、以及预测未来时刻的发展和变化等。在这里需要强调一点的是,时间序列分析并不是关于时间的回归,它主要是研究自身的变化规律。
举例:公司可以通过“两个打卡时间过于接近,且长期有这样的现象存在”这一证据,判断存在有考勤作假的情况;另外,企业OA系统中,有时会存在有员工知道主管账号密码的情况,如果员工大量利用主管的ID,发起一些交易(比如采购或者销售),然后切换成自己的ID登陆进行审批,其实审批的动作在系统中也会留下痕迹。将这些“痕迹”倒出来,我们可以发现,像考勤打卡一样,共同特征是总有两个ID,他们的时间是挨着的。当然,这是关于时间序列的一个比较简单的例子,实际操作远比这要复杂许多。
03 本福特定律
本福特定律是近两年审计监察该内 容由中 审网 校所 属 w w w . a udit cn.com数据分析领域中的明星,不断有人在对之进行讨论。这是一个非常优秀的工具,在特定的数据领域中,会帮助内审人员发现大量差异。
本福特定律因20世纪早期美国物理学家本福特而得名,其内容是:自然数据源(信用卡账单、采购记录、现金收据)生成的数字中,约有30%的数字的首位数是1,如1、1314;首位数为2的数字约有18%;顺序递减,首位数为9的数字少于5%。
但是本福特定律对数字是有要求的,不是所有的数字都服从本福特定律。其限制条件为:
1、这些数字必须是描述同类现象。比如都是股价的数字,而不能一部分是股价,一部分是人口数字。
2、这些数字不能有内设的最高值和最低值,也就是说必须自然分布,不能人为限制数字大小。
3、和第二条相似,像身份证号之类有编码规律的数字不行,邮政编码、银行帐号,这些规律性的数字都不适用本福特定律。
04 数据分析工具
数据分析的实操工具非常多,在有数据的情况下如果去使用工具,那么工具上手将会非常快。数据分析工具主要分为四大类:数据采集、数据处理、数据建模、统计分析,具体包括SQL、爬虫、数据仓库、SPSS等等。
其中,Power BI是一项值得被重点推荐的工具。PowerBI的潜力非常强大,他是从Excel表格中派生出来的,安装插件即可免费使用。其打通了各类数据源,能够从各种数据源中抓取数据进行分析,除了支持微软自家产品,各类数据库如Oracle,My SQL,IBM DB2等,还支持从R语言脚本,Hdfs文件系统,Spark平台等等地方导数据;而且Power BI不需要掌握复杂的技术就能进行数据分析和可视化呈现,是一个值得去深入学习的工具。
其实,数据分析的方式方法有很多,但是都需要系统、深入的学习,对于刚刚开始使用数据分析的部门来说,熟悉这项技术的最简单的方法就是从更熟悉的领域开始,比如账目核对,日记帐,应付账款,固定资产,工资单,人力资源等方面。
同时,企业也需要重点提高对内部审计人员的教育水平,具体地说,就是要着重提高内部审计人员运用、整合数据的能力,将数据整合分析、人工智能自动化处理以及其他数字化举措融入到整个审计计划当中。
版权归原作者所有,如侵必删!
下一篇:818第二届监察审计论坛