2020年1月6日专版 大数据推动行为审计

2020年01月06日 14:18 来源:厦门网-厦门日报
  ●随着审计信息化的发展,大数据审计成为全国审计机关创新技术方法、提升审计工作能力、提高审计效率的重要方法。
  ●在科技日益发达的今天,绝大部分行为都会实时留下各种数据痕迹。这是基于大数据分析的行为审计方法得以实施的客观前提和基础。
  ●在大数据时代,审计人员可以通过数据挖掘和可视化技术挖掘出事物之间隐蔽的相关关系,追寻背后的因果关系。

  ●林良盛

  近年来,信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源,大数据正日益对国家生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。更好发挥审计在党和国家监督体系中的重要作用,需要审计机关和审计人员顺应时代发展要求,变革大数据分析理念,在大数据分析基础上积极探索、创新行为审计方法,更好地运用互联网技术和信息化手段开展审计,向信息化要资源、向大数据要效率,向行为审计要线索,提高审计监督、过程控制、决策支撑能力,积极推进审计全覆盖。
  科技强审
  国家审计面临的新机遇和新挑战

  2015年8月,国务院发布《促进大数据发展行动纲要》,从国家发展战略全局的高度,提出了我国大数据发展的顶层设计。2017年1月,我国正式印发实施《大数据产业发展规划(2016年至2020年)》,这是实现从数据大国向数据强国转变的重要举措。2018年,《政府工作报告》提出了实施大数据发展行动,注重用互联网、大数据等提升监管效能。在数字浪潮的大背景下,应用大数据提高国家治理能力是大势所趋,也是国家审计面临的新机遇。
  目前,各省、自治区、直辖市都在积极实现数据互联互通,共享平台的建设如火如荼。在不远的将来,各种跨省数据乃至全国数据的互联互通、共享运用也指日可待。届时,数据不在本单位存储,通过云存储集中存放,审计人员面对的不是单一的数据库,而是分布式数据库,如何高效分析大数据成为审计部门面临的新挑战。
  开展行为审计
  应对大数据分析新挑战

  多年来,审计机关在数据分析方面进行了广泛深入地探索和研究,比较成熟和流行的审计数据分析模式是以审计经验或政策法规条文的具体规定为基础,构建数据模型,对单个或多个信息系统的数据以某个或某些关键字段进行综合计算或对比分析,以期直接发现数据的缺漏或计算错误,是以结果为导向的数据分析模式。如将国土部门的房产登记信息与税务部门的房产税入库表进行关联比对,查询应缴未缴的房产税情况。又如自然资源资产审计中利用软件加载并叠加一定时期内林业部门的森林数据和卫星遥感影像数据,以检查在确定的林区范围内是否存在违法占地的情况。
  但是很多问题隐藏在深层数据中,常常不是通过对比或复核性计算就能发现。问题的形成和暴露不是一蹴而就的,有其特定的节奏和规律,风险积聚的过程有迹可循,常常在数据上表现出某种或多种异常特征。以过程为导向的行为审计方法和以结果为导向的审计数据分析方法是辩证统一的,两者均以大数据分析为基础,相辅相成。前者通过更深层次的数据分析,发现未知事件的异常特征,得到问题规律或征兆,所发现的新问题可以形成新的数据模型,成为后者的有益补充。后者让审计人员能迅速切入问题点,并在熟悉数据的基础上培养数据敏感度,为主动发现异常行为数据提供知识储备和想象源泉,是前者的前置基础。
  在物联网、互联网、云计算、卫星跟踪定位日益发达的今天,绝大部分行为,包括人的行为、大自然的行为、社会的行为、经济的行为、机器的行为等都会实时留下行为痕迹、系统痕迹和数据痕迹。行为痕迹,是各种行为活动的过程,如缴费行为、诊察行为、出厂行为、商品上架行为等;系统痕迹,是在计算机处理为基础的网络系统中留下的印记,如系统日志文件的记录;数据痕迹,是在数据库和其他数据记录、处理存储介质中留下的记载。这些痕迹中具有代表性的,能够表现其特点的称为特征。这三种痕迹的特征互相联系、相互映射,行为痕迹特征映射系统痕迹特征、数据痕迹特征,系统痕迹特征映射行为痕迹特征、数据痕迹特征,数据痕迹特征映射行为痕迹特征、系统痕迹特征。这种联系和映射是行为审计方法得以实施的客观前提和基础。
  异常行为特征的捕捉并不容易,需要审计人员在熟练掌握数据操作技巧后,积极开拓思路、敏锐捕捉痕迹、准确概括特征、科学辨析规律。尤其在面对从来没有接触过的数据、从来没有开展过的分析、缺乏政策或标准的困惑时,审计人员更应充分发挥创造性思维和想象力,努力发现异常行为所留下的痕迹数据。
  数据挖掘和可视化技术
  助力行为审计

  行为审计本质上属于大数据审计,是大数据审计的有益探索,大数据分析方法特别是数据挖掘方法和数据可视化技术的日渐成熟为行为审计提供了良好的实践条件。
  数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,是发现大数据集中数据模式的计算方法。
  图形化的方式比文字更容易被审计人员理解和接受,数据可视化将数据所包含信息的综合体,包含属性和变量,抽象化为一些图表形式,借助统计图、散点图和其他图的形式准确、清晰、有效地传达数据中所包含的信息。有效的可视化能进一步帮助审计人员分析数据、推论事件、寻找规律。
  在大数据时代,审计人员可以通过数据挖掘和可视化技术挖掘出事物之间隐蔽的相关关系,获得更多的认知,发现相关关系的目的是追寻背后的因果关系,即何种异常行为模式对数据的留痕分析结果产生异常。通过关注线性相关关系以及复杂的非线性相关关系,可以帮助审计人员看到很多以前不曾注意的联系,可以掌握以前无法理解的事务之间的关系和社会动态。大数据分析方法的深度发展为行为审计方法的实现提供了有力的客观条件。
  行为审计模式初探
  行为审计模式指为开展数据分析、发现行为特征的过程。重点包括数据挖掘与分析、行为特征捕捉、行为特征分析三个步骤。
  清理过的数据可以利用数据挖掘技术与可视化技术开展数据挖掘与分析。海量数据会表现出什么特征,数据之间会有什么联系,审计人员在数据挖掘之前是不知道的,主要是在现有数据之上进行基于各种算法的计算,实现高级别数据分析的需求,也可以在得知某种非正常行为模式(如共享单车OFO车身上粘贴的提取公积金的小广告可以推测社会上的不法分子在钻公积金的漏洞)的基础上利用数据挖掘技术验证异常数据间的关系强度。
  数据挖掘分析后,审计人员开展行为特征捕捉,通过运用计算机的查询功能或多维分析技术等相应方法来寻找符合相关特征的数据,或验证数据的发展趋势是否与通常的规律相一致,从而将异常数据特征显性化。
  通过行为特征捕捉找出符合异常行为特征表现的数据,对这些数据还需要进一步进行行为特征分析,解读其中的意义。实际上,行为特征捕捉和行为特征分析是两个相辅相成不能截然分开的过程,特征捕捉前需要分析,如应从哪些数据入手才能有效地捕捉、应用什么方法才能有效地发现特征等。特征捕捉后更需要进行进一步分析,因为有异常、符合行为特征表现的数据是否有问题,与之相关的经济活动是否违法违规,还需要审计人员结合法律法规进行分析判断,需要引入审计人员的知识与经验。
  (作者单位:厦门市审计局)
  名词解释
  行为审计
  就是在大数据分析基础上,通过捕捉异常数据的特征,挖掘异常数据反映的非法或不正常行为模式,寻找普遍式、深层次审计问题的审计方法。
  数据可视化技术
  是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示,并进行交互处理的理论、方法和技术。