浅谈大数据审计在医保基金中的运用
大数据审计是对数据开展深入、复杂和综合的分析,并相应构建“总体分析、发现疑点、分散核实、系统研究”的数字化审计模式。医保基金数据量大,有专门的医保系统,所有数据实现了电子化,为大数据审计实施提供了良好的条件。今年1月,我有幸参加了城镇职工基本医疗保险基金审计,结合审计实际,从以下三个方面浅谈下大数据审计在医保基金中的运用。
数据采集是大数据审计的基础。采集被审计单位的数据主要有两种方法:一是采集Excel、Word、PDF格式的数据文件,直接拷贝回来,在专用电脑上开展数据清洗,删除空白单元格、取消合并单元格、统一日期格式等。将整理好的数据标准表导入数据库中,在将Excel表格导入到Sql Sever中时,如果出现文本被截断报错,建议在字段名后插入一行,将字段下最长的文本粘贴到该行对应的单元格。二是从数据库采集数据,需要被审计单位提供备份文件和数据字典,在相应的数据库上还原数据。数据库中的表格多采用英文字段名,需要利用数据字典将表格汉化,方便审计人员理解数据含义。数据库存储的数据要求满足三大范式,冗余较小,方便后期更新维护,但不利于审计数据分析。结合审计实际,利用多表关联,筛选字段,设置时间、地点等条件,形成符合审计需求的审计标准表。
数据分析是大数据审计的核心。利用结构化查询语言SQL编写相关代码,基本操作包括查询、条件、分组、排序、连接等,数据分析技术相对简单。困难的地方在于数据分析思路,分析人员审计经验相对较少,对相关领域的知识不太了解。经常会从三个方面获取审计思路:一是根据常识判断明显不符合常理的情况。如在医保审计中,已死亡人员仍然在报销医保费用,明显不符合生活实际。将火化数据与医保报销数据利用身份证号关联,筛选出报销日期大于死亡日期的可疑数据。二是根据法律法规判断违法违规的情况。《关于印发<恩施州生育保险和城镇职工基本医疗保险基金合并实施方案>的通知》中规定“财政供养人员(国家机关、全额拨款事业单位女职工)由单位发放本人工资,不享受生育津贴”。将财政供养人员数据与领取生育津贴人员数据利用身份证号关联比对,筛选出财政供养人员享受生育津贴的可疑数据。三是根据经验丰富的审计同事提出的审计需求构建数据分析模型。审计组提出核查女职工生育津贴政策落实情况,将应享受生育津贴的新生儿父母数据和实际领取生育津贴人员通过身份证号关联,筛选出新生儿父母尚未领取生育津贴的可疑数据。
数据核实是大数据审计的落脚点。通过数据分析获得的疑点数据,经与被审计单位核实确认,发现20名已死亡人员仍在基本医疗保险统筹基金中报销门诊慢特病费用,涉及金额2.42万元;29家企业45名女职工生育小孩,但至今未领取生育津贴。传统审计面对海量的医保数据,只能采取抽查的形式,而大数据审计利用现代信息技术实现了审计全覆盖,有效防止了医保基金被冒领或骗取,推动了女职工生育津贴政策落实到位。
此次医保审计现场不足一个月,时间很紧张,医保政策法规较多,数据分析较为浅显。今后的审计中,要加强相关政策的学习,多看优秀审计项目,多读大数据审计案例,多学习数据分析方法,提高大数据审计技术,提升审计质量。