网络爬虫技术在外汇管理审计领域的运用

2020-07-26 14:28金满涛张玉琴
中国内部审计 2020年7期

金满涛 张玉琴

[摘要]本文立足于大数据审计分析视角,针对当前外汇管理审计数据来源与使用的局限性,探討运用爬虫技术获取外汇审计业务数据,以准确捕捉异常信息,提高审计工作质效。

[关键词]爬虫技术    外汇管理    审计领域

当前,外汇管理改革深入推进,业务数据呈现海量化、数字化与信息化的特点,为有效开展外汇管理审计提供了数据基础。而实践中,信息技术在外汇管理审计方面的应用相对滞后,需探索运用新技术与新方法推进审计信息化建设。网络爬虫技术可以有效解决外汇管理审计数据采集不完整、非现场分析不足等问题,实现精准分析,提升审计质效,促进高效履职。

一、网络爬虫技术的可行性

在外汇管理审计领域,网络爬虫技术可以对数据进行针对性筛选,在扩展数据分析范围的基础上更精准地发现审计线索,具有高效率、更灵活、易操作的特点。

一是有助于获取完整大数据,实现审计全覆盖。近年来,随着信息技术的日益发展与广泛应用,外汇管理部门全面加强外汇管理信息化建设,基本实现了以数据形式保存所有外汇管理业务信息。爬虫技术具有的搜索策略及数据库语言功能,可实现对外汇管理部门现有系统数据库全数据地搜索和分析,筛选出存在差异的数据,克服抽样审计的片面性,同时提高审计工作效率。

二是有助于获取外部数据,形成完整证据链。爬虫技术的数据挖掘算法,可爬取或捕捉如办理企业名录登记、内保外贷签约(变更)登记等外汇管理相关业务、项目所涉及的完整外部数据,并进行多视角分析和取证,更加充分、客观、真实地完成审计任务,切实提高审计效率和准确性。

三是有助于弥补现场审计不足,提高审计质效。“总体分析、系统研究、发现疑点、分散核实、精确定位”的审计方式是数字化审计发展的必然趋势,采用爬虫技术实现对审计对象全样本数据的采集,将数据分析与现场审计相结合,促进审计由复杂冗长的传统方式向宏观审慎的大数据处理转变。另外,运用爬虫技术,审计人员无需到审计现场,通过相应授权获取存储在网络数据库中的数据,即可实现审计监督全覆盖,增强审计工作的灵活性。

二、网络爬虫技术在外汇管理审计领域的运用

(一)依托审计信息化建设标准,确定外汇管理审计目标

一是确定审计整体目标。外汇管理审计应站在全局角度,对本外币业务进行综合审计评估,这就需要注重审计目标的整体性,而且要打破经常项目、资本项目、国际收支等按业务条线管理的模式,追踪整个跨境资金流动管理涉及的业务履职情况和内部控制执行情况。

二是设置差异化指标。评价指标体系的设置直接影响评价结果。由于各级外汇局所管理的日常业务存在差异,要确定统一的审计评价标准存在较大困难。因此,需根据外汇管理政策变化、业务流程更新、新系统上线等重要改革事项及时更新外汇管理审计指标,以调整爬虫技术要抓取的目标业务和目标数据。

(二)运用爬虫技术补充完善数据,建立审计所需数据库

对于现有的内部数据,可通过业务系统调取,也可通过明确数据调取口径,由审计对象提供本级部门相关业务数据总量。当然,为了适应审计分析数据标准要求,也有必要调整处理相应数据库格式。可采用以下方法:一是直接复制审计对象数据。二是通过中间文件采集,将不符合审计软件要求的数据转换成审计软件能读取的格式。三是通过ODBC接口采集数据,基于ODBC数据库访问接口的强大功能,可直接访问审计对象信息系统中的数据,然后根据审计需要转换数据格式。四是通过备份/恢复方式采集,即先备份审计对象数据库中的数据,再按照审计所需要数据库格式对其进行恢复处理。而对于外部数据的处理,主要运用爬虫技术抓取。按照“集中分析,重点核查”的审计思路,采用如Python、C#等相关网络爬虫软件,将这些处理软件的优点综合起来,形成一个审计大数据集成和预处理系统。为进一步确保审计数据的完整性,可适当扩大数据范围,从互联网获取海关、税务、工商、征信等外部信息,为审计评价提供依据。

(三)借助“立体透视”功能,分析数据库并锁定目标审计数据

依托审计对象的源数据及利用爬虫技术获取的外部数据,进行深入分析。同时,可根据审计需要建立审计模型,借助SQL查询方法和审计软件多层次、多角度、全方位分析数据,实现“立体透视”,从而快速发现需要关注的数据或存疑信息,将其作为重点审计业务或重点审计数据,获得审计线索。同时,必要时应到审计现场,逐项核实非现场分析出的线索涉及的源数据及原始凭证,获得完整的审计材料,最终形成审计结果或事实。

三、外汇管理审计领域运用网络爬虫技术的相关建议

(一)建立审计大数据平台,确定爬虫技术应用基础

针对外汇管理信息化审计的客观需求,建立自上而下统一标准的中央数据库,实现总局、分局、中心支局的数据连接。对于内部数据,可依托现有ASONE平台建立数据网络,获取国际收支、经常项目、资本项目等业务数据,通过爬虫技术将这些基础业务条线数据作为外汇管理大数据审计分析平台的源数据,借助强大的外汇管理数据存储系统和网络系统,建设外汇管理大数据信息平台,实现审计大数据的存储共享和实时采集使用。

(二)合理设置使用权限,加强数据网络层级管理

一是建立连接各分支机构的数据接口,实现中央数据库与各分支机构网络连接,确保外汇管理分支机构及时将本级数据上传至中央数据库,同时也可根据审计项目及权限范围从中央数据库获得被审计数据。二是预处理中央数据库采集的数据,对原始数据进行清洗、筛选和结构转化,最终保存在相应位置。三是按照外汇管理权限分层级赋予不同层级外汇管理机构相应的权限,以便对下层或同级不同部门行使审计权利。四是从中央数据库中提取开展审计工作所需的数据,将数据汇总导入审计数据库中。

(三)设计引入爬虫软件,充分满足审计需求

一是支持多种数据格式导出,确保数据采集全面准确,以便比较分析不同系统采集数据,为后续审计工作提供有价值的参考。二是系统操作应当简单快捷,容易上手,增加从业人员使用的体验感,提高工作效率。三是设置数据反馈功能,根据审计目标和审计项目要求完成审计任务后,根据现行制度给出反馈意见,并将审计结果和反馈意见存入中央数据库,以便指导下一步工作。四是实时共享数据,确保将审计结果及时上传至数据库,方便审计人员实时查看和使用。

(四)完善系统建设,强化审计结果有效运用

一是完善业务系统功能,增强各系统间的数据关联和匹配度,提高数据定时交换频率,缩短数据抓取时滞。二是建立审计问题行为库,按照风险程度、后果大小将平台应用中发现的审计问题进行分类,并将其置入数据平台共享。三是创新审计模式,科学设置审计模型,对数据进行立体化、多层次、多维度的挖掘,实现数据的有效利用。四是加强审计监督,有效运用审计结果,及时发现问题、纠正问题,实现全过程审计监督。

(作者单位:国家外汇管理局新疆分局    国家外汇管理局塔城地区中心支局,邮政编码:830002,电子邮箱:jinmantao@163.com)