欢迎光临无锡社科网

今天是:

学术成果

大数据时代税收风险管理的国际国内借鉴与实证应用

时间:2015-03-18      浏览次数:       来源:       字号:[ ]

  

许竹芳

  内容提要:大数据是近些年新兴的信息技术,大数据时代将会给税收风险管理在数据采集、分析、应用等方面带来推动,美、英等国家和国内一些地区的做法对我们在税收风险管理中应用大数据技术有一定的启发和借鉴作用。

  关键词大数据  税收风险管理

  伴随着电子商务、移动互联网、基于位置的服务、社交网络等为代表的新型信息发布方式不断涌现,以及云技术、物联网等新技术的兴起,互联网上的数据正以前所未有的速度不断地增长和累积,人们正被数据洪流所包围,大数据时代已经来到。

  一、大数据与税收风险管理

  大数据(Big Data),指的是所涉及信息量的规模巨大到无法通过目前主流的软件工具,在合理的时间内达到撷取、管理、处理,并整理成为能够用于决策等用途的数据与信息。大数据具有大量(Volume)、多样(Variety)、高速(Velocity)、价值(Value)等特点。基于大数据的这些特点,新的数据采集、分析、处理与应用的大数据技术也不断出现和发展.大数据技术即能够实现对大量的结构化、半结构化、非结构化数据进行采集和快速处理,并得到分析乃至预测结果的一系列数据处理技术的集合。

  随着世界变得越来越数字化,大数据正在潜移默化地影响着每个人的生活。现在,大数据技术被广泛应用于零售、金融、娱乐、交通、疾控、舆情管理等方方面面。在开展税收风险管理时,涉税信息是其中的基础性内容。涉税数据的完备程度、准确与否直接决定了风险指标能否识别出风险疑点及风险疑点的精准性。大数据技术将有助于提升税务机关的信息采集与应用能力。

  1、有助于提高征管数据质量。通过收集散布在互联网各处的纳税人信息,与税务机关掌握的外部门信息、征管信息比对,可及时发现征管信息的差错,并实现动态更新,提高基础数据的有用性、时效性,同时也可在一定程度上化解因纳税人数量快速增长,以及纳税人跨地区、跨国经营、集团化经营而带来的信息采集难题。

  2、有助于提高数据的时效性。以往税务机关在分析纳税人涉税行为时依赖的信息,无论是纳税人报送信息还是外部门交换信息,都是往期信息。信息为税务机关所获取时,该行为已经完成,甚至可能已经完成很久,待分析产生结果付诸处置时,很多事项都会面临当事人无法找到,证据湮灭等困境,难以得到有效处理,使得大量信息被迫成为“无用”信息。如会展、演艺等活动,一旦活动结束,参展、参演的机构、人员就会离开本地,再做调查取证和追缴税款的难度就会大大增加。大数据技术一方面可使税务机关获得实时、准实时的涉税信息,动态掌握纳税人生产经营状况;另一方面能即时进行预分析,及时做出反应,这将及大地提高税务机关的处置效率。

  3、有助于补充第三方信息。通过掌握纳税人、各政府部门自行对外发布的信息,可以部分弥补第三方信息因交换频率带来的数据滞后问题;校验外部门数据的完整性,补充其中缺失的部分;并可能获取各部门已公开发布,但尚未纳入信息交换的外部门信息。

  4、有助于提高数据利用水平。大数据技术将能够解决目前涉税信息在税务机关各部门、大集中系统各模块以及不同本地系统间碎片化存储、相互关联度低、难以全面反映纳税人信息和税收征管状况的问题,通过全面地信息关联,使涉税信息真正成为税收管理资源。

  二、国际国内在税收管理中大数据应用情况

  (一)国外情况

  国外将大数据技术应用于税收管理方面的研究起步较早,已取得了一定的成果,主要体现在以下几个方面:

  1、寻找纳税申报与退税申请的疑点

  2012年起,美国联邦及州的税务部门即开始尝试应用大数据技术寻找偷税、骗税行为的共同特征来打击逃税。美国国内收入署(IRS)对纳税人申报信息与各种公开信息记录进行比较,特别针对申报表中的税前列支内容、退税信息创建了大量算法,寻找其中的疑点。仅就2011年度纳税申报,即发现36亿美元的虚假税前列支,并发现超过3%的退税存在欺诈行为。

  2013年1月4日,意大利税务机关宣布启用新的计算机信息系统“REDDITOMETRO”,利用统计数据将意大利分为五个区域,并定义了11种纳税人类型,分别分析包括住房、社会保障贡献、康乐活动等七方面信息,比对纳税人申报的收入、支出的真实性。希腊税务机关则利用Google Earth 来比对纳税人房产税申报情况与卫星照片信息的差异,来核对其纳税真实性。

  2、预测纳税人涉税违法行为

  通过整理和分析历史数据,IRS还在尝试建立一套纳税人行为预测模型,通过预测分析,可以及时发现纳税人的不法行为,而不是等到一年,甚至几年以后再做分析。IRS在美国东北部的一个分支机构已开始试用这一分析模型,并取得了一些成果。

  3、强化电子商务税收管理

  2013年,英国税务海关总署与著名数据公司SAS达成合作,以大数据技术监控电子商务交易。英国充分利用了其全国邮资定价体系提供的物流信息、银行卡交易体系提供的支付信息等数据与纳税人申报情况进行比对分析,2013年当年减少约10亿英镑的税收流失。预计未来最终能够达到200亿英镑的规模。

  4、强化大企业税收管理

  澳大利亚使用基于大数据分析技术出“税收流失风险指数”对大企业进行初步的风险评分和排序。在进一步的风险监测中,他们充分利用大型涉税情报数据库的数据,分析企业存在哪些主要的涉税风险,从中判断确定战略性风险,通过大数据技术寻找其关联企业,开展综合性的案头分析。之后再由大企业和国际税务管理司派出税务人员进户调查。

  5、提供法律保障

  通过立法形式保障税务机关对纳税人的涉税信息及时、全面地采集是国际上的通行做法。2013年5月美国参议院通过了《市场公平法》(Marketplace Fairness Act),要求所有在线零售商代收消费税,并要求第三方支付公司向税务机关提供线上交易支付信息。英国2009年也即已立法要求银行、非银行发卡机构、非银行收单机构和电子货币发行机构等在线服务企业提供其客户信息。其它主要发达国家都通过了类似法律,保障税务机关及时、有效获取涉税信息。澳大利亚也通过立法保障税务机关从外部获取数据,只要税务机关认为需要,就可以向其他政府部门、银行及其它企业索要,数据拥有方必须给予配合。因此,这些国家的税务机关都掌握着大量关于纳税人的实时、有效信息,可以利用大数据发掘企业与个人的涉税疑点。

  (二)国内情况

  在国内,大数据技术在税收管理领域的应用还处于起步阶段,且大多还在设想和初步探索阶段。如河南安阳国税提出以金税三期逐步上线运行为契机,基于向全国集中的征管数据与互联网信息,运用大数据手段提高税收管理水平;安徽地税在2013年开始将大数据管理理念运用于税收管理,但目前尚局限于实现将散落在税务机关各部门及外部门的涉税数据整合利用;广东地税的大数据应用尝试则更为突出对纳税人涉税风险和纳税服务方面的需求。

  三、无锡地方税务局大数据应用情况

  无锡地税局自2013年起就着手研究大数据时代对税收管理发展带来的影响,探讨大数据技术应用于税收风险管理的前景,并建设了“无锡地税涉税情报管理平台”作为信息化支撑,着重研究行业、事项和大企业等三类税收管理领域,通过从互联网上收集与纳税人有关的各类数据,经处理后与征管系统中的信息进行分析、比对,产生风险疑点实施推送应对。

  (一)运用大数据技术形成涉税情报。

  下面结合案例来介绍无锡地方税务局应用大数据技术实现数据采集,形成涉税情报的过程。

  1、需求确定。餐饮行业由于是以现金交易为主,且个人消费开票率较低,不仅难以实现以票控税,而且与其经营活动直接相关的证据也较难获得。当前蓬勃发展的团购消费模式在促进消费的同时,也将餐饮行业的相当一部分业务“曝光”在税务机关眼前。无锡地税局对占有团购市场绝大多数份额的大众点评团、美团、窝窝团、拉手网、糯米团等五大团购平台的信息进行研究,收集团购交易单价、金额、内容等信息,以团购为突破口,强化对餐饮行业的税收监控。

  2、信源采集。首先遍历五大团购平台所有的团购页面。由于该部分工作量庞大无法人工处理,须使用网页机器人(即网页爬虫)技术来替代人工完成模拟访问的工作。通过编制规则设定网页机器人的搜索方式、访问时间与频率,以及目标商家特征等项目。由于团购平台会从网站撤下超过团购有效期的团购销售页面,因此须在首次采集时先完整采集所有数据,而在后续的采集任务中采用增量采集策略。另外,团购网通常都会采用一定的技术来阻止网页机器人的访问(如屏蔽短时间内多次访问网站的IP地址)。为此,需要模拟人类操作来设定机器人的访问模式,如模拟多个IP地址进行代理访问,稀释机器人访问密度,从而通过目标网站的监控。当所有采集完成后,网页机器人就会将数据信息返回给存储中心保存,以用于下一阶段的分析。

  3、要素分析。一是确定关键要素。通过对团购网页的分析,可以发现只有网页中的销售平台、营业地址、商品种类、数量、单价、已成交记录、有效期等才是税务机关所关注的关键要素。而商品的用户评价、备注、使用时间、积分奖励等并非是关键内容。二是要素定位。关键要素确定后,使用正则表达式与XPath等技术在网页源代码中定位关键元素所在位置。三是语义分析。例如“【15店通用】*誉堂5折价值¥26元2人自助烧烤”这样浓缩了大量信息的语义表达方式,首先要使用中文分词技术解决字符类型、词性判别问题。因为实证表明,团购信息的命名方式是多样化的,不能期望每个商家每次都用同样的描述方式,如若下次出现“【15店通用】*誉堂韩式自助烧烤仅售26元超值半价两人自助烧烤”时,未经分析处理的话就会在程序处理时产生误判。四是筛选补足。筛选出符合业务需要的元素,去除无关、重复数据,补足缺失的数据。例如,美团网中的有效期通常表述为“2013-10-1至2014-5-1”这样的格式,而在拉手网中则表述为“5月1号之前”。消费者所关心的侧重于结束时间,但税务机关对起讫时间都很敏感,这就需要对数据二次分析和补全,再写入数据仓库。在实践中,要素分析还可能包括多种情形,例如对影院的选座图表就需要图型数据转换来判断票房数据。因为每类主题的数据表现形式不一致,需要具体分析,寻找合适的分析工具和分析方法。

  4、数据整理。一是将断裂的数据元素重新组织成为带有逻辑关系的数据集合。例如,团购主题,未整理前,我们只得到“平台=美团”、“平台=拉手”、“商家=*誉堂”、“已销售=28单”、“已销售=55单”这些“键-值”对应的数据元。整理后,我们可以获得无锡*誉堂韩国烧烤自助餐厅分别在美团、拉手的销售总额,而且带有逻辑关系、是唯一的。二是根据业务内容重新构造新的逻辑关系。譬如,基于征管的属地原则,需要将商家区分为“本区单店”、“本区多店”、“同城多店”、“多城多店”等四类。但在捕获的团购数据中,没有任何要素能直接反映这一分类,因此只能通过商家提供的营业地址这一字段进行重构,通过字段重构来满足业务需求。三是迭代整理。数据整理过程是迭代的,迭代过程通常需要关联其他外部信息源,例如,团购平台上商家的店铺名称通常与实体工商注册名称不符,那就需要通过地址、电话等模糊关系进行关联,形成企业登记名称->店铺名称(可能有多个)->销售商品(可能有多个)的复杂对应关系。即一个企业可能有多家店铺,一家(或某几家)店铺可能会发布多条商品数据,这种关系需根据数据特征进行再次分析,以避免出现错误结果。

  5、数据验证。将清洗整理后的团购信息,首先与征管信息比对,通过纳税人名称、注册地址、经营范围、联系电话等字段匹配。如上文提到的无锡*誉堂韩国烧烤自助餐厅虽然与征管信息库中无锡新誉**餐饮有限公司名称不一致,但注册地址、联系电话相同,经营范围重合,疑似为同一实体,从而建立关联关系。其次是风险识别。无锡*誉堂韩国烧烤自助餐厅的团购有效期限为2013年10月24日至2014年6月14日,截止2014年5月14日合计销售金额为528556.4元。同期无锡新誉**餐饮有限公司申报营业收入141579.9元,差异额386976.5元,差异率达273.3%,存在少申报营业收入的风险。第三是开展应对处置。经税务约谈确认无锡新誉**餐饮有限公司与无锡*誉堂韩国烧烤自助餐厅为同一实体,但纳税人提供的团购资料税务机关已掌握信息不符。经实地核查,要求纳税人提供团购平台商家客户端用户名和密码,调取团购销售和到店消费明细,证实了网上捕获信息符合实际,该纳税人存在隐瞒收入行为。

  6、数据输出。将经整理后的情报信息以结构化、可视化的方式展现在业务人员面前,从而完成将散布在互联网上的结构化、半结构化、非结构化数据转化为涉税情报的过程。

  (二)大数据涉税情报的实践应用

  无锡地税局按照互联网信息是否涉税、能否实现规模化自动采集、能否用于揭示涉税风险,确定了行业、事项和大企业等三大类十多个数据主题,现已在其中一些领域取得进展。

  (1)突破现金行业监控。通过捕获团购交易信息,不仅能够监控餐饮业的涉税风险,而且同样适用于KTV、美容美发、婚纱摄影等以现金交易为主的行业。目前已积累大众点评团、美团、窝窝团、拉手网、糯米团等五大团购平台与无锡有关的各类团购交易信息19134条,涉及交易金额18384.69万元。

  (2)试水网店交易监控。近年,电子商务目前处于高速发展阶段,但对电子商务涉及税收的征管一直未能同步跟进,其中的一个主要原因就是税务机关难以掌握纳税人的交易信息。无锡地税局选择天猫商城为样板对网店交易进行跟踪,利用大数据技术初步发现其中有633家是由无锡企业开办的网店,抓取交易信息17.04万条,涉及交易金额21.51亿元。经选取部分单位开展典型调查,将纳税人销售情况与大集中系统内的申报收入信息比对,并对其中存在差异的部分企业实施验证。如**服饰有限公司2011 -2013年在天猫商城实现销售逾360万元,均未与线下收入合并申报。

  (3)优化物业管理监控。将开发商、物业公司、房管局公布于互联网上的无锡两百四十多家物业管理机构一千多个小区的住户数、商铺数、车位数、物业管理费标准、车位收费标准等收集汇总起来,测算估计物业管理公司收入,并与企业申报情况进行比对。通过选取部分企业开展典型调查,发现其中差异最大的企业少报收入超过30%。

  (4)尝试开展实时监控。针对演艺行业流动性高、驻留时间短的特点,对演出场所、经纪公司、演艺公司在网上的排档、售票信息,以及演出公告、广告信息进行收集,在演出尚未开始前即纳入监控视野,在演出过程中动态掌握情况,预防税源流失。目前已完成对1家连锁影院网上售票系统的分析,开展时时监控并已积累6个多月17078场次的票房数据;初步完成对一家公共售票平台的分析;并正在对无锡**剧院网上售票系统、演出信息发布页面进行分析,编写数据抓取与分析程序。

  (5)强化股权转让监控。大企业,特别是集团企业多存在较为频繁的股权交易。其中,交易所持有的境外注册企业股权,因其无需在境内变更工商登记,有着极强的隐蔽性。对境外上市企业公开信息进行采集和分析,可以整理出大量线索。无锡地税局现已收集了在港交所上市的无锡企业所涉及的股权变动信息。如其中的**国际装饰城有限公司,涉及关联企业逾30家,且股权变动频繁。集团内的首家企业无锡中南**公司在2005年6月成立后至2012年的7年间发生股权变动8次,**国际装饰城有限公司本身自2005年11月成立至2009年的3年多时间里,发生股权变动6次,且其中的绝大多数都为平价转让,与企业高速发展不相匹配。

  四、展望与建议

  大数据时代方兴未艾,为税收风险管理的发展带来广阔的空间,对大数据开展研究并将大数据技术应用于税收风险管理之中,不仅可以填补近年来伴随网络经济活动高速发展而出现的税收漏洞,而且可以对各类税收不遵从行为形成有力威慑,持续推动税收风险管理工作的发展。与此相关地,还可形成示范效应,推动大数据技术应用于税收管理以外的各个公共服务与管理领域。

  为保障大数据在税收风险管理中形成持续、有效的应用,应有效做好以下工作:(1)法律保障。要在税收管理中充分发挥大数据的优势,不仅需要技术上的支撑,更需要在法律层面予以保障,通过修改《税收征管法》,保障税务机关能够制度化地顺利采集散落在全社会的涉税信息。(2)统一规划。在全国范围内将大数据技术应用于税收风险管理,由总局统一规划数据的收集整理,制定数据应用规范和后续处置规范,做到全国一盘棋。这样不仅可以增强税收管理的严肃性,减少纳税人利用地区间管理力度不平衡的漏洞;也可在数据的采集、利用上形成规模经济,降低征管成本。(3)因地制宜。由各地从当地经济特点出发,因地制宜地就具体数据主题开展研究和应用,将确有成效的向全国推广使用,不仅充分调动各地税务机关的积极性,也可保障数据分析利用的实效性。

  

参考文献

  

[1] 徐子沛.大数据[M].广西师范大学出版社,2013.

  

[2] [英]维克托·迈尔·舍恩伯格.大数据时代[M].浙江人民出版社,2012.

  

[3]  Curtis Clark. Fighting tax fraud with big data[EQ/OL]. http://www.cnbc.com/id/101575717,2014-04-11.

  

[4] Herb Weisbaum. Big data used to catch fraudulent tax returns[EQ/OL]. ,2014-03-18.

  

[5] David Smith. UK public sector can use big data to tackle £20 billion lost through fraud[EQ/OL]. http://www.sas.com/offices/europe/italy/news/preleases/public-sector-fraud.html,2013-12-06.

  

[6] PTI. Infosys: Government to use Big Data to increase tax collection[N/OL]. http://timesofindia.indiatimes.com/tech/tech-news/infosys-government-to-use-big-data-to-increase-tax-collection/articleshow/25262882.cms,2013-11-05.

  

[7] Big Data Insight Group. Italy to use big data for tax fraud—New system - redditometro - will highlight overt discrepancies between income and spending[EQ/OL]. http://www.thebigdatainsightgroup.com/site/article/italy-use-big-data-tax-fraud,2013-01-08.

  

[8] 杨敏.治税变革:转型与升级[J].决策,2013(05).

  

[9] 张科.税务机关应加强大数据处理与应用能力[N].中国税务报,2013-09-25.

  

  

 

  

作者简介:许竹芳,国际注册内部审计师、中国注册税务师、高级会计师,经济学研究生毕业,学风优良,责任心强;多年从事税务稽查及税收风险监控工作,在省级以上核心刊物发表过两篇研究论文。

  

所在单位:江苏省无锡地方税务局税收风险评估分局,无锡市国际税收研究会

本篇文章共有1页 当前为第 1

关闭窗口