在商业领域,许多持股股东、实际控制人故意多层隐藏自己的身份,以便能够通过精心设计的复杂架构来规避监管,获取税收优惠,亦或为了欺诈和洗钱。在现实世界里,我们还能看到很多大型企业拥有上千位最终受益者,他们形成了一张巨大的子“图”,这阻碍了监管部门或执法部门进行快速地穿透与目标锁定。嬴图深度图查询分析系统,可以白盒穿透挖掘出层层错综的人与人、人与企业、企业与企业之间的复杂关系,并实时锁定至最终的幕后人。
从技术上讲,深图遍历(deep graph traversal,DGT)不是一个应用场景,它是图计算系统的独特功能,通过嬴图数据库的实时DGT功能,不仅能快速穿透并识别出UBO(最终受益人),还能以AI白盒自动化的方式解释图上的整体结构。诸如以现实场景为例,原中信银行行长孙德顺利用开设多个“影子公司”的方式,借助金融手段来完成利益输送。
如上图所示,孙德顺设计了结构极为复杂的重重“防火墙”,多层影子公司层层嵌套:
·两家平台公司是核心团队,是遮蔽其身的第1层“影子”,安排两名老部下作为代理人;
·在平台公司之下又设立了十多家项目公司作为第2层“影子”;
·在项目公司之下又设立了空壳公司作为第3层“影子”,其中,项目公司和行贿企业还不是直接交易,而是双方各自再成立空壳公司作为第三层“影子”,最终通过借助金融手段来完成利益输送。
·关联:孙德顺——中信银行——企业老板——(空壳公司)投资平台公司——孙德顺
孙德顺利用中信银行的公权力为企业老板批贷款;与此对应,企业老板们或以投资名义或送上优质的投资项目、投资机会等等方式;双方通过各自成立的空壳公司完成直接交易;或者企业老板将巨资注入孙德顺实控的投资平台公司,然后平台公司再用这些资金投到老板提供的项目内,从而以钱生钱,大家共同获利分红,最终形成利益共同体。
我们知道,要了解业务实体的所有权结构,最直观的方法就是以图查询的方式,也称为网络分析或网络关联的方式以显示其相关数据。如果某人作为公司的法定代表,则在图的设置中,这是一条连接两个节点的边,一个节点是人,指向另一个节点即公司,并且该边(关系)标记为“Legal”(代表法人),如下图所示:
假设我们从业务实体节点开始以递归的方式查找业务实体的所有直接关联数据,则可以检索到与其链接的所有实体,并形成一个子图。请注意,节点和边的结果形成的图代替了树,因为树没有循环,但是图上可以交叉和形成环路,并且这更好地反映了现实世界的真实场景——因为企业和人员完全可能通过很多交叉投资/控股等业务结构形成很多环路(ring),这些并不应该用简单的树状的结构来表示。
图:深度穿透工商股权图谱
在现实世界中,经常会看到最终受益人(又名“最终企业所有者”、实控人或多数股权持有人、大股东或多位头部股东)与被检查的业务实体(红星)相距许多节点。传统的RDBMS或数据库文档(甚至大多数图数据库)都无法快速、及时地解决此类问题。上图中显示的最终受益人与被查企业至少相距10层(跳),找到它的计算复杂度可能会非常之高,让我们在这里做一个简单的分析:
·假设每一家公司有25位所有者(投资人、股权持有者);
·如果我们要深挖5层:25 * 25 * 25* 25 * 25 = 9,765,625(〜)10M。
·如果我们深挖10层:1014= 100万亿。
如果我们没有更高效的数据结构、算法和体系结构系统,仅依赖传统的关系型查询方式与系统架构将不可能解决这些挑战。
幸运的是,以上诸多挑战可以通过系统架构的优化,特别是低延迟、高密度并发数据结构和实时计算引擎让用户可以以实时的方式找到最终受益人,很多时候甚至以微秒为单位,因为我们比其他系统能更快地深度挖掘(100倍或更多),而RDBMS和其它类型的NoSQL框架则完全不能处理这种问题。此外,微秒级的时延意味着更高的并发性和系统吞吐量,相比那些宣称毫秒级延迟的系统,这是1,000倍的性能提升。
现在,我们知道,深度图遍历与查询可以识别企业的股东,无论他们离起始业务实体有多远,有时甚至有成千上万的股东,在他们当中快速的循环计算可以得到公司前五或前十的所有股东(例如持股5%、10%或25%以上),这些就是企业可能的最终受益人。
图:最终受益人及持股比例与路径的穿透计算与可视化呈现
上图显示,在嬴图高可视化平台上,通过图数据库的前端界面可以快速且直观地查找和定位企业的最终受益人。图中所示的最终受益人(大股东)与被查询公司(起点)间存在有4层间隔,通过多个公司业务交叉结构,有意无意地隐藏了其直接控股关系。
在一些依托工商图谱的审核、投研、行研等场景中,还可能会查找发行人(上市企业或待上市企业)实体与自然人间的全部关联路径。假如4,000家企业与10,000个自然人之间进行全量计算,需要查询40,000,000次最短路径,如果平均每对路径查询返回10条路径,全部结果有4亿条路径,即便是1条路径需要0.1秒,也需要2年的时间才能够完成计算。计算复杂度可想而知。数仓批处理的方式,根本无法及时完成这种面向海量数据的复杂查询,这个时候,只有实时图数据库(图计算)系统才能做到赋能客户以彻底解决算力不足的痛点。某大型金融行业客户通过使用嬴图数据库高密度并发查询,实现了T+0(分钟级)完成以上所述的大规模批量查询,平均每组路径查询耗时仅0.1毫秒,较原使用的某知名美国图数据库系统的性能提升超过1,000倍。
此外,作为一款高性能的图数据库产品,嬴图还具备以下性能并广泛应用于金融、互联网、物联网等诸多领域。
1.高速图搜索能力:高QPS/TPS、低延时,实时 动态剪枝(过滤)能力。
2.对任何规模的图的深度、实时搜索能力(10层以上)。
3.高密度、高并发图计算引擎:极高的吞吐率。
4.成熟稳定的图数据库、图中台、图计算与存储引擎。
5.可扩展的计算能力:支持垂直与线性可扩展。
6.3D+2D高维可视化、高性能的知识图谱Web前端系统。
7.便捷、低成本的二次开发能力(图查询语言、API/SDK、工具箱等)。