前言:
新加坡破获的巨大洗钱案突显了金融领域对于高效数据管理和分析的需求,同时也凸显了图数据库技术在应对复杂犯罪网络和洗钱活动方面的重要性。传统的关系型数据库很难有效处理具有多层次关系和复杂连接模式的数据,而图数据库则以其在处理图状数据结构方面的优势成为了解决这类问题的理想选择。
最近,笔者看到了一则关于新加坡关联可疑交易方面的新闻,是一宗特大洗钱案,金额约7亿美元,是新加坡迄今为止最大的一宗洗钱案件。
图1:10名涉嫌伪造文件和洗黑钱被指控
图2:新加坡警方发布案件消息
之所以震惊,还是在于狮城在亚洲的特殊角色,尤其近年来,随着地缘政治局势的发展,吸引了很多人辗转到此,将该地视为开展业务的中立场所。所以,被黑产盯上毫不意外。因为每时每刻,新加坡都汇集了大量的高价值跨境交易,要知道具备此功能的国家,隐藏洗钱转移等行为会变得非常容易——尤其新加坡周围的邻居们,大多涉及有赌场、地下钱庄系统、诈骗组织等等。本次新加坡政府的行动也证明其雷霆整治的决心。
图3: 图片源自新加坡金管局(MAS)
新加坡金管局(MAS)
新加坡金管局于8月30日修订并发布《强化反洗钱反恐怖融资控制与实践 发现和减少滥用法人/法律安排和复杂结构的风险》(Strengthening AML/CFT Controls and Practices to Detect and Mitigate Risks of Misuse of Legal Persons/Arrangements and Complex Structures)参考文件,强调充分利用数据分析来发现和减轻滥用法人带来的洗钱和恐怖融资风险。
《强化反洗钱反恐怖融资控制与实践 监测和减轻滥用法人/法律安排和复杂结构的风险》(20230830)
https://www.mas.gov.sg/regulation/guidance/amlcft-controls-on-risks-of-misuse-of-legal-persons-arrangements-and-complex-structures
《有效利用数据分析 监测和减轻滥用法人的 ML/TF 风险》(20230627)
https://www.mas.gov.sg/regulation/guidance/effective-use-of-data-analytics-to-detect-and-mitigate-mltf-risks-from-the-misuse-of-legal-persons
反思
这起洗钱案,虽然涉案金额大、影响大,但从“图(图数据库)”的链路上来看,并不复杂,非常容易就可以识别出可疑的资金流向。
图4:在Ulitpa Manager上的查询可视化(2D)呈现
值得反思的是,为何这起并不复杂的洗钱案一直没被发现?
从全球的反洗钱来看,新加坡的这起轰动性的洗钱案并非个例,尤其是面对网络支付行业的快速蔓延,比过去更具隐蔽性,然而传统的反洗钱系统抗风险模式相对滞后,快速转型和适配体系的难度也较大,甚至许多金融机构都拥有可以发现非法活动的数据,但却无法将数据及数据间的关系进行关联和有效挖掘和分析的能力。
为什么会这样呢?从技术的角度来看,当前几乎所有的反洗钱合规系统的底层用的都是传统关系型数据库,它是将客户、账户、交易等信息存储在行、列之中,找潜在的关联,就需要工作人员将多张表链接起来运行查询,这可能需要数小时甚至数天,也甚至根本无法完成,因而导致几乎无法确定不同的参与方和交易方之间的联系,并进行有意义的分析。见图5-1。
在图数据库中,数据存储在点和边中,其中点1可以代表客户、账户等等,边2则代表关联,而多个点和边就构成了图。见图5-2。
图5:从关系型数据库(表结构)到图数据库(图结构)
也就是说,如果监管机构的技术仍停留在传统数据库或浅层图计算的时代,那么这些任何通过更深层伪装的洗钱路径都将无法被识别出来!具体有哪些表现呢?
1、无法解决目前金融机构在交易、股权等数据时,需要穿透10层以上的需求。众所周知,所有的洗钱行为,都是为了躲避监管而构造了复杂的洗钱路径,所以会出现多人组网、多账户成环、多笔交易网络化躲避识别等等,也就是说,如果监管机构的规定是查询3层,金融机构的识别深度只有5层,那么根本不可能发现到这种深层次的洗钱模式。值得一提的是,这种实时的深度的链路、网络转账识别如果没有原生图内存计算引擎的支撑,几乎是无法实现的。
2、传统的数据库系统,并不适合在多个层级的账户中去关联点和确定各个隐藏关系,无法满足对多方、多笔交易之间进行有意义的、洞察性的分析,而这对于分析资金流动的痕迹和评估其洗钱风险是及其至关重要的。
3、缺乏灵活性。传统的数据库系统,无法在海量且复杂的环境中,进行大海掏针似的洞悉到非法资金流动的痕迹,但,犯罪分子是非常狡猾的。
4、成本高昂。成本中心需大量的投资,需妥善地去安排反洗钱合规工作所需的人员、系统、数据。而这些投资并不能转化为营收。
5、准确率太低。虽然投入巨大,且造成人力、物力、财力的浪费,但传统反洗钱系统的误报率极高,这显然无法满足新型多变的风险实时检测需求。
图技术
图数据库技术会一扫以上痛点。
区别于传统的关系型数据库,它是一种新的数据结构存储和分析方式,非常适合对任何关系、网络和模式的洞察和探索。
那么,图数据库是如何揭示隐藏的交易模式和关联关系呢?
对于金融机构而言,有组织犯罪的洗钱规模和频率通常会远高于零售客户,因此AML关注的要点一般是洗钱规模大、发生频率高、牵连账户多,以及跨行、跨境内外的洗钱行为。图技术可以将历史交易信息全部都显示在图中,以方便工作人员(调查员或分析师)借助强大的视觉工具——嬴图Manager(嬴图 Manager),发现个中隐秘的关联链路,理解和分析交易模式,评估洗钱风险等。
图6: 图技术可以直观展示出复杂的关联链路
在图6中,工作人员可以通过关联关系,轻松发现以下几种情况:
· 主要参与方和银行监管名单上的客户1中的IP地址是相同的。
· 主要参与方向辅助参与方2付款,但这位辅助参与方与客户3是夫妻关系,而客户3在银行有违规记录。
·主要参与方向辅助参与方1付款,但后者与高风险地区的客户2有交易往来记录。
以上信息,如果银行通过传统审核文件以及表格的形式进行人工核查的话,是很难发现人与人之间复杂的隐秘关联的,因为工作人员需要登录多个系统进行检索,根本无法直观且快速地对风险进行评估。
此外,银行都会有KYC(Know Your Customer,了解你的客户)和CDD(Customer Due Diligence,客户尽职审查)的工作环节,并在开户中后期仍会对客户的每一笔资金来源进行审查,此外还会进行风险评级和定期进行评级调整的。那为什么这起案件的几位嫌疑人还可以蒙混过关呢?这是因为人为造假等因素钻了技术上的空子——归根到底,还是技术上的问题!
银行所掌握客户的信息,仅仅是姓名、职业、地区等静态信息,所以,银行方是很难甄别这种刻意隐藏或伪装后的身份或所属网络客户的风险情况的。但在图的帮助下,银行工作人员可以在尽职调查阶段,通过参考更多的第三方信息库搜集到的关联信息,揭示出未知的风险隐患。
图7:从图上可直观发现,包括王永明在内的嫌疑人,均是中国公安公布的通缉犯
同时,如果将节点(王永明)展开,就会关联出贵金属、奢侈品、房地产等参与异常交易的节点。而这些节点还能层层下钻,挖出黑产,以引出更多的其他线索。
图8: 网络链路
见下图所示,在反洗钱交易跟踪上,图数据库技术有着令传统关系型数据库望尘莫及的深度查询优势,如从某个账户出发(转出账户),经过层层转账(≥10层)后,汇集到另一个账户(收款方)。
图9:洗钱模式之一:从某账户出发经过深度的(10层网络)转账发散后汇集到另一账户
图10:洗钱模式之一:时序升序、金额降序,形成深度的(10层+)转账环路
嬴图Graph实时实现效果:
·T+0在交易行为数据的大图中识别组网、成环等行为模式。
·实时查询并识别针对某个用户或多个用户的转账、交易行为的“洗钱”模式。
·支持实时报警阻断!
另外,图技术在筛查和分析层级众多的企业所有权结构方面具有天然的优势,可以帮助银行定期进行KYC调查和监管名单上的更新,以持续识别高风险客户。见下图,人们可以通过图直观地查询出DBS(新加坡发展银行)与犯罪嫌疑人苏海金、Bank of Singapore(新加坡银行)与苏宝林有关联关系,并可以再进行层层穿透与下钻……
图11:案件中的两位犯罪嫌疑人,与新加坡的两大银行有密切的关联关系
最后要补充的是,对于金融系统而言,锁定犯罪链路并极速甄别出洗钱风险是对金融资产的有效保护。这也意味着对图数据库系统在性能和速度上的要求是非常高的!嬴图实时图数据库(嬴图-高性能图数据库赋能万物关联)深信下一代的反洗钱IT基础架构中必将有实时图数据库(图计算)、图存储、图中台的一席之地,并已在过去的几年实践中,成功地赋能了多家金融机构通过超强算力高效地识别出各种洗钱交易,起到并实现了技术快速迭代、适应场景快速更新、保障金融机构稳健经营的目标。
1、深度穿透分析。犯罪分子为躲避侦查,会在资金网络中制造出错综复杂的关系,嬴图Graph 能深度穿透40层,梳理可疑人员间的交易脉络,形成可以明确表示资金流动的链图,实时发现资金链中存在的洗钱行为,快速评估洗钱行为的风险程度。
2、极速优势。利用强大的内存计算效率,可在短时间内进行大量的图构建和图计算。此外在保证高效率的同时,对于资源的占用也保持在一个较低水平,可以满足金融机构在使用时所要求的响应时间和准确率,同时降低硬件成本和运维成本。
3、高可视化。反洗钱工作要在海量的多维情报数据中高效地发现可疑资金交易行为。数据的高可视化能够基于海量数据,实时发现其中具备“离析”“转移”“融合”特征的可疑资金链,用直观可视化的方式输出分析结果,将看似破碎无序的数据组成一个关系分明的整体,揭示其资金流动背后的隐秘。此外,通过底层的算法,还能通过关联关系识别团伙,提高检测的增益率。
4、白盒可追溯。洗钱行为往往是多链路的,账户关系又极其复杂,嬴图能够满足使用者对于数据追溯、分析的业务需求,能够智能化地呈现关联关系并能追溯、回溯,同时在洗钱案件的调查、账户管理、检测结果归因查询上都能发挥良好的作用。
5、实时发现欺诈行为。嬴图可以毫秒级实时处理成千上万笔支付或财务交易。此外,面对银行的更新和变更数据时,也能进行持续的更新和实时计算分析。
6、覆盖率、准确性高。针对于传统反洗钱系统误判率高的痛点,嬴图通过深度关联分析,建立智能的规则和风险评估措施,将洗钱分子建立的错综复杂的身份和网络账户快速捕获、发掘、分析……多维度动态细分客户风险,有效区分洗钱信号和噪音,降低误报和漏报率,旨在从各个层面实现反洗钱目标的精准识别。
7、技术迭代开发优势。传统金融机构的洗钱多集中于跨行转账,相对完整的资金路径较难追踪,而洗钱团伙逐步形成了上中下游的完整洗钱链路,洗钱渠道和形式也更加多变。所以,对于客户识别这类数据量不断增长的业务场景,一般的传统关系型数据库无法满足庞大数据的处理需求,嬴图提供快速的二次开发能力,对于个性化的分析需求开发提供扩展空间,以提高开发人员后续工作效率和升级。
8、节省成本、提高工作质量。图计算通过底层超强算力和高可视化的方式,将所有交易数据、参与方等情况都能一“图”展示,完善洗钱发现流程,让分析师在借助辅助分析工具的情况下,发掘各类信息数据情况、分析交易模式并评估洗钱风险,自动化关键工作环节,更快更彻底的提高团队的效率和效果,最终起到降低人工成本、运营费用的作用。
9、嬴图AI图增强智能。嬴图XAI图增强智能是具备弹性可扩展的图计算与存储的底层深度算力引擎,对现有的 AI/ML及LLM大模型架构,起着模型增效、加速、大幅提高预测准确率及可解释性的性能特点,并以HTAP集群的方式兼顾了OLTP与OLAP类型的业务诉求,通过分布式、多级存储加速实现水平扩展,已经在大型商业银行的千亿级数据量生产系统得到验证。【文/Emma Z 】
图12:嬴图实时图数据库系统创造的价值
【注释】
[1]点 (Node),代表真实世界中的实体,即图论中的顶点 (vertex),在 Ultipa 图系统中也称作节点。
2] 边 (Edge),代表真实世界中实体间的关系,即连接两个节点的边。Ultipa 图系统中的边均为有向边。边的两个端点可以相同也可以不相同,相同时边称为自环边(Loop)。