8 月 24 日,由《麻省理工科技评论》中国主办的“图计算的世界”研讨会在北京举办,来自图计算领域的专家学者、产业及应用界人士齐聚一堂共话该技术的发展及应用前景。
中国计算机学会高性能计算专业委员会秘书长、中科院计算所研究员张云泉、北京航空航天大学软件学院教授级高工王宝会、涛思数据创始人陶建辉、以及来自能源、金融应用领域的代表探讨了图计算产学研协同合作模式;Ultipa联合创始人张建松、蚂蚁集团图数据库负责人洪春涛、欧若数网创始人兼CEO叶小萌、创邻科技联合创始人兼COO吴菁、星环科技金融售前与解决方案部售前总监东方,从产业侧探讨了如何开启图计算应用领域“新版图”。
▲图:研讨会部分参会嘉宾合影
会上,全球领先的科技市场研究机构 CB Insights 中国解读了即将于 2022 世界人工智能大会期间正式发布的《中国图计算技术及应用发展研究报告》。
《报告》指出,图数据能更自然、直观地表述数据间的关联关系,是一种更符合人类思考方式的抽象表达。随着企业对数据间复杂关联的深度挖掘需求日益增长,图数据的应用开始受到越来越多的关注。近年来图计算领域不仅在学术研究方面快速发展,在产业应用方面也正在大步推进中,目前行业参与者中,既有蚂蚁、阿里、腾讯、AWS等公有云、软件、数据库等领域的巨头,也有 Neo4j、TigerGraph、Ultipa(同心尚科技)、创邻科技、欧若数网等国内外创业企业。此外,《报告》还指出,目前图计算仍处于商业化初期,市场对其认知仍不足;应用场景也相对有限,主要集中于金融风控、能源电力、社交网络等之中。未来对于图计算领域的众多学术机构和厂商来说,如何联动学研两侧、完善行业生态、提升市场认知、开拓更多应用场景,前路依然任重而道远。
分享会内容精选回顾
1.图计算产学研究协同合作模式
Q:高校和产业如何实现更紧密合作
业界相对更关注短期出成果、出性能的技术,而学界相对更关注中长期的科研影响力、学术影响力。
有专家表示,两者要实现好的融合,更常见的是由业界给出具体的场景、具体的问题、具体的痛点,学界专注解决这些问题,再由业界进行商业化应用。
北京航空航天大学软件学院教授级高工王宝会表示,围绕图计算,如今学界的研究方向首先包括了以芯片为基础的分布式存储和分析计算架构,解决图计算遇到的问题;第二是分布式的图计算平台;第三是图计算与启发式算法深度融合;此外,如今多模态的数据融合是一个大的趋势,面对复杂多源多模态数据,如何用图表征学习,也是一大研究热点。最后是量子计算和图计算的结合,未来量子计算带来的超算能力,能在图计算里解决什么样的场景问题,这其中也有很大的研究空间。
▲图:北京航空航天大学软件学院教授级高工王宝会
Q:围绕图计算领域的学术研究热点有哪些
近年来,图计算技术成为一大研究重点。一位在场的学界专家认为,在这方面 AI 制药和图数据上的预训练技术是非常有前景的研究领域。目前 AI 制药用到很多图机器学习、图深度学习相关的技术,其中有一种潜在的可能性,即通过算法自动生成分子结构,快速筛选判断特定分子结构是否能作为某一种药物。
另一方面就是图数据上的预训练技术,尤其是自建构的预训练。预训练最近在 AI 学界和产业界,比如视觉、自然语言处理方面都有很大的进展,潜在的可能在于,面对一个大规模数据来说,如果可以只训练一个通用的模型,模型生成的属性、特征可以自动应用到下游各个机器学习应用中,那将可以节省上千个团队的尝试和努力。
2.如何开启图计算应用领域“新版图”
Q:哪些业务应该用图数据库解决
星环科技金融售前与解决方案部售前总监东方表示,首先以点边表示的图数据比传统关系型数据更加便于可视化。其次对于交易关系、企业关联关系的查询等场景,关系型数据库很难满足多度关联查询的时效性,而图数据库甚至可以以毫秒级的速度给出结果。这种场景下,图数据库可以说帮助类似业务场景实现了从 0 到 1 的过程。
▲图:星环科技金融售前与解决方案部售前总监东方
在这个问题上,欧若数网创始人兼 CEO 叶小萌认为,是否应该用图数据库,有一个比较简单的判断方式。因为图不是图片图像,而是一个关系网络。所以业务的关系网络中如果只是一跳或两跳关系,那就不适合用图数据库,如果是多跳关系,图数据库就是最好的选择。
▲图:欧若数网创始人兼 CEO 叶小萌
Q:业界在实际应用过程中的痛点问题
在场的一位金融应用领域代表指出,关键的还是技术如何与业务实现更深入的融合。比如证券公司有非常多业务,如何把图计算、图数据库恰当地应用到每一个业务场景是一个问题,因为即使是公司的一员,也很难了解其他业务的场景。所以业界要做的第一件事就是先了解自己的业务场景,用图计算技术完成一些有意义的工作。而实现完美的融合,这是最重要也是最困难的点。
星环科技金融售前与解决方案部售前总监东方表示,“推广图计算,刚开始的时候,就像拿着榔头找钉子的过程。图是一个很好的工具,相当于手上有一个榔头,但是不知道场景需求,也就是钉子在哪儿。在和客户的交流过程中可以明显感受到砸钉子的过程是比较困难的。其实知识图谱与图计算技术在各行各业都有深入应用的前景,关键在于理解场景要点和业务需求。”要解决这个问题,他认为首先可以依赖有经验的合作伙伴,一起了解业务场景共同推进,其次是修炼内功,加强对自身业务的理解。
创邻科技联合创始人兼 COO 吴菁指出,目前图数据库技术还处在早期阶段,一方面人才是极度欠缺的。在实现落地时,不能仅仅是把数据库卖给客户,因为客户内部也没有足够成熟的技术人员来使用,市场上非常缺乏相关的运维人员,这也是落地时遇到的客观难题。另一方面,图数据库的技术的生态不成熟,缺少成熟的中间件、应用等角色,这就会倒逼厂商要做完整的解决方案。
Q:关于图计算的未来
Ultipa 联合创始人张建松表达了乐观的态度,从数据上来看,图数据库的市场增速已经超过了 100%。“我们先前置一个概念:人工智能发展的终极目标是实现强人工智能,强人工智能指的是让机器和算法像人类一样具备图的思维方式,而图思维方式的本质就是能 100% 实现映射和还原世界,并能在提供深层计算能力的同时,打破系统间、数据间存在的藩篱,并对多源、多维的数据进行深度下钻、关联、归因分析——这实际上就是一种图计算与分析的方式。所以,我们可以预见到未来图数据库与(实时)图计算技术的发展,不仅会占有一席之地,尤其是随着数据规模的不断扩大、数据复杂性的不断提高,图会成为未来数据库技术发展的主流方向之一。”
此外,在 AI 领域,如今我们正处于第二代人工智能,张建松认为图计算、图算法方面的创新将在第三代人工智能时期广泛出现,且这些特征和算法是白盒化的,因而能够极大推动下一代人工智能技术的发展。
蚂蚁集团图数据库负责人洪春涛认为,长远来看,技术问题总能被一个一个解决,而更友好和自然的抽象对生产力的提升却会越来越重要。图模型作为一种通用的数据模型,是比二维表更自然,更好理解的。图计算基于图模型抽象,对数据进行处理,可以更好的分析复杂关系数据。目前图计算已经被应用于风控,社交,推荐等场景,并取得了很好的业务效果。但是我们也看到,目前图计算应用还是作为传统大数据技术的一个补充手段,用于处理传统大数据技术无法解决的问题。图模型作为一种通用数据模型,其在通用性上和表达能力上是优于传统关系模型的。因此我们认为图计算可以且应当被用于更广泛的场景中。而要达到这个目标,关键的是生态,我们期待让更多人看到其中的机会并参与进来,构建更完善的图计算生态。“长期我们前途光明,短期还是需要努力。”洪春涛说。
·END·