它俩都是肇始于学术界对图论的研究,从最早的200多年前的欧拉的七桥问题演化出早期图论,再到后来的地图上色问题、20世纪60年代的随机图理论研究、多种最短路径算法,以及过去20年间随着大数据框架和理论发展而形成的各种社交图谱(图数据集)研究。但是,图计算(Graph Computing)与图数据库(Graph Database)之间的差异有很多,这是刚接触“图”的人不容易厘清的。
尽管在很多情况下,图计算可以和图数据库混用、通用,但它们之间存在着很多的不同。
图计算可以简单的等同于图处理框架(Graph Processing Frameworks)、图计算引擎(Graph Computing Engines),它的主要工作是对已有的数据进行计算和分析。图计算的框架多数都出自学术界,这个和图论与计算机学科的交叉发生自上个世纪60年代并一直在不断演化有关。
图计算框架在过去20年中的主要发展趋势是在OLAP(Online Analytical Processing)场景中进行数据批处理(bulk analysis)。
图数据库的出现要晚得多,最早可以称之为图数据库的,也要到了上个世纪90年代,而真正原生的图数据库在2011年后才出现。
图数据库的框架主要功能可以分为3大部分:存储、计算与面向应用的服务(例如数据分析、决策方案提供、预测等等)。值得一提的是,传统类型的数据库通常并没有独立的计算引擎,这部分工作都是在存储引擎侧完成的,几乎所有讲关系型数据库包括分布式数据库的书中,存储都占尽风头,通常不会为计算单列一章,由此可见一斑。就计算部分,包含图计算,但图数据库可以处理OLAP与OLTP类操作,也就是说可以兼顾OLAP与OLTP(两者的结合也衍生出了新型的HTAP类型的图数据库,在之前的文章中,笔者曾详细介绍过它的原理)。如果非常粗略的说,从功能角度上看,图数据库是图计算的超集。
具体可点击链接详阅:知乎《文库 | 图计算与图数据库差异简析》