真实的性能对比 - 嬴图数据库白皮书

修改密码

提交

Change Email

Submit

修改昵称

当前昵称：

提交

基础信息

用户邮箱：

用户昵称：
手机号：
公司名称：
公司邮箱:
地区：
语言：

修改密码

申请证书

当前未申请证书.

申请证书

Certificate	Issued at	Valid until	Serial No.	File

Serial No.	Valid until	File

Not having one? Apply now! >>>

ProductName	CreateTime	ID	Price	File

ProductName	CreateTime	ID	Price	File

No Invoice

创建嬴图账号

已经有嬴图账号了?立即登录！

忘记密码

重置密码

返回登录

真实的性能对比

先来看一个简单的对比：在一张百万量级点边的图上面，用Python NetworkX来完成鲁汶社区识别需要10个小时；类似的，华为的图计算系统需要近3个小时；而通过Ultipa Graph则在1秒钟内以纯实时的方式完成。这种性能差异达到数以万倍计的原因就在于是否实现了高并发、高密度并发原生图计算。

让我们看一个具体的例子——K邻搜索。

K邻（英文K-Hop）操作通常是通过BFS（广度优先搜索）的方式实现的。BFS相对于DFS（深度优先搜索）或其它图算法（鲁汶社区识别等）而言是比较容易实现并发计算的，在图中实现BFS算法并发的过程如下：

K 邻并发算法

K邻并发算法步骤如下：

在图中定位起始顶点（上图中心的绿色顶点），计算其直接关联的、去重后的邻居数量。如果K=1，直接返回邻居去重后数量；否则，执行下一步。
K>=2, 确定参与并发计算的资源量，并根据第一步中返回的邻居数量决定每个并发线程（任务）所需处理的任务量大小，进入第三步。
每个任务进一步以分而治之的方式，计算当前（被分配的）顶点的邻居数量，直到满足深度为K或者无新的邻居顶点可以被返回而退出，结束。

以大家所熟知的 Twitter-2010 数据集为例，4200万个顶点与14.7亿条边的集合中存在大量超级节点（一般认为1-hop邻居在 10000 以上的顶点为超级节点或热点，而 Twitter 数据集中有很多顶点的1-hop邻居超过 1000000个），因此是否能够实现以并发的方式递归查询至关重要——高并发的Ultipa系统可以在6-hop查询中≤2秒钟完成计算，而 Tigergraph 则需要 ≥60 秒，而其它系统，包含Neo4j、Nebula Graph、HugeGraph、ArangoDB 等则完全无法返回。

在2022年初的一次基准测试中，我们以Twitter数据集为基础，对标了多家图数据库系统的性能，结果简报如下：

数据加载：Ultipa比大部分系统快1-12倍
K邻查询：Ultipa比所有其它系统快至少10倍以上。事实上，超过6跳的深度查询，只有Ultipa可以返回结果。
图算法：Ultipa比任何其它图数据库系统快10倍以上。很多系统根本无法完成算法执行。

各家图数据库的图计算性能对比图（以下3张图）：

ID
产品
状态
核数
申请天数
审批时间
过期时间
MAC地址
申请理由
审核信息