图数据库的查询国际标准GQL,预计在2023年底前面世。这也是自SQL国际标准1983年发布以来的唯一一套数据库国际标准。它的问世将标志着数据库行业以及全球企业数据处理市场进入了新的时代——传统的关系型数据库、数仓以及依赖SQL来进行大数据处理的工作模式将会被逐步替代,这一趋势无可避免、注定发生,毕竟GQL的诞生就是为了解决SQL的不足与缺陷。
我们在第一部分的末尾列举了一些图数据库产品。这些图计算、图分析、图存储的技术、产品和解决方案的出现是为了响应不断涌现的业务场景和市场对于数据关联分析、深度关联价值抽取的迫切需求。最近10几年以来,全球IT市场上涌现出了10几家图数据库服务商:从传统的、非常学术化的RDF(资源定义框架)模式图,到基于原生图理念构建的的LPG(标签属性图)或PG(属性图)图数据库,还有那些在传统SQL数据库上或NoSQL数据库上搭建的各种非原生图解决方案,例如Oracle PGX Graph,或HBase+JanusGraph等方案。原生与非原生图的本质区别总结如下:
- 原生图:高效、灵活,更容易赋能业务迭代
- 非原生图:缓慢、僵化,难以持久地支撑业务需求演进
大多数图解决方案在进行类似于表连接的操作时,可以获得比传统的SQL数据库(例如Oracle或MySQL)高出5-1000倍的性能提升,但是它们在面对深度图搜索、高并发图搜索和实时决策场景时就显得一筹莫展了。例如JanusGraph, Neo4j, ArangoDB, DGraph, Amazon Neptune以及那些BAT开发的图系统,这些知名厂家的系统在商业环境,尤其是金融类环境中,会频繁出现不可用的状态——无论是性能、功能还是用户体验。究其原因是因为底层架构上的自研缺失。
我们按照前文中提到过的高性能数据库的特征,逐一阐述嬴图为打造世界上性能最优的图数据库都做了哪些工作。