连通分量

修改密码

提交

Change Email

Submit

修改昵称

当前昵称：

提交

基础信息

用户邮箱：

用户昵称：
手机号：
公司名称：
公司邮箱:
地区：
语言：

修改密码

申请证书

当前未申请证书.

申请证书

Certificate	Issued at	Valid until	Serial No.	File

Serial No.	Valid until	File

Not having one? Apply now! >>>

ProductName	CreateTime	ID	Price	File

ProductName	CreateTime	ID	Price	File

No Invoice

创建嬴图账号

已经有嬴图账号了?立即登录！

忘记密码

重置密码

返回登录

连通分量

HDC 分布式

概述

连通分量（Connected Component）算法能识别图中的连通分量，这是考察图的连通性和拓扑特征的重要指标。

图中连通分量的数量可作为一种粗粒度的计量方式。如果对图进行某些操作或修改后，连通分量的数量保持不变，则表明图的宏观连通性和拓扑特征没有发生显着变化。

连通分量信息在各种图分析情景中都很有价值。例如，在社交网络中，如果连通分量的数量随着时间的推移保持不变，则意味着网络内的整体连接模式和社区结构没有发生实质性变化。

基本概念

一个连通分量是图中节点的一个最大子集，该子集中的所有节点都可以通过路径相互连接。最大子集意味着在不破坏连接要求的情况下，无法向子集添加其他节点。

连通分量的数量反映全图的连通性以及存在多少不同的子图。如果一个图只有一个连通分量，该连通分量由全图节点组成，这样的图称为连通图（Connected Graph）。

强连通分量，弱连通分量

与连通分量相关有两个重要概念——弱连通分量（Weakly Connected Component, WCC）和强连通分量（Strongly Connected Component, SCC）：

弱连通分量是指有向或无向图中节点的子集，其中任何一对节点之间存在路径，而不考虑边的方向如何。
强连通分量是有向图中节点的子集，其中每对节点之间都存在一个有向路径。换句话说，对于强连通分量中的任意两个节点u和v，既存在从u到v的有向路径，也存在从v到u的有向路径。在有向路径中，所有边的方向一致。

上面的例子对同一张图分别进行了强、弱连通分量的计算，结果可划分为3个强连通分量，或2个弱连通分量。由于强连通分量的判断条件更严格，有向图中的强连通分量的个数总是大于或等于弱连通分量的个数。

特殊说明

图中的每个孤点都是一个连通分量，既是强连通分量，也是弱连通分量。

示例图集

创建示例图集：

// 在空图集中逐行运行以下语句
create().node_schema("member").edge_schema("helps")
insert().into(@member).nodes([{_id:"Mike"}, {_id:"Cathy"}, {_id:"Anna"}, {_id:"Joe"}, {_id:"Sam"}, {_id:"Bob"}, {_id:"Bill"}, {_id:"Alice"}])
insert().into(@helps).edges([{_from:"Cathy", _to:"Mike"}, {_from:"Anna", _to:"Sam"}, {_from:"Anna", _to:"Joe"}, {_from:"Joe", _to:"Bob"}, {_from:"Bob", _to:"Joe"},{_from:"Bob", _to:"Bill"}, {_from:"Bill", _to:"Alice"}, {_from:"Bill", _to:"Anna"}, {_from:"Alice", _to:"Anna"}])

在HDC图集上运行算法

创建HDC图集

将当前图集全部加载到HDC服务器hdc-server-1上，并命名为 hdc_cc：

CALL hdc.graph.create("hdc-server-1", "hdc_cc", {
  nodes: {"*": ["*"]},
  edges: {"*": ["*"]},
  direction: "undirected",
  load_id: true,
  update: "static",
  query: "query",
  default: false
})

hdc.graph.create("hdc_cc", {
  nodes: {"*": ["*"]},
  edges: {"*": ["*"]},
  direction: "undirected",
  load_id: true,
  update: "static",
  query: "query",
  default: false
}).to("hdc-server-1")

参数

算法名：connected_component

参数名	类型	规范	默认值	可选	描述
`cc_type`	Integer	`1`, `2`	`1`	是	要识别的连通分量类型：`1`为弱连通分量，`2`为强连通分量
`return_id_uuid`	String	`uuid`, `id`, `both`	`uuid`	是	在结果中使用`_uuid`、`_id`或同时使用两者来表示点
`limit`	Integer	≥-1	`-1`	是	限制返回的结果数；`-1`返回所有结果
`order`	String	`asc`, `desc`	/	是	根据`count`值对结果排序；该选项仅在流式返回模式下`mode`为`2`时生效

算法结果中，每个连通分量由相同的community_id表示，对应其中一个节点的_uuid值。

文件回写

该算法可生成三个文件：

配置项	内容
`filename_community_id`	`_id`/`_uuid`：点 `community_id`：点所在的连通分量的ID
`filename_ids`	`community_id`：连通分量的ID `_ids`/`_uuids`：连通分量中的点
`filename_num`	`community_id`：连通分量的ID `count`：连通分量中的总点数

CALL algo.connected_component.write("hdc_cc", {
  params: {
    return_id_uuid: "id",
    cc_type: 1
  },
  return_params: {
    file: {
      filename_community_id: "f1.txt",
      filename_ids: "f2.txt",
      filename_num: "f3.txt"
    }
  }
})

algo(connected_component).params({
  projection: "hdc_cc",
  return_id_uuid: "id",
  cc_type: 1  
}).write({
  file: {
    filename_community_id: "f1.txt",
    filename_ids: "f2.txt",
    filename_num: "f3.txt"
  }
})

结果：

_id,community_id
Alice,0
Cathy,1
Anna,0
Bob,0
Joe,0
Bill,0
Mike,1
Sam,0

community_id,_ids
0,Alice;Anna;Bob;Joe;Bill;Sam;
1,Cathy;Mike;

community_id,count
0,6
1,2

数据库回写

将结果中的community_id值写入指定点属性。该属性类型为uint32。

CALL algo.connected_component.write("hdc_cc", {
  params: {},
  return_params: {
    db: {
      property: "wcc_id"
    }
  }
})

algo(connected_component).params({
  projection: "hdc_cc"
}).write({
  db: {
    property: "wcc_id"
  }
})

统计回写

CALL algo.connected_component.write("hdc_cc", {
  params: {},
  return_params: {
    stats: {}
  }
})

algo(connected_component).params({
  projection: "hdc_cc"
}).write({
  stats: {}
})

结果：

community_count
2

完整返回

CALL algo.connected_component("hdc_cc", {
  params: {
    return_id_uuid: "id",
    cc_type: 2
  },
  return_params: {}
}) YIELD r
RETURN r

exec{
  algo(connected_component).params({
    return_id_uuid: "id",
    cc_type: 2
  }) as r
  return r
} on hdc_cc

结果：

_id	community_id
Alice	0
Cathy	1
Anna	0
Bob	0
Joe	0
Bill	0
Mike	6
Sam	7

流式返回

流式返回支持两种模式：

项目	配置项	列名
`mode`	`1`（默认）	`_id`/`_uuid`：点 `community_id`：点所在的连通分量的ID
`mode`	`2`	`community_id`：连通分量的ID `count`：连通分量中的总点数

CALL algo.connected_component("hdc_cc", {
  params: {
    return_id_uuid: "id",
    cc_type: 2
  },
  return_params: {
  	stream: {}
  }
}) YIELD r
RETURN r

exec{
  algo(connected_component).params({
    return_id_uuid: "id",
    cc_type: 2
  }).stream() as r
  return r
} on hdc_cc

结果：

_id	community_id
Alice	0
Cathy	1
Anna	0
Bob	0
Joe	0
Bill	0
Mike	6
Sam	7

CALL algo.connected_component("hdc_cc", {
  params: {
    return_id_uuid: "id",
    cc_type: 2,
    order: "asc"
  },
  return_params: {
    stream: {
      mode: 2
    }
  }
}) YIELD r
RETURN r

exec{
  algo(connected_component).params({
    return_id_uuid: "id",
    cc_type: 2,
    order: "asc"
  }).stream({
    mode: 2
  }) as r
  return r
} on hdc_cc

结果：

community_id	count
6	1
1	1
7	1
0	5

统计返回

CALL algo.connected_component("hdc_cc", {
  params: {},
  return_params: {
  	stats: {}
  }
}) YIELD wcc_count
RETURN wcc_count

exec{
  algo(connected_component).params().stats() as wcc_count
  return wcc_count
} on hdc_cc

结果：

community_count
2

在分布式投影上运行算法

创建分布式投影

将图集全部投影到shard服务器上并命名为dist_wcc：

create().projection("dist_wcc", {
  nodes: {"*": ["*"]}, 
  edges: {"*": ["*"]},
  direction: "undirected",
  load_id: true
})

参数

算法名：wcc

该算法不需要任何参数。

该算法的分布式版本仅支持识别图集中的弱连通分量。算法结果中，每个连通分量由相同的community_id表示。

文件回写

CALL algo.wcc.write("dist_wcc", {
  params: {},
  return_params: {
    file: {
      filename: "wcc"
    }
  }
})

algo(wcc).params({
  projection: "dist_wcc"
}).write({
  file: {
    filename: "wcc"
  }
})

结果：

_id,community_id
Anna,4827860999564427272
Joe,4827860999564427272
Sam,4827860999564427272
Mike,6413128068398841858
Bill,4827860999564427272
Cathy,6413128068398841858
Alice,4827860999564427272
Bob,4827860999564427272

数据库回写

将结果中的community_id值写入指定点属性。该属性类型为uint64。

CALL algo.wcc.write("dist_wcc", {
  params: {},
  return_params: {
    db: {
      property: "wcc_id"
    }
  }
})

algo(wcc).params({
  projection: "dist_wcc"
}).write({
  db: {
    property: "wcc_id"
  }
})

ID
产品
状态
核数
申请天数
审批时间
过期时间
MAC地址
申请理由
审核信息