中介中心性

修改密码

提交

Change Email

Submit

修改昵称

当前昵称：

提交

基础信息

用户邮箱：

用户昵称：
手机号：
公司名称：
公司邮箱:

修改密码

申请证书

当前未申请证书.

申请证书

Certificate	Issued at	Valid until	Serial No.	File

Serial No.	Valid until	File

Not having one? Apply now! >>>

ProductName	CreateTime	ID	Price	File

ProductName	CreateTime	ID	Price	File

No Invoice

创建嬴图账号

我已阅读并同意隐私政策和数据处理协议。

请勾选表示您已阅读并同意

已有嬴图账号？去登录！

忘记密码

重置密码

返回登录

中介中心性

HDC 分布式

概述

中介中心性（Betweenness Centrality）测算一个点位于图中其它两点间最短路径上的概率。这个指标能有效地找到在图的各部分间起桥梁作用的点。

中介中心性的取值范围是0到1，值越大，点对于网络流通性或连通性的影响力越大。

参考资料：

L.C. Freeman, A Set of Measures of Centrality Based on Betweenness (1977)
L.C. Freeman, Centrality in Social Networks Conceptual Clarification (1978)

基本概念

最短路径

两点间的最短路径是指它们之间边数最少的路径。当考虑边权重时，（加权）最短路径是那些权重和最少的路径。

点x的中介中心性计算公式为：

其中，

i和j是图中互异的两个点，不包括x。
σ_ij为i、j间最短路径的数量。
σ_ij(x)为i、j间经过x的最短路径的数量。
σ_ij(x)/σ_ij就是x位于i、j间最短路径的概率。注意，i、j不连通时，σ_ij(x)/σ_ij为0。

最终值由因子(k – 1)(k – 2)/2进行归一化，其中k是图中的点总数。这种归一化可确保结果位于固定范围内，使其在不同大小的图之间具有可比性。

点A的中介中心性为(1/2 + 1 + 2/3 + 1/2 + 1 + 2/3) / (4 * 3 / 2) = 0.722222。

采样计算

在规模较大的图上运行本算法会消耗很多计算资源。当图中点数量超过一万时，建议按点或边采样后进行近似计算。算法只进行一次均匀采样。

示例图集

创建示例图集：

// 在空图集中逐行运行以下语句
create().node_schema("user").edge_schema("know")
create().edge_property(@know, "strength", int32)
insert().into(@user).nodes([{_id:"Sue"}, {_id:"Dave"}, {_id:"Ann"}, {_id:"Mark"}, {_id:"May"}, {_id:"Jay"}, {_id:"Billy"}])
insert().into(@know).edges([{_from:"Dave", _to:"Sue", strength:1}, {_from:"Dave", _to:"Ann", strength:3}, {_from:"Mark", _to:"Dave", strength:2}, {_from:"May", _to:"Mark", strength:1}, {_from:"May", _to:"Jay", strength:2}, {_from:"Jay", _to:"Ann", strength:2}])

在HDC图集上运行算法

创建HDC图集

将当前图集全部加载到HDC服务器hdc-server-1上，并命名为 hdc_betweenness：

CALL hdc.graph.create("hdc-server-1", "hdc_betweenness", {
  nodes: {"*": ["*"]},
  edges: {"*": ["*"]},
  direction: "undirected",
  load_id: true,
  update: "static",
  query: "query",
  default: false
})

hdc.graph.create("hdc_betweenness", {
  nodes: {"*": ["*"]},
  edges: {"*": ["*"]},
  direction: "undirected",
  load_id: true,
  update: "static",
  query: "query",
  default: false
}).to("hdc-server-1")

参数

算法名：betweenness_centrality

参数名	类型	规范	默认值	可选	描述
`edge_schema_property`	[]"`<@schema.?><property>`"	/	/	是	作为权重的数值类型边属性，权重值为所有指定属性值的总和；不包含指定属性的边将被忽略
`impl_type`	String	`dijkstra`, `spfa`	`dijkstra`	是	指定由算法Dijkstra或SPFA计算加权最短路径。仅当使用`edge_schema_property`时生效
`sample_size`	Integer	`-1`, `-2`, `[1, \|V\|]`	`-2`	是	设为`-1`时，采样`log₁₀(\|V\|)`个点（`\|V\|`为图中点数量），或自定义一个在`[1, \|V\|]`区间内的采样数；设为`-2`时，不进行采样
`max_path_length`	Integer	>0	/	是	只考虑长度小于或等于该值的最短路径；注意此参数不影响考虑的点对总数
`return_id_uuid`	String	`uuid`, `id`, `both`	`uuid`	是	在结果中使用`_uuid`、`_id`或同时使用两者来表示点
`limit`	Integer	≥-1	`-1`	是	限制返回的结果数；`-1`返回所有结果
`order`	String	`asc`, `desc`	/	是	根据`betweenness_centrality`对结果排序

文件回写

CALL algo.betweenness_centrality.write("hdc_betweenness", {
  params: {
    return_id_uuid: "id"
  },
  return_params: {
    file: {
      filename: "betweenness_centrality"
    }
  }
})

algo(betweenness_centrality).params({
  projection: "hdc_betweenness",
  return_id_uuid: "id"
}).write({
  file: {
    filename: "betweenness_centrality"
  }
})

结果：

_id,betweenness_centrality
Dave,0.666667
Billy,0
May,0.133333
Mark,0.266667
Jay,0.133333
Ann,0.266667
Sue,0

数据库回写

将结果中的betweenness_centrality值写入指定点属性。该属性类型为float。

CALL algo.betweenness_centrality.write("hdc_betweenness", {
  params: {},
  return_params: {
    db: {
      property: 'bc'
    }
  }
})

algo(betweenness_centrality).params({
  projection: "hdc_betweenness"
}).write({
  db:{ 
    property: 'bc'
  }
})

完整返回

CALL algo.betweenness_centrality("hdc_betweenness", {
  params: {
    max_path_length: 2,
    return_id_uuid: "id",
    order: "desc",
    limit: 3
  },
  return_params: {}
}) YIELD bc
RETURN bc

exec{
  algo(betweenness_centrality).params({
    max_path_length: 2,
    return_id_uuid: "id",
    order: "desc",
    limit: 3
  }) as bc
  return bc
} on hdc_betweenness

结果：

_id	betweenness_centrality
Dave	0.4
May	0.133333
Mark	0.133333

流式返回

CALL algo.betweenness_centrality("hdc_betweenness", {
  params: {
    return_id_uuid: "id",
    edge_schema_property: "strength"
  },
  return_params: {
  	stream: {}
  }
}) YIELD r
FILTER r.betweenness_centrality > 0.6
RETURN r

exec{
  algo(betweenness_centrality).params({
    return_id_uuid: "id",
    edge_schema_property: "strength"
  }).stream() as r
  where r.betweenness_centrality > 0.6
  return r
} on hdc_betweenness

结果：

_id	betweenness_centrality
Dave	0.6

在分布式投影上运行算法

创建分布式投影

将图集全部投影到shard服务器上并命名为dist_betweenness：

create().projection("dist_betweenness", {
  nodes: {"*": ["*"]}, 
  edges: {"*": ["*"]},
  direction: "undirected",
  load_id: true
})

参数

算法名：betweenness_centrality

参数名	类型	规范	默认值	可选	描述
`sample_rate`	Float	(0, 1]	1	是	采样一定比例的边进行计算
`limit`	Integer	≥-1	`-1`	是	限制返回的结果数；`-1`返回所有结果
`order`	String	`asc`, `desc`	/	是	根据`betweenness_centrality`分值对结果排序

文件回写

CALL algo.betweenness_centrality.write("dist_betweenness", {
  params: {},
  return_params: {
    file: {
      filename: "betweenness_centrality"
    }
  }
})

algo(betweenness_centrality).params({
  projection: "dist_betweenness"
}).write({
  file: {
    filename: "betweenness_centrality"
  }
})

结果：

_id,betweenness_centrality
Mark,0.133333
Jay,0.0666667
Ann,0.133333
Sue,0
Dave,0.333333
Billy,0
May,0.0666667

数据库回写

将结果中的betweenness_centrality值写入指定点属性。该属性类型为double。

CALL algo.betweenness_centrality.write("dist_betweenness", {
  params: {},
  return_params: {
    db: {
      property: 'bc'
    }
  }
})

algo(betweenness_centrality).params({
  projection: "dist_betweenness"
}).write({
  db:{ 
    property: 'bc'
  }
})

ID
产品
状态
核数
Shard 服务最大数量
Shard 服务最大总核数
HDC 服务最大数量
HDC 服务最大总核数
申请天数
审批日期
过期日期
MAC地址
申请理由
审核信息