修改密码

请输入密码
请输入密码 请输入8-64长度密码 和 email 地址不相同 至少包括数字、大写字母、小写字母、半角符号中的 3 个
请输入密码
提交

修改昵称

当前昵称:
提交

申请证书

证书详情

Please complete this required field.

  • Ultipa Graph V4

Standalone

Please complete this required field.

Please complete this required field.

服务器的MAC地址

Please complete this required field.

Please complete this required field.

取消
申请
ID
产品
状态
核数
申请天数
审批时间
过期时间
MAC地址
申请理由
审核信息
关闭
基础信息
  • 用户昵称:
  • 手机号:
  • 公司名称:
  • 公司邮箱:
  • 地区:
  • 语言:
修改密码
申请证书

当前未申请证书.

申请证书
Certificate Issued at Valid until Serial No. File
Serial No. Valid until File

Not having one? Apply now! >>>

ProductName CreateTime ID Price File
ProductName CreateTime ID Price File

No Invoice

搜索
    中文

      HITS

      ✓ 文件回写 ✓ 属性回写 ✓ 直接返回 ✓ 流式返回 ✕ 统计值

      概述

      HITS(Hyperlink-Induced Topic Search,超链接诱导的主题搜索)算法由 L.M. Kleinberg 于 1999 年提出,旨在提高万维网(WWW)搜索方法的质量。HITS 利用“权威”和“枢纽”之间的相互增强关系来评估一组相连的实体并进行排名。

      基本概念

      权威和枢纽

      在 WWW 环境,网页间的超链接代表一种潜在的认可:网页 A 的创建者在网页 A 中包含指向网页 B 的链接,在某种程度上赋予了网页 B 一定的权威。因此可以认为,入度很大的节点是权威(Authority)。

      如果一个节点指向相当多数量的权威节点,这个节点就称为枢纽(Hub)。

      如下图所示,红色节点可被视为好的权威,绿色节点可被视为好的枢纽。

      枢纽和权威节点之间存在一种相互增强、相辅相成的关系:一个好的枢纽意味着它指向许多好的权威,一个好的权威又会被许多好的枢纽所指向。

      计算权威和枢纽

      HITS 算法在全图上迭代运行,通过链路结构计算每个节点的权威权值(表示为 x)和枢纽权值(表示为 y)。具有较大 x 值和 y 值的节点分别被视为更好的权威和枢纽。

      在有向图 G = (V, E) 中,所有节点的 x 和 y 初始值都设为 1。在每一轮迭代中,对于每个节点 p ∈ V,根据下式更新其 x 和 y 值:

      以下是一个例子:

      每轮迭代结束时,分别将各点的 x 和 y 值进行归一化处理并保持:

      算法在所有节点的 x 和 y 变化值小于规定的收敛偏差(tolerance)时停止,若迭代轮数达到限制,算法也会结束。原作者在实验中发现,算法收敛地相当快,通常迭代 20 次就足够了。

      特殊说明

      • HITS 算法不考虑自环边。
      • 没有入边的节点的权威权值为 0,没有出边的节点的枢纽权值为 0。

      语法

      • 命令:algo(hits_centrality)
      • 参数:
      名称
      类型
      规范
      默认
      可选
      描述
      max_loop_num int >=1 20 最大迭代轮数;运行至规定的最大轮数后,即使没达到收敛要求,算法也会停止
      tolerance float (0,1) 0.001 收敛偏差;某轮迭代后,如果所有点的权威权值和枢纽权值的总变化值小于收敛偏差,算法结束
      limit int ≥-1 -1 返回的结果条数,-1 返回所有结果

      示例

      示例图如下:

      文件回写

      配置项 回写内容
      filename _id,authority,hub
      algo(hits_centrality).params({}).write({
        file: {
          filename: "rank"
        }
      })
      

      结果:文件 rank

      H,0.000000,0.000000
      G,0.213196,0.190701
      F,0.426420,0.000000
      E,0.000000,0.476726
      D,0.000000,0.572083
      C,0.000000,0.476726
      B,0.213196,0.381382
      A,0.852796,0.190701
      

      属性回写

      配置项 回写内容 回写至 数据类型
      authority authority 点属性 double
      hub hub 点属性 double
      algo(hits_centrality).params({
        max_loop_num: 20,
        tolerance: 0.0001
      }).write({
        db: {
          authority: "auth",
          hub: "hub"
        }
      })
      

      结果:每个节点的权威权值回写至名为 auth 的点属性下,每个节点的枢纽权值回写至名为 hub 的点属性下

      直接返回

      别名序号
      类型
      描述 列名
      0 []perNode 点及其权威权值和枢纽权值 _uuid, authority, hub
      algo(hits_centrality).params({}) as rank
      return rank order by rank.authority desc
      

      结果:rank

      _uuid authority hub
      1 0.852795952652963 0.190700611234451
      6 0.426419530029166 1.43197368054726e-11
      7 0.213196444093741 0.190700611234451
      2 0.213196444093741 0.381381944251153
      8 3.20199049138017e-11
      5 0.476726292571473
      4 0.572082555485605
      3 0.476726292571473

      流式返回

      别名序号
      类型
      描述 列名
      0 []perNode 点及其权威权值和枢纽权值 _uuid, authority, hub
      algo(hits_centrality).params({
        max_loop_num: 20,
        tolerance: 0.0001
      }).stream() as rank
      find().nodes({_uuid == rank._uuid}) as nodes
      order by rank.hub desc
      return table(nodes._id, rank.hub)
      

      结果:table(nodes._id, rank.hub)

      nodes._id rank.hub
      D 0.572082555485605
      E 0.476726292571473
      C 0.476726292571473
      B 0.381381944251153
      G 0.190700611234451
      A 0.190700611234451
      F 1.43197368054726e-11
      H
      请完成以下信息后可下载此书
      *
      公司名称不能为空
      *
      公司邮箱必须填写
      *
      你的名字必须填写
      *
      你的电话必须填写
      *
      你的电话必须填写