修改密码

请输入密码
请输入密码 请输入8-64长度密码 和 email 地址不相同 至少包括数字、大写字母、小写字母、半角符号中的 3 个
请输入密码
提交

修改昵称

当前昵称:
提交

申请证书

证书详情

Please complete this required field.

  • Ultipa Graph V4

Standalone

Please complete this required field.

Please complete this required field.

服务器的MAC地址

Please complete this required field.

Please complete this required field.

取消
申请
ID
产品
状态
核数
申请天数
审批时间
过期时间
MAC地址
申请理由
审核信息
关闭
基础信息
  • 用户昵称:
  • 手机号:
  • 公司名称:
  • 公司邮箱:
  • 地区:
  • 语言:
修改密码
申请证书

当前未申请证书.

申请证书
Certificate Issued at Valid until Serial No. File
Serial No. Valid until File

Not having one? Apply now! >>>

ProductName CreateTime ID Price File
ProductName CreateTime ID Price File

No Invoice

v5.0
搜索
    v5.0

      皮尔森相关系数

      HDC

      概述

      皮尔森相关系数(Pearson Correlation Coefficient)是衡量两个可定量的变量之间线性关系强度和方向的最常用方法。在图中,节点可由它们的N个数值属性(特征)来量化。

      皮尔森相关系数(r)的定义为两个变量X = (x1, x2, ..., xn)和Y = (y1, y2, ..., yn)之间的协方差和两者标准差乘积的比值:

      皮尔森相关系数的取值范围是[-1,1]:

      皮尔森相关系数
      关系类型
      解释
      0 < r ≤ 1 正相关 一个变量值变大,另一个变量值也会变大
      r = 0 没有线性相关性 (但可能存在其他相关性)
      -1 ≤ r < 0 负相关 一个变量值变大,另一个变量值反而会变小

      特殊说明

      • 两个节点的皮尔森相关系数理论上不依赖它们之间的连通性。

      示例图集

      创建示例图集:

      // 在空图集中逐行运行以下语句
      create().node_schema("product")
      create().node_property(@product, "price", int32).node_property(@product, "weight", int32).node_property(@product, "width", int32).node_property(@product, "height", int32)
      insert().into(@product).nodes([{_id:"product1", price:50, weight:160, width:20, height:152}, {_id:"product2", price:42, weight:90, width:30, height:90}, {_id:"product3", price:24, weight:50, width:55, height:70}, {_id:"product4", price:38, weight:20, width:32, height:66}])
      

      创建HDC图集

      将当前图集全部加载到HDC服务器hdc-server-1上,并命名为 hdc_sim_prop

      CALL hdc.graph.create("hdc-server-1", "hdc_sim_prop", {
        nodes: {"*": ["*"]},
        edges: {"*": ["*"]},
        direction: "undirected",
        load_id: true,
        update: "static",
        query: "query",
        default: false
      })
      

      hdc.graph.create("hdc_sim_prop", {
        nodes: {"*": ["*"]},
        edges: {"*": ["*"]},
        direction: "undirected",
        load_id: true,
        update: "static",
        query: "query",
        default: false
      }).to("hdc-server-1")
      

      参数

      算法名:similarity

      参数名
      类型
      规范
      默认值
      可选
      描述
      ids []_id / / 通过_id指定参与计算的第一组点;若未设置则计算所有点
      uuids []_uuid / / 通过_uuid指定参与计算的第一组点;若未设置则计算所有点
      ids2 []_id / / 通过_id指定参与计算的第二组点;若未设置则计算所有点
      uuids2 []_uuid / / 通过_uuid指定参与计算的第二组点;若未设置则计算所有点
      type String pearson cosine 指定待计算的相似度类型;计算皮尔森相关系数时,设置为pearson
      node_schema_property []"<@schema.?><property>" / / 构成向量的数值类型点属性;所有指定的属性必须属于同一个标签(schema)
      return_id_uuid String uuid, id, both uuid 在结果中使用_uuid_id或同时使用两者来表示点
      order String asc, desc / 根据similarity分值对结果排序
      limit Integer ≥-1 -1 限制返回的结果数;-1返回所有结果
      top_limit Integer ≥-1 -1 在选拔模式下,限制ids/uuids中每个节点返回的结果数;-1返回所有相似度大于0的结果。配对模式下,该参数无效

      该算法包含两种计算模式:

      1. 配对:同时配置ids/uuidsids2/uuids2时,ids/uuids中的每个节点与ids2/uuids2中的每个节点配对(自配对除外),并逐对计算相似度。
      2. 选拔:若仅配置了ids/uuids,则逐对计算其中各节点与图中所有其他节点间的相似度,返回所有或指定个数的相似度大于0的结果,并按相似度降序排列。

      文件回写

      CALL algo.similarity.write("hdc_sim_prop", {
        params: {
          return_id_uuid: "id",
          ids: "product1",
          ids2: ["product2", "product3", "product4"],
          node_schema_property: ["price", "weight", "width", "height"],
          type: "pearson"
        },
        return_params: {
          file: {
            filename: "pearson"
          }
        }
      })
      

      algo(similarity).params({
        project: "hdc_sim_prop",
        return_id_uuid: "id",
        ids: "product1",
        ids2: ["product2", "product3", "product4"],
        node_schema_property: ["price", "weight", "width", "height"],
        type: "pearson"
      }).write({
        file: {
          filename: "pearson"
        }
      })
      

      结果:

      _id1,_id2,similarity
      product1,product2,0.998785
      product1,product3,0.474384
      product1,product4,0.210494
      

      完整返回

      CALL algo.similarity("hdc_sim_prop", {
        params: {
          return_id_uuid: "id",
          ids: ["product1","product2"], 
          ids2: ["product2","product3","product4"],
          node_schema_property: ["price", "weight", "width", "height"],
          type: "pearson"
        },
        return_params: {}
      }) YIELD p
      RETURN p
      

      exec{
        algo(similarity).params({
          return_id_uuid: "id",
          ids: ["product1","product2"], 
          ids2: ["product2","product3","product4"],
          node_schema_property: ["price", "weight", "width", "height"],
          type: "pearson"
        }) as p
        return p
      } on hdc_sim_prop
      

      结果:

      _id1 _id2 similarity
      product1 product2 0.998785
      product1 product3 0.474384
      product1 product4 0.210494
      product2 product3 0.507838
      product2 product4 0.253573

      流式返回

      CALL algo.similarity("hdc_sim_prop", {
        params: {
          return_id_uuid: "id",
          ids: ["product1", "product3"], 
          node_schema_property: ["price", "weight", "width", "height"],
          type: "pearson",
          top_limit: 1    
        },
        return_params: {
          stream: {}
        }
      }) YIELD top
      RETURN top
      

      exec{
        algo(similarity).params({
          return_id_uuid: "id",
          ids: ["product1", "product3"], 
          node_schema_property: ["price", "weight", "width", "height"],
          type: "pearson",
          top_limit: 1        
        }).stream() as top
        return top
      } on hdc_sim_prop
      

      结果:

      _id1 _id2 similarity
      product1 product2 0.998785
      product3 product2 0.507838
      请完成以下信息后可下载此书
      *
      公司名称不能为空
      *
      公司邮箱必须填写
      *
      你的名字必须填写
      *
      你的电话必须填写
      *
      你的电话必须填写