基于属性值分布的人物实体属性对齐方法及系统

    公开(公告)号:CN113361263B

    公开(公告)日:2023-10-20

    申请号:CN202110626786.8

    申请日:2021-06-04

    Abstract: 本发明属于计算机数据处理技术领域,特别涉及一种基于属性值分布的人物实体属性对齐方法及系统,通过获取不同数据来源的人物实体属性,并依据属性数据类型将人物实体属性划分为数值型属性和字符串型属性;针对数值型属性,通过核密度估计计算每个属性的属性值概率分布;针对字符串型属性,将其转化为语义向量,利用聚类算法对语义向量进行聚类来获取每个属性对应属性值概率分布;针对属性的属性值概率分布,采用双向匹配并利用交叉熵度量属性之间的相似性自动寻找存在对齐关系的属性对。本发明充分利用同一属性的属性值分布相似性特征,提高属性对齐的准确率以及召回率,自动识别存在对齐关系的属性对,具有较好的应用前景。

    基于属性值分布的人物实体属性对齐方法及系统

    公开(公告)号:CN113361263A

    公开(公告)日:2021-09-07

    申请号:CN202110626786.8

    申请日:2021-06-04

    Abstract: 本发明属于计算机数据处理技术领域,特别涉及一种基于属性值分布的人物实体属性对齐方法及系统,通过获取不同数据来源的人物实体属性,并依据属性数据类型将人物实体属性划分为数值型属性和字符串型属性;针对数值型属性,通过核密度估计计算每个属性的属性值概率分布;针对字符串型属性,将其转化为语义向量,利用聚类算法对语义向量进行聚类来获取每个属性对应属性值概率分布;针对属性的属性值概率分布,采用双向匹配并利用交叉熵度量属性之间的相似性自动寻找存在对齐关系的属性对。本发明充分利用同一属性的属性值分布相似性特征,提高属性对齐的准确率以及召回率,自动识别存在对齐关系的属性对,具有较好的应用前景。

Patent Agency Ranking