一种基于偏离特征的离群点挖掘方法

    公开(公告)号:CN107562778B

    公开(公告)日:2021-09-28

    申请号:CN201710599251.X

    申请日:2017-07-21

    Abstract: 本发明公开了一种基于偏离特征的离群点挖掘方法,包括以下步骤:(1)将数据集的各个维度划分为h个等间距的间隔,则整个数据集被划分为hd个网格;(2)将每个数据点与网格索引做一个关联,如果一个网格中不包含数据点,则不考虑该网格;(3)对于划分形成的空间中的各个网格,求出网格的质心,并计算质心的局部离群因子;(4)计算每个数据对象的局部离群因子,数据集中对象的局部离群因子等于所属网格质心的离群因子。本发明在检测数据集中的离群点时,采用F_LOF检测算法将数据空间划分为网格,基于网格的质心来计算数据点的局部离群因子,降低了计算时间,提高检测效率,表现出了其优越性。

    一种基于偏离特征的离群点挖掘方法

    公开(公告)号:CN107562778A

    公开(公告)日:2018-01-09

    申请号:CN201710599251.X

    申请日:2017-07-21

    Abstract: 本发明公开了一种基于偏离特征的离群点挖掘方法,包括以下步骤:(1)将数据集的各个维度划分为h个等间距的间隔,则整个数据集被划分为hd个网格;(2)将每个数据点与网格索引做一个关联,如果一个网格中不包含数据点,则不考虑该网格;(3)对于划分形成的空间中的各个网格,求出网格的质心,并计算质心的局部离群因子;(4)计算每个数据对象的局部离群因子,数据集中对象的局部离群因子等于所属网格质心的离群因子。本发明在检测数据集中的离群点时,采用F_LOF检测算法将数据空间划分为网格,基于网格的质心来计算数据点的局部离群因子,降低了计算时间,提高检测效率,表现出了其优越性。

Patent Agency Ranking