一种基于查询点的流数据簇搜索方法

    公开(公告)号:CN114510506A

    公开(公告)日:2022-05-17

    申请号:CN202210149443.1

    申请日:2022-02-18

    Applicant: 东北大学

    Abstract: 本发明提供了一种基于查询点的流数据簇搜索方法,涉及流数据聚类技术领域。该方法包括利用QALSH算法确定到达流数据点的近邻的步骤和利用近邻以扩张的方式搜索出某查询点所属簇的全部数据点的步骤。该方法针对于流数据,能够基于查询点快速且准确地搜索该查询点所属的簇,即该查询点所属簇的所有数据点。实现的过程中,那些与该查询点不属于同一个簇的数据点不会参与到簇搜索过程中,所以既能实现应用需求,又能节省计算资源。另外,在进行簇搜索的过程中,利用数据点之间的近邻关系可以确定出簇中哪些数据点距离查询点更近,哪些数据点距离查询点稍远,这样对于那些距离更近的数据点可以做优先推荐,提高推荐的合理性和实用性。

Patent Agency Ranking