一种科技文档的聚类方法

    公开(公告)号:CN111460154A

    公开(公告)日:2020-07-28

    申请号:CN202010237966.2

    申请日:2020-03-30

    Abstract: 本申请公开了一种科技文档的聚类方法,获取科技文档的主题因子以及每个主题因子对应的权重,将N篇科技文档集合形成一个数据矩阵,利用数据矩阵,计算每两篇科技文档的相异度,得到相异矩阵,再利用K-means算法,对相异矩阵进行计算,将多篇科技文档聚类成K个聚族。本申请的科技文档的聚类方法用于对科技文档进行分类,该分类过程简单、易操作,且准确率高。对于聚类后的科技文档,可方便科研人员查阅,从而为后续科技项目的申报规划、科技成果的转化提供数据支持。

    一种科技文档的聚类方法

    公开(公告)号:CN111460154B

    公开(公告)日:2022-07-08

    申请号:CN202010237966.2

    申请日:2020-03-30

    Abstract: 本申请公开了一种科技文档的聚类方法,获取科技文档的主题因子以及每个主题因子对应的权重,将N篇科技文档集合形成一个数据矩阵,利用数据矩阵,计算每两篇科技文档的相异度,得到相异矩阵,再利用K‑means算法,对相异矩阵进行计算,将多篇科技文档聚类成K个聚族。本申请的科技文档的聚类方法用于对科技文档进行分类,该分类过程简单、易操作,且准确率高。对于聚类后的科技文档,可方便科研人员查阅,从而为后续科技项目的申报规划、科技成果的转化提供数据支持。

Patent Agency Ranking