一种基于聚类和高斯LDA的服务发现方法

    公开(公告)号:CN111832289B

    公开(公告)日:2023-08-11

    申请号:CN202010668037.7

    申请日:2020-07-13

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于聚类和高斯LDA的服务发现方法,包括如下步骤:对服务数据集进行数据解析,使用Doc2Vec和Word2Vec训练段落嵌入和词嵌入;使用修改的K‑Means算法将Doc2Vec向量集合聚类;基于词嵌入向量集扩展查询得到扩展的查询语句Qe和扩展的查询向量Vqe;基于扩展的查询语句计算其与聚类所得的每一个聚类簇的Doc2Vec矩阵的平均余弦相似度,将相似度最高的簇作为目标簇;基于所选目标簇和训练所得的词嵌入向量,构建高斯LDA模型,得到“文档‑主题分布”和“主题的高斯分布”;使用两个分布计算目标簇中的各个服务与扩展后的用户查询匹配的概率并降序排列。本方法服务匹配准确性高。

    一种基于两阶段注意力机制的代码搜索方法

    公开(公告)号:CN112800172A

    公开(公告)日:2021-05-14

    申请号:CN202110167463.7

    申请日:2021-02-07

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。

    一种基于两阶段注意力机制的代码搜索方法

    公开(公告)号:CN112800172B

    公开(公告)日:2022-07-12

    申请号:CN202110167463.7

    申请日:2021-02-07

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。

    一种基于共同注意力表征学习的代码搜索方法

    公开(公告)号:CN111488137B

    公开(公告)日:2023-04-18

    申请号:CN202010267172.0

    申请日:2020-04-07

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于共同注意力表征学习的代码搜索方法,包括取每个代码特征和该代码所对应的描述;分别采用三个独立的CNN神经网络嵌入方法名、词语和描述,用LSTM网络嵌入API序列得到相应的特征矩阵;然后将方法名,API序列和词语对应的特征矩阵合并为一个矩阵作为每个代码的特征矩阵;引入经神经网络学习的参数矩阵,得到用于代码和其描述的共同注意力表征;将大量相互匹配的代码和描述作为模型输入,同步更新网络参数,得到优化的模型;代码搜索预测,将相关度排在前k个的向量c所对应的代码作为推荐列表输出。该方法在MRR方面表现优异,而且本发明模型结构简单,在模型训练上的运行速度和相应速度上都很快。

    一种基于聚类和高斯LDA的服务发现方法

    公开(公告)号:CN111832289A

    公开(公告)日:2020-10-27

    申请号:CN202010668037.7

    申请日:2020-07-13

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于聚类和高斯LDA的服务发现方法,包括如下步骤:对服务数据集进行数据解析,使用Doc2Vec和Word2Vec训练段落嵌入和词嵌入;使用修改的K-Means算法将Doc2Vec向量集合聚类;基于词嵌入向量集扩展查询得到扩展的查询语句Qe和扩展的查询向量Vqe;基于扩展的查询语句计算其与聚类所得的每一个聚类簇的Doc2Vec矩阵的平均余弦相似度,将相似度最高的簇作为目标簇;基于所选目标簇和训练所得的词嵌入向量,构建高斯LDA模型,得到“文档-主题分布”和“主题的高斯分布”;使用两个分布计算目标簇中的各个服务与扩展后的用户查询匹配的概率并降序排列。本方法服务匹配准确性高。

    结合深度学习和协同过滤技术的复合标签推荐方法

    公开(公告)号:CN111274494B

    公开(公告)日:2022-09-23

    申请号:CN202010062726.3

    申请日:2020-01-20

    Applicant: 重庆大学

    Abstract: 本发明涉及结合深度学习和协同过滤技术的复合标签推荐方法,包括如下步骤:从目标软件信息站点收集历史软件项目,进行预处理得到规范化描述的矩阵;建立TagDC‑DL模型和TagDC‑CF模型,将所有规范化描述的矩阵作为输入,分别得到所有标签的多标签可信度列表和基于相似度的置信概率列表,利用线性加权模块得到每个标签的最终置信概率列表;给定新的软件项目,先进行预处理再输入上述两个模型,计算新的软件项目中每个标签的最终置信概率列表,通过得到的最终置信概率列表中的概率值进行排序,概率值最大的N个标签则为推荐标签。该方法利用软件项目之间的语义相似性及其自身的深层语义特征可获得更准确的标签推荐。

    一种基于共同注意力表征学习的代码搜索方法

    公开(公告)号:CN111488137A

    公开(公告)日:2020-08-04

    申请号:CN202010267172.0

    申请日:2020-04-07

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于共同注意力表征学习的代码搜索方法,包括取每个代码特征和该代码所对应的描述;分别采用三个独立的CNN神经网络嵌入方法名、词语和描述,用LSTM网络嵌入API序列得到相应的特征矩阵;然后将方法名,API序列和词语对应的特征矩阵合并为一个矩阵作为每个代码的特征矩阵;引入经神经网络学习的参数矩阵,得到用于代码和其描述的共同注意力表征;将大量相互匹配的代码和描述作为模型输入,同步更新网络参数,得到优化的模型;代码搜索预测,将相关度排在前k个的向量c所对应的代码作为推荐列表输出。该方法在MRR方面表现优异,而且本发明模型结构简单,在模型训练上的运行速度和相应速度上都很快。

    结合深度学习和协同过滤技术的复合标签推荐方法

    公开(公告)号:CN111274494A

    公开(公告)日:2020-06-12

    申请号:CN202010062726.3

    申请日:2020-01-20

    Applicant: 重庆大学

    Abstract: 本发明涉及结合深度学习和协同过滤技术的复合标签推荐方法,包括如下步骤:从目标软件信息站点收集历史软件项目,进行预处理得到规范化描述的矩阵;建立TagDC-DL模型和TagDC-CF模型,将所有规范化描述的矩阵作为输入,分别得到所有标签的多标签可信度列表和基于相似度的置信概率列表,利用线性加权模块得到每个标签的最终置信概率列表;给定新的软件项目,先进行预处理再输入上述两个模型,计算新的软件项目中每个标签的最终置信概率列表,通过得到的最终置信概率列表中的概率值进行排序,概率值最大的N个标签则为推荐标签。该方法利用软件项目之间的语义相似性及其自身的深层语义特征可获得更准确的标签推荐。

Patent Agency Ranking