-
公开(公告)号:CN111832289B
公开(公告)日:2023-08-11
申请号:CN202010668037.7
申请日:2020-07-13
Applicant: 重庆大学
IPC: H04L67/51 , G06F40/216 , G06F40/289 , G06F40/30 , G06F16/35 , G06N3/084
Abstract: 本发明公开了一种基于聚类和高斯LDA的服务发现方法,包括如下步骤:对服务数据集进行数据解析,使用Doc2Vec和Word2Vec训练段落嵌入和词嵌入;使用修改的K‑Means算法将Doc2Vec向量集合聚类;基于词嵌入向量集扩展查询得到扩展的查询语句Qe和扩展的查询向量Vqe;基于扩展的查询语句计算其与聚类所得的每一个聚类簇的Doc2Vec矩阵的平均余弦相似度,将相似度最高的簇作为目标簇;基于所选目标簇和训练所得的词嵌入向量,构建高斯LDA模型,得到“文档‑主题分布”和“主题的高斯分布”;使用两个分布计算目标簇中的各个服务与扩展后的用户查询匹配的概率并降序排列。本方法服务匹配准确性高。
-
公开(公告)号:CN112800172A
公开(公告)日:2021-05-14
申请号:CN202110167463.7
申请日:2021-02-07
Applicant: 重庆大学
Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。
-
公开(公告)号:CN112328912B
公开(公告)日:2023-05-19
申请号:CN202011210800.8
申请日:2020-11-03
Applicant: 重庆大学
IPC: G06Q10/04 , G06F16/9537 , G06F16/9536 , G06F17/16 , G06N3/0499 , G06N3/08 , G06F18/214 , G06F18/27
Abstract: 本发明涉及通信技术领域,具体涉及一种利用地点感知的QoS预测方法。本发明以用户、服务以及他们的地点信息为特征作为预测模型的输入,预测模型将输入特征映射成为高维稠密向量,并利用特征重用的方式实现对QoS值的预测。该方法在网络深度较深的情况下缓解了梯度消失和特征丢失的问题,相比现有技术,在稀疏数据的情况下,能够更加准确的预测出用户调用服务的QoS值。
-
公开(公告)号:CN112800172B
公开(公告)日:2022-07-12
申请号:CN202110167463.7
申请日:2021-02-07
Applicant: 重庆大学
Abstract: 本发明公开了一种基于两阶段注意力机制的代码搜索方法,具体包括如下步骤:选取一代码片段,从代码片段中所包含的函数名和函数体中提取文本特征及结构特征;根据所提取的文本特征和结构特征构建这两种特征的特征矩阵;融合文本特征矩阵和结构特征矩阵得到本代码片段的代码特征矩阵;从查询的语句中提取相关特征构建查询特征矩阵;利用代码特征矩阵和查询特征矩阵建立代码与查询的相关矩阵;通过计算相关矩阵得到所需的向量参数,最后根据向量参数与特征矩阵得出与查询语句最匹配的代码片段。
-
公开(公告)号:CN112328912A
公开(公告)日:2021-02-05
申请号:CN202011210800.8
申请日:2020-11-03
Applicant: 重庆大学
IPC: G06F16/9537 , G06F16/9536 , G06N3/04 , G06N3/08 , G06F17/16 , G06F17/18 , G06Q10/04 , G06Q10/06 , G06Q50/30
Abstract: 本发明涉及通信技术领域,具体涉及一种利用地点感知的QoS预测方法。本发明以用户、服务以及他们的地点信息为特征作为预测模型的输入,预测模型将输入特征映射成为高维稠密向量,并利用特征重用的方式实现对QoS值的预测。该方法在网络深度较深的情况下缓解了梯度消失和特征丢失的问题,相比现有技术,在稀疏数据的情况下,能够更加准确的预测出用户调用服务的QoS值。
-
公开(公告)号:CN111488137B
公开(公告)日:2023-04-18
申请号:CN202010267172.0
申请日:2020-04-07
Applicant: 重庆大学
IPC: G06F8/20 , G06F16/903 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/047 , G06N3/084
Abstract: 本发明涉及一种基于共同注意力表征学习的代码搜索方法,包括取每个代码特征和该代码所对应的描述;分别采用三个独立的CNN神经网络嵌入方法名、词语和描述,用LSTM网络嵌入API序列得到相应的特征矩阵;然后将方法名,API序列和词语对应的特征矩阵合并为一个矩阵作为每个代码的特征矩阵;引入经神经网络学习的参数矩阵,得到用于代码和其描述的共同注意力表征;将大量相互匹配的代码和描述作为模型输入,同步更新网络参数,得到优化的模型;代码搜索预测,将相关度排在前k个的向量c所对应的代码作为推荐列表输出。该方法在MRR方面表现优异,而且本发明模型结构简单,在模型训练上的运行速度和相应速度上都很快。
-
公开(公告)号:CN111832289A
公开(公告)日:2020-10-27
申请号:CN202010668037.7
申请日:2020-07-13
Applicant: 重庆大学
IPC: G06F40/216 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于聚类和高斯LDA的服务发现方法,包括如下步骤:对服务数据集进行数据解析,使用Doc2Vec和Word2Vec训练段落嵌入和词嵌入;使用修改的K-Means算法将Doc2Vec向量集合聚类;基于词嵌入向量集扩展查询得到扩展的查询语句Qe和扩展的查询向量Vqe;基于扩展的查询语句计算其与聚类所得的每一个聚类簇的Doc2Vec矩阵的平均余弦相似度,将相似度最高的簇作为目标簇;基于所选目标簇和训练所得的词嵌入向量,构建高斯LDA模型,得到“文档-主题分布”和“主题的高斯分布”;使用两个分布计算目标簇中的各个服务与扩展后的用户查询匹配的概率并降序排列。本方法服务匹配准确性高。
-
公开(公告)号:CN111274494B
公开(公告)日:2022-09-23
申请号:CN202010062726.3
申请日:2020-01-20
Applicant: 重庆大学
IPC: G06F16/9536 , G06F16/9538 , G06F16/955 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及结合深度学习和协同过滤技术的复合标签推荐方法,包括如下步骤:从目标软件信息站点收集历史软件项目,进行预处理得到规范化描述的矩阵;建立TagDC‑DL模型和TagDC‑CF模型,将所有规范化描述的矩阵作为输入,分别得到所有标签的多标签可信度列表和基于相似度的置信概率列表,利用线性加权模块得到每个标签的最终置信概率列表;给定新的软件项目,先进行预处理再输入上述两个模型,计算新的软件项目中每个标签的最终置信概率列表,通过得到的最终置信概率列表中的概率值进行排序,概率值最大的N个标签则为推荐标签。该方法利用软件项目之间的语义相似性及其自身的深层语义特征可获得更准确的标签推荐。
-
公开(公告)号:CN111488137A
公开(公告)日:2020-08-04
申请号:CN202010267172.0
申请日:2020-04-07
Applicant: 重庆大学
IPC: G06F8/20 , G06F16/903 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于共同注意力表征学习的代码搜索方法,包括取每个代码特征和该代码所对应的描述;分别采用三个独立的CNN神经网络嵌入方法名、词语和描述,用LSTM网络嵌入API序列得到相应的特征矩阵;然后将方法名,API序列和词语对应的特征矩阵合并为一个矩阵作为每个代码的特征矩阵;引入经神经网络学习的参数矩阵,得到用于代码和其描述的共同注意力表征;将大量相互匹配的代码和描述作为模型输入,同步更新网络参数,得到优化的模型;代码搜索预测,将相关度排在前k个的向量c所对应的代码作为推荐列表输出。该方法在MRR方面表现优异,而且本发明模型结构简单,在模型训练上的运行速度和相应速度上都很快。
-
公开(公告)号:CN111274494A
公开(公告)日:2020-06-12
申请号:CN202010062726.3
申请日:2020-01-20
Applicant: 重庆大学
IPC: G06F16/9536 , G06F16/9538 , G06F16/955 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明涉及结合深度学习和协同过滤技术的复合标签推荐方法,包括如下步骤:从目标软件信息站点收集历史软件项目,进行预处理得到规范化描述的矩阵;建立TagDC-DL模型和TagDC-CF模型,将所有规范化描述的矩阵作为输入,分别得到所有标签的多标签可信度列表和基于相似度的置信概率列表,利用线性加权模块得到每个标签的最终置信概率列表;给定新的软件项目,先进行预处理再输入上述两个模型,计算新的软件项目中每个标签的最终置信概率列表,通过得到的最终置信概率列表中的概率值进行排序,概率值最大的N个标签则为推荐标签。该方法利用软件项目之间的语义相似性及其自身的深层语义特征可获得更准确的标签推荐。
-
-
-
-
-
-
-
-
-