-
公开(公告)号:CN110737778A
公开(公告)日:2020-01-31
申请号:CN201910831234.3
申请日:2019-09-04
Applicant: 北京邮电大学
IPC: G06F16/36 , G06F16/9535 , G06F40/295 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明公开了一种基于知识图谱和Transformer的专利推荐方法,包括以下步骤:爬取专利资源库构建知识图谱;通过图卷积网络和注意力机制的混合模型挖掘知识图谱,得到用户和专利的内容特征表示向量;通过Transformer模型挖掘用户信息,得到用户历史偏好的序列特征向量;将内容特征表示向量和序列特征向量级联结合,输入Transformer模型的Softmax层计算,得到多个候选专利被推荐的概率值;对多个概率值进行Top-k排序,得到Top-k个专利作为目标用户的推荐结果。该方法采用知识图谱丰富特征表示,采用Transformer挖掘行为序列特征,提高推荐结果的精准性和可解释性。
-
公开(公告)号:CN110457487A
公开(公告)日:2019-11-15
申请号:CN201910620962.X
申请日:2019-07-10
Applicant: 北京邮电大学
Abstract: 本发明公开了一种专利知识图谱的构建方法及装置,其中,方法包括以下步骤:从互联网爬取专利相关网站的半结构化数据;对半结构化数据进行处理,得到初始专利数据;根据初始专利数据得到每篇专利的专利属性,并根据每篇专利的专利属性IPC条件对应的IPC分类树,并构建专利知识图谱。该方法可以利用IPC分类号的优势进行知识图谱构建,并从标题与摘要中提取知识进行本体扩建与知识扩展,从而不仅有助于主题的精细化,而且可以减少了人工标注的步骤,且仅需要人工审查即可完成知识图谱的扩充,并可以获取更多细分知识。
-
公开(公告)号:CN110442676A
公开(公告)日:2019-11-12
申请号:CN201910588974.9
申请日:2019-07-02
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/332 , G06F17/27 , G06N3/04
Abstract: 本发明公开了一种基于多轮对话的专利检索方法及装置,其中,该方法包括:获取输入方的输入语句,并对输入语句进行分词生成多个分词;对多个分词进行命名实体识别处理,得到与输入语句对应的多个实体;对多个实体进行意图检测得到与输入语句对应的意图结果;获取输入方的历史对话信息,并根据历史对话信息和意图结果更新当前状态信息;获取与更新后的当前状态信息对应的执行动作,并根据执行动作生成与输入语句对应的查询请求;将查询请求输入专利知识库,得到查询结果,将查询结果加入预设模板返回给输入方。该方法利用多轮对话的方式呈现当前检索结果,辅助用户进行专利检索需求,可规范用户的需求描述,显著提高专利检索的准确率。
-
-