跨语种的专利文本检索方法、装置、存储介质及设备

    公开(公告)号:CN116843515A

    公开(公告)日:2023-10-03

    申请号:CN202310626537.8

    申请日:2023-05-30

    Abstract: 本申请公开了一种跨语种的专利文本检索方法、装置、存储介质及设备,属于数据处理技术领域。所述方法包括:获取输入的第一查询文本;利用转换模型将第一查询文本转换为第二查询文本,第一查询文本是基于第一语言的文本,第二查询文本是基于第二语言的文本;利用BERT模型从分类号库中筛选与第二查询文本相似的多个IPC分类号;利用BERT模型从专利文本库中筛选与多个IPC分类号对应的多篇专利文本,专利文本是基于第二语言的文本;利用BERT模型对第二查询文本和多篇专利文本进行检索,得到检索结果。本申请可以先进行语种转换,再利用IPC分类号对专利文本进行初选,以缩小专利文本的检索范围,从而提高了检索效率。

Patent Agency Ranking