-
公开(公告)号:CN113326706B
公开(公告)日:2025-02-11
申请号:CN202110732653.9
申请日:2021-06-29
Applicant: 北京搜狗科技发展有限公司
IPC: G06F40/58 , G06F40/258 , G06F16/3332 , G06F16/335
Abstract: 本申请实施例提供了一种跨语言检索方法和装置,所述方法包括:获取用户的检索请求;所述检索请求包括第一语言的查询词;根据所述第一语言的查询词进行检索,得到第二语言的检索结果;所述检索结果包括第二语言的标题和第二语言的摘要;采用预先训练的翻译模型,基于所述第二语言的标题和所述第二语言的摘要,对所述第二语言的标题进行翻译得到第一语言的标题;以及对所述第二语言的摘要进行翻译,得到第一语言的摘要;返回所述第一语言的标题和所述第一语言的摘要。本申请实施例可以提高翻译准确率,降低出现歧义的概率,并且可以使得标题与摘要的翻译保持一致。
-
公开(公告)号:CN113343647A
公开(公告)日:2021-09-03
申请号:CN202110730117.5
申请日:2021-06-29
Applicant: 北京搜狗科技发展有限公司
IPC: G06F40/154 , G06F40/157 , G06F40/242 , G06F40/279 , G06F40/58
Abstract: 本申请实施例公开了一种句对匹配方法、装置和用于匹配句对的装置。该方法的实施例包括:从网页库内的网页中抽取包含目标语言语句的句段,以得到句段集;其中,句段集中的每个句段包括目标语言的语句以及语句的上下文;将双语数据集中的双语句对与句段集中的句段进行匹配;双语句对中包括源语言的第一语句和对应目标语言的第二语句;对于双语数据集中的每一个双语句对,确定句段集中与双语句对相匹配的句段,将网页库中与所确定的句段对应的网页确定为该双语句对的来源网页;其中,与双语句对相匹配的句段为同时包含双语句对中的第一语句与第二语句的句段。该实施方式提高了句对匹配效率。
-
公开(公告)号:CN108255939B
公开(公告)日:2020-02-14
申请号:CN201711297472.8
申请日:2017-12-08
Applicant: 北京搜狗科技发展有限公司 , 清华大学
IPC: G06F16/953 , G06F40/40
Abstract: 本发明实施例提供了一种跨语言搜索方法和装置、一种用于跨语言搜索的装置,其中的方法具体包括:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。本发明实施例可以提高翻译搜索结果的准确率、以及翻译搜索结果与目标语言搜索结果之间的一致性,且可以提高翻译搜索结果对于用户的吸引力,从而可以进一步提高翻译搜索结果的点击率。
-
公开(公告)号:CN108255939A
公开(公告)日:2018-07-06
申请号:CN201711297472.8
申请日:2017-12-08
Applicant: 北京搜狗科技发展有限公司 , 清华大学
Abstract: 本发明实施例提供了一种跨语言搜索方法和装置、一种用于跨语言搜索的装置,其中的方法具体包括:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。本发明实施例可以提高翻译搜索结果的准确率、以及翻译搜索结果与目标语言搜索结果之间的一致性,且可以提高翻译搜索结果对于用户的吸引力,从而可以进一步提高翻译搜索结果的点击率。
-
-
-