-
公开(公告)号:CN109241243B
公开(公告)日:2020-11-24
申请号:CN201811004434.3
申请日:2018-08-30
Applicant: 清华大学
IPC: G06F16/33 , G06F16/9535
Abstract: 本公开是关于一种候选文档排序方法及装置,该方法包括:根据当前查询会话的查询关键词,从数据库中获取与所述查询关键词匹配的第一候选文档;根据所述当前查询会话的数据以及历史查询会话的数据,确定多个训练簇中与所述当前查询会话匹配的第一训练簇;根据与所述第一训练簇对应的马尔可夫模型,对所述第一候选文档进行排序处理,获得所述第一候选文档的排序列表。本公开能够确保选择与当前查询会话的关键词和/或候选文档相关的马尔可夫模型来对候选文档进行排序,使得候选文档的排序能够更加趋向于用户的查询期望。
-
公开(公告)号:CN109460458B
公开(公告)日:2020-09-29
申请号:CN201811267746.3
申请日:2018-10-29
Applicant: 清华大学
IPC: G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本公开涉及一种查询改写意图的预测方法及装置。该查询改写意图的预测方法包括:将待识别的查询数据输入预测模型进行处理,得到所述待识别的查询数据对应的至少一个意图;其中,所述待识别的查询数据包括原始查询词和改写查询词;根据所述待识别的查询数据对应的至少一个意图,得到所述待识别的查询数据对应的查询改写意图。本公开的查询改写意图的预测方法及装置,能够有效的解决查询数据稀疏造成查询理解准确率较低的问题,从而实现准确的预测用户的查询改写意图,提高用户的使用体验。
-
公开(公告)号:CN109145213B
公开(公告)日:2020-07-28
申请号:CN201810962635.8
申请日:2018-08-22
Applicant: 清华大学
IPC: G06F16/9535 , G06F16/33
Abstract: 本公开涉及一种基于历史信息的查询推荐方法及装置,包括:响应于当前查询会话中当前查询的查询操作,获取所述当前查询会话的多个历史查询的历史查询词以及与所述多个历史查询对应的目标文档的标题信息,所述目标文档为历史查询中被浏览过的文档;根据所述目标文档的标题信息及所述历史查询词,生成与当前查询会话对应的上下文向量;获取所述当前查询的查询词相匹配的多个候选查询词;根据所述上下文向量,确定所述多个候选查询词的推荐分值;根据所述推荐分值,从所述多个候选查询词中确定所述当前查询的推荐查询词。根据本公开提供的一种基于历史信息的查询推荐方法及装置,能够提高推荐查询词的精准度。
-
公开(公告)号:CN109460458A
公开(公告)日:2019-03-12
申请号:CN201811267746.3
申请日:2018-10-29
Applicant: 清华大学
IPC: G06F16/332 , G06F16/35 , G06F16/36
Abstract: 本公开涉及一种查询改写意图的预测方法及装置。该查询改写意图的预测方法包括:将待识别的查询数据输入预测模型进行处理,得到所述待识别的查询数据对应的至少一个意图;其中,所述待识别的查询数据包括原始查询词和改写查询词;根据所述待识别的查询数据对应的至少一个意图,得到所述待识别的查询数据对应的查询改写意图。本公开的查询改写意图的预测方法及装置,能够有效的解决查询数据稀疏造成查询理解准确率较低的问题,从而实现准确的预测用户的查询改写意图,提高用户的使用体验。
-
公开(公告)号:CN109241243A
公开(公告)日:2019-01-18
申请号:CN201811004434.3
申请日:2018-08-30
Applicant: 清华大学
IPC: G06F16/33 , G06F16/9535
Abstract: 本公开是关于一种候选文档排序方法及装置,该方法包括:根据当前查询会话的查询关键词,从数据库中获取与所述查询关键词匹配的第一候选文档;根据所述当前查询会话的数据以及历史查询会话的数据,确定多个训练簇中与所述当前查询会话匹配的第一训练簇;根据与所述第一训练簇对应的马尔可夫模型,对所述第一候选文档进行排序处理,获得所述第一候选文档的排序列表。本公开能够确保选择与当前查询会话的关键词和/或候选文档相关的马尔可夫模型来对候选文档进行排序,使得候选文档的排序能够更加趋向于用户的查询期望。
-
公开(公告)号:CN105843817A
公开(公告)日:2016-08-10
申请号:CN201510020864.4
申请日:2015-01-15
Applicant: 北京三星通信技术研究有限公司 , 清华大学
IPC: G06F17/30
Abstract: 本发明实施例提供了通过终端设备进行搜索的方法、装置与设备。其中,终端设备接收用户输入的查询信息,对查询信息进行搜索,确定当前与查询信息相应的查询子话题,以及确定所述查询子话题的搜索结果;将查询子话题以标签的形式在屏幕上显示,并显示至少一个查询子话题的搜索结果。本发明提出的上述方案,向用户提供了用于细化其查询需求的途径,即用户可通过点击等简单操作,就能够对其查询需求进行更加准确的细化定位。同时,标签形式的查询子话题,也有利于提高用户的输入效率,即用户后续的搜索操作,只需通过点击标签实现搜索命令的输入。此外,当用户选择某个查询子话题时,只显示相应的搜索结果,会简化用户搜索结果的输出,提高了用户的查询体验。
-
公开(公告)号:CN109145213A
公开(公告)日:2019-01-04
申请号:CN201810962635.8
申请日:2018-08-22
Applicant: 清华大学
IPC: G06F16/9535 , G06F16/33
Abstract: 本公开涉及一种基于历史信息的查询推荐方法及装置,包括:响应于当前查询会话中当前查询的查询操作,获取所述当前查询会话的多个历史查询的历史查询词以及与所述多个历史查询对应的目标文档的标题信息,所述目标文档为历史查询中被浏览过的文档;根据所述目标文档的标题信息及所述历史查询词,生成与当前查询会话对应的上下文向量;获取所述当前查询的查询词相匹配的多个候选查询词;根据所述上下文向量,确定所述多个候选查询词的推荐分值;根据所述推荐分值,从所述多个候选查询词中确定所述当前查询的推荐查询词。根据本公开提供的一种基于历史信息的查询推荐方法及装置,能够提高推荐查询词的精准度。
-
公开(公告)号:CN109086417A
公开(公告)日:2018-12-25
申请号:CN201810885991.4
申请日:2018-08-06
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本公开涉及一种搜索评价方法及装置,所述方法包括:根据搜索结果的相关性评分和点击必要性评分,确定搜索结果被点击的概率;根据搜索结果的摘要的深度、目标页面的深度以及被点击的概率,确定搜索结果的期望浏览深度;根据搜索结果的期望浏览深度,确定搜索结果的期望浏览起始深度;根据搜索结果的期望浏览起始深度、摘要的深度、目标页面的深度、相关性评分以及浏览深度分布函数,确定搜索结果的收益;根据搜索结果的收益,确定搜索页面的评分。根据本公开的实施例的搜索评价方法及装置,在确定搜索页面的评分时,将搜索结果的摘要的深度和目标页面的深度考虑到指标的设计中,可较好地反映用户的使用体验。
-
公开(公告)号:CN103605641A
公开(公告)日:2014-02-26
申请号:CN201310557161.6
申请日:2013-11-11
Applicant: 清华大学
Abstract: 本发明提供一种汉语缩略语自动发现的方法,包括:对预置训练集上的“原语-缩略语”对进行统计,得到“原语-缩略语”的统计集合;对于统计集合中的每个“原语-缩略语”对,将“原语-缩略语”对转化成相应的缩略模式,并对于每个原语,得到其各个缩略模式对应的概率;对于缩略语未知的原语,利用对应长度的缩略模式集合,生成缩略语候选,并且为每一个候选缩略语赋以缩略模式的概率值;将每一个原语作为查询在二部图上拓展得到一个相关查询列表,相关查询列表以相似性降序排列;对于每一个通过缩略语候选,基于相关查询列表对缩略语候选进行验证,计算缩略语候选的候选分数;选取候选分数最高的缩略语候选作为原语的缩略语。
-
-
-
-
-
-
-
-