一种面向在线百科的实体属性抽取方法及系统

    公开(公告)号:CN103853823B

    公开(公告)日:2017-01-18

    申请号:CN201410065743.7

    申请日:2014-02-26

    Abstract: 本发明提供一种面向在线百科的实体属性抽取方法及系统,该方法包括:在待抽取的在线百科网页文本集合T中选择一个页面,抽取该页面的实体属性表达规则,得到当前规则集合。该方法还包括使用当前规则集合对所述待抽取的在线百科网页文本集合T进行实体属性抽取,并且根据抽取得到的实体属性抽取T的实体属性表达规则,用抽取得到的规则集合作为当前规则集合并重复这一过程k次,得到最终规则集合。使用所述最终规则集合对T进行实体属性抽取。本发明提供的实体属性抽取方法能够适应文本结构的变化,适用于各种在线百科,具有召回率高并且准确率高的效果。

    一种微博流行趋势预测方法、装置及系统

    公开(公告)号:CN103258248B

    公开(公告)日:2016-12-07

    申请号:CN201310190225.3

    申请日:2013-05-21

    Abstract: 本发明提供一种微博流行趋势预测方法、装置及系统。所述方法包括:获得微博用户群体行为特征描述,所述微博用户群体行为特征描述表征用户发布微博的行为特征以及微博转发和评论中用户的行为特征。所述方法还包括:根据微博发布后第1至i-1个时间间隔的转发和评论数量,以及所述微博用户群体行为特征描述,计算所述微博在第i个时间间隔的转发和评论数量,其中i为大于1的正整数。本发明从时间维度出发,对微博用户的群体行为特征进行描述,在保证微博流行趋势预测的准确性以及效率的同时还可以在线实时进行预测。

    一种用户查询意图识别方法

    公开(公告)号:CN103268348B

    公开(公告)日:2016-08-10

    申请号:CN201310204529.0

    申请日:2013-05-28

    Abstract: 本发明提供了一种用户查询意图识别方法,包括:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。本发明识别的准确率和召回率高;时间复杂度低,给搜索引擎造成的负荷较小,能够提升用户体验;特别适合于移动端的搜素或者移动终端本地的应用搜索。

    一种用于eMule网络的文件资源信息采集方法

    公开(公告)号:CN103354554B

    公开(公告)日:2016-07-27

    申请号:CN201310204527.1

    申请日:2013-05-28

    Abstract: 本发明提供一种用于eMule网络的文件资源信息采集方法,包括下列步骤:1)初始化文件集合;2)遍历所述文件集合,对于每个文件,搜索共享过该文件的活跃客户端的地址信息,得到活跃客户端集合;3)对于活跃客户端集合中的每个活跃客户端,探测该活跃客户端所共享的文件列表;4)根据所探测的活跃客户端所共享的文件列表,更新所述文件集合,返回执行步骤2);重复执行所述步骤2)~4),得到文件索引表,该文件索引表中记录出现在所述文件集合中的每个文件及其对应的活跃客户端地址信息。本发明能够全面获取eMule网络上所有文件的索引;能够获得eMule网络中各个文件资源的活跃度信息,从而为进一步的监控提供依据。

    一种基于消息队列的消费均衡方法及系统

    公开(公告)号:CN105306552A

    公开(公告)日:2016-02-03

    申请号:CN201510641915.5

    申请日:2015-09-30

    CPC classification number: Y02D50/10 H04L67/2842 G06Q10/0631 G06Q10/06316

    Abstract: 本发明公开了一种基于消息队列的消费均衡及系统,该方法包括:排序步骤,消费者端实时依照多个消息队列的未消费消息数,对该多个消息队列进行排序;消费步骤,当消费者端所执行的任一线程需要消费消息时,均以未消费消息数最大的消息队列作为目标队列,从该目标队列中获取消息,进行消费。通过本发明的上述技术方案,不管生产者端以何种策略生产消息,或者消费者端每次是否拉取相同条数的消息,或者服务器是否发生了宕机,本发明均可以保证未消费数最大的消息队列在下一次消费的时候得到了消费,维护整个消息队列的消费均衡,不会出现某个消息队列的消息积压的现象。

    一种个性化论文推荐方法及其系统

    公开(公告)号:CN103336793B

    公开(公告)日:2015-08-12

    申请号:CN201310230933.5

    申请日:2013-06-09

    Abstract: 本发明公开了一种个性化论文推荐方法及其系统,其中该方法包括:步骤1,利用科研领域中研究人员撰写学术论文的行为特性,挖掘异质学术网络数据,根据所述异质学术网络数据构建训练数据集,并根据所述训练数据集进行训练得到排序学习模型;步骤2,在线构建用户配置,生成用户感兴趣的候选论文集,根据所述候选论文集并基于所述排序学习模型生成论文推荐结果,基于所述论文推荐结果,按照一定方式生成论文推荐返回给用户;步骤3,在线接收用户反馈,并根据不同的用户反馈行为相应地更新所述论文推荐结果。本发明有效地避免了推荐系统初期的“冷启动”问题,保证了推荐结果的准确率和召回率。

Patent Agency Ranking