一种面向移动新闻订阅的知识推荐方法

    公开(公告)号:CN103559269A

    公开(公告)日:2014-02-05

    申请号:CN201310538587.7

    申请日:2013-11-04

    Inventor: 赵毅强 杨佳

    CPC classification number: G06F17/3048

    Abstract: 本发明涉及一种面向移动新闻订阅的知识推荐方法,所述方法包括:(1)提取模块从知识库中依次提取知识点;(2)搜索模块从常用词词典查找知识点的名称并采用集成模块生成知识点集合存储于存储模块中;(3)更新存储模块中本体的知识点分类信息和关联关系;(4)查找模块从本体中找出新闻文档中的所有知识点名称形成集合A;(5)分析模块对集合A中的每个元素消歧形成集合B;(6)分析模块对集合B中的每个元素过滤形成推荐列表C;(7)输出模块输出推荐列表C。本发明利用众包知识库提供的知识点分类和关系信息,有效地将移动新闻订阅的背景知识推荐所要求的高实时性、高可用性、高可扩展性和高可用性融于一个轻量级的系统中。

    一种中文垂直搜索的检索串拆分方法

    公开(公告)号:CN103544309B

    公开(公告)日:2017-03-15

    申请号:CN201310538096.2

    申请日:2013-11-04

    Inventor: 赵毅强 杨红尘

    Abstract: 本发明提供了一种中文垂直搜索的检索串拆分方法,该方法通过实体词典和无监督学习方法拆分中文垂直搜索的检索串,包括以下步骤:建立实体词典和语言模型;检索串进行实体名称匹配;处理检索串中非中文字符;检索串分词;建立候选短语的权值矩阵;获得检索串所有候选短语的组合的权值;将权值最大的短语组合作为检索串的拆分结果返回。该方法克服了词典方法在处理歧义上的困难,避免了监督学习方法在人工语料标注上的开销,降低了噪声对无监督学习方法切分边界的影响。

    一种汉语新闻推荐系统

    公开(公告)号:CN105989056A

    公开(公告)日:2016-10-05

    申请号:CN201510063902.4

    申请日:2015-02-06

    Abstract: 本发明提供了一种汉语新闻推荐系统,所述系统包括用于收集数据、记录用户偏好并更新推荐模块的学习层、用于存储系统数据的数据层及用于生成新闻推荐列表的推荐层;所述推荐层包括根据用户请求返回推荐新闻列表的候选生成器及调用偏好模块对所述推荐新闻列表进行排序的聚集器。该系统可行的融合了基于内容、基于记忆和基于模型三类推荐方法的汉语新闻推荐系统,在避免了上述三种模型的缺陷的基础上,发扬了各自的优点,且并没有增加系统负担。

    一种基于串操作的数字类检索串的转换方法

    公开(公告)号:CN105989057A

    公开(公告)日:2016-10-05

    申请号:CN201510063912.8

    申请日:2015-02-06

    Abstract: 本发明提供了一种基于串操作的数字类检索串的转换方法,该方法包括以下步骤:I、接收所述检索串;II、判断所述检索串的类型;III、将汉语数字检索串转换为阿拉伯数字检索串;IV、将阿拉伯数字检索串转换为汉语数字检索串;V、对转换后的数字串优化后输出。本发明提供的使用完全基于串的汉语数字和阿拉伯数字直接相互转换算法,解决了输入串的长度受限的问题,扩展了数字检索串扩展的适用范围,并且提高了二者之间转换的效率。

    一种不依赖文档库的多搜索引擎自动化对比评测方法

    公开(公告)号:CN103544307A

    公开(公告)日:2014-01-29

    申请号:CN201310538069.5

    申请日:2013-11-04

    Inventor: 张鹏飞 赵毅强

    CPC classification number: G06F17/30861

    Abstract: 本发明提供一种不依赖文档库的多搜索引擎自动化对比评测方法,其特征在于,所述方法包括如下步骤:A.选择评测词;B.抓取搜索结果并保存为文档;C.提取文档正文;D.计算相关性;E.整合文档并按其相关性排序;F.计算DCG;G.按DCG结果进行排序,总结评测结果。通过本发明可以达到如下效果:自动化,无需人工参与,节省大量人工;快速,可短时间内获得评测结果;灵活,本发明的过程中,多处采用了可配置的模式,相关性计算等还可以自行调整,因此具有很高的灵活性;可应用于多种垂直搜索中,不只是单纯的网页搜索,也可用于新闻搜索,视频搜索等。

    一种汉语新闻摘要生成系统及方法

    公开(公告)号:CN105989058A

    公开(公告)日:2016-10-05

    申请号:CN201510063915.1

    申请日:2015-02-06

    Abstract: 本发明提供了一种汉语新闻摘要生成系统,该系统包括依次连接的前处理模块、打分模块和后处理模块;所述前处理模块接收待处理文档,所述打分模块获取前处理模块输出的句子并进行重要性打分,所述后处理模块根据打分结果确定新闻摘要。该系统以非监督的图算法为基础,以简单领域规则为辅助,能够快速阅读面向汉语新闻,自动生成新闻摘要。

    一种中文垂直搜索的检索串拆分方法

    公开(公告)号:CN103544309A

    公开(公告)日:2014-01-29

    申请号:CN201310538096.2

    申请日:2013-11-04

    Inventor: 赵毅强 杨红尘

    CPC classification number: G06F17/2785 G06F17/30684 G06F17/30861

    Abstract: 本发明提供了一种中文垂直搜索的检索串拆分方法,该方法通过实体词典和无监督学习方法拆分中文垂直搜索的检索串,包括以下步骤:建立实体词典和语言模型;检索串进行实体名称匹配;处理检索串中非中文字符;检索串分词;建立候选短语的权值矩阵;获得检索串所有候选短语的组合的权值;将权值最大的短语组合作为检索串的拆分结果返回。该方法克服了词典方法在处理歧义上的困难,避免了监督学习方法在人工语料标注上的开销,降低了噪声对无监督学习方法切分边界的影响。

Patent Agency Ranking