基于情感词典和词概率分布的情感会话生成方法

    公开(公告)号:CN109800295A

    公开(公告)日:2019-05-24

    申请号:CN201910025929.2

    申请日:2019-01-11

    Inventor: 马廷淮 杨慧敏

    Abstract: 本发明公开了一种基于情感词典和词概率分布的情感会话生成方法,包括:对生成句子中的单词进行情感词嵌入;将情感词嵌入输入到编码器-解码器框架中,利用解码器的状态计算所述生成句子中下一个单词分别对应于情感词和通用词的生成概率;根据预设的规则将情感词和通用词的生成概率进行连接,建立会话模型,得到生成句子中的下一个单词;计算输入句子和生成句子中已生成部分的情感相似度,采用情感损失函数对会话模型进行训练,以使生成的句子与输入句子的情感偏差小于设定偏差阈值。本发明提出一种在生成句子时考虑情感的方法,平衡了生成句子时的语法通顺性和情感表达,提高了会话生成的效率和满意度。

    一种云环境下模块化并行作业的动态节能调度方法

    公开(公告)号:CN108829500A

    公开(公告)日:2018-11-16

    申请号:CN201810419583.X

    申请日:2018-05-04

    CPC classification number: G06F9/4806 G06F9/5083 G06F9/5094

    Abstract: 本发明公开了一种云环境下模块化并行作业的动态节能调度方法,包括以下步骤:(1)根据系统日志,计算系统平均负载及作业平均并行度;(2)根据系统的平均负载,寻找资源的参考工作状态,包括计算资源的工作频率与工作电压;(3)假设资源工作在参考工作状态下,且作业的并行度为平均并行度,计算此时作业的能耗及工作量;(4)与步骤(3)得到的结果进行对比,寻找可能比步骤(3)更小能耗的调度方法,若有更新调度方法,若没有则采取步骤(3)的方法。本发明不需要知道作业的内部结构,控制简单,首先从全局计算能耗,使能耗处于较低的水平,通过节省资源,实现作业的动态调度。

    基于FrankCopula函数的主题相关性建模方法

    公开(公告)号:CN108629009A

    公开(公告)日:2018-10-09

    申请号:CN201810424875.2

    申请日:2018-05-04

    Abstract: 基于FrankCopula函数的主题相关性建模方法,包括如下步骤:随机初始化参数并选取超参数;根据初始化参数和超参数,使用LDA模型生成第一篇文档的主题分布和主题词分布;根据第一篇文档的主题分布和主题词分布,结合Copula函数计算每一篇文档的主题分布和主题词分布;根据计算的主题分布和主题词分布,对每篇文档的主题和主题词排序,根据概率大小选取文档的主题和主题词输出。本发明针对目前LDA模型中文档-主题分布不考虑连续文档间的互相影响的问题,引入Frank Copula工具来生成连续文档的主题相关性模型,考虑了前一篇对后一篇文档的主题分布的影响,提高了主题模型的准确度。

    基于宝藏图的链接与内容结合的聚焦网络爬虫搜索方法

    公开(公告)号:CN107908773A

    公开(公告)日:2018-04-13

    申请号:CN201711241370.4

    申请日:2017-11-30

    CPC classification number: G06F17/30867 G06F17/30887

    Abstract: 本发明提供基于宝藏图的链接与内容结合的聚焦网络爬虫搜索方法。聚焦网络爬虫的两个重要任务是:1.在网页上找到有关特定主题的文档;2.对这些网页进行分析并根据其与搜索主题的相关度进行排序。对于第一个任务,本发明提出了一种基于杜威十进制分类理论的算法来获取和分析页面中最有效的HTML结构元素,以及每个未访问链接的主题边界和锚文本。基于此,对未访问页面的主题的预测或发掘就可以获得较高准确率。此算法结合了基于链接和基于内容的方法。对于第二个任务,本发明制作“宝藏图”来实现对相关URL的优先级计算功能,借此做到优先处理那些可能存在更多与搜索目标相关的信息的未访问页面。本发明能充分挖掘网络中的有用信息,提高了聚焦爬虫的运行效率和爬取能力。

    一种基于局部敏感哈希改进算法的相似性数据检索方法

    公开(公告)号:CN104035949B

    公开(公告)日:2017-05-10

    申请号:CN201310664350.3

    申请日:2013-12-10

    Abstract: 本发明提供一种基于局部敏感哈希改进算法的相似性数据检索方法,首先对数据对象进行特征提取,将每一个数据对象使用其特征集合表示,基于向量空间模型把每一个数据对象转换为特征空间的向量;然后使用一组哈希函数,建立多个哈希表,将所有的数据对象映射到相应的哈希桶中;接着对于查询对象,随机选择一个哈希表进行映射,对于与查询对象在同一哈希桶的数据对象,以同样方式利用剩余的哈希表进行映射,并将所有与这些对象在同一哈希桶中的对象合并成为查询候选集;最后将查询对象与查询候选集中的数据对象进行真实距离的计算,从而得到最邻近对象。本发明在保持准确率和召回率的前提下减少了传统局部敏感哈希的内存需求,适合于处理大量的高维数据的相似性检索。

    一种社会网络数据敏感属性隐私保护方法

    公开(公告)号:CN103685271B

    公开(公告)日:2017-01-11

    申请号:CN201310683002.0

    申请日:2013-12-13

    Abstract: 本发明涉及一种社会网络数据敏感属性隐私保护方法,基于L-多样性原理,通过在社会网络数据结构中增加新网络数据节点,以及建立候选网络数据节点与新网络数据节点之间的联系,实现对网络数据的保护,该方法较好的避免了现有技术在针对网络数据实现保护的同时,对网络数据造成巨大影响的缺点;相对于现有保护方法,能够在对社会网络数据结构中网络数据可用性产生最小影响的条件下达到隐私保护的目的。

    一种基于自适应多最小支持度的关联规则推荐方法

    公开(公告)号:CN103700005B

    公开(公告)日:2016-08-31

    申请号:CN201310688735.3

    申请日:2013-12-17

    Abstract: 本发明公开了一种基于自适应多最小支持度的关联规则推荐方法,首先根据商品分类建立商品分类层次树,并根据分类层次树对具体商品进行归类;接下来分别为每个具体商品和具体商品层上一层的类别进行最小支持度阈值设置,阈值设置涉及时间因素、具体商品价格因素以及具体商品品牌因素的影响,在支持度阈值设定基础上,再利用多最小支持度关联规则扩展算法挖掘频繁项集和产生规则;最后采用Top?N推荐方法为每位用户生成推荐。本发明在为用户做个性化推荐时,考虑了多种因素对具体商品和类别的多最小支持度阈值设定的影响,能较好的体现不同物品的特征,同时缓解了推荐系统中数据稀疏性问题和冷启动问题,能更加准确的为用户进行个性化推荐。

    基于位置指纹识别算法的安卓设备WiFi室内定位方法

    公开(公告)号:CN103200678B

    公开(公告)日:2016-01-13

    申请号:CN201310120751.2

    申请日:2013-04-09

    Abstract: 针对终端接收机在楼群密集的城市或者室内工作的时候,由于信号强度受到建筑物的影响而大大衰减,导致定位精度低甚至不能够完成定位的问题,本发明公开了一种基于位置指纹识别算法的安卓(Android)设备端WiFi室内定位方法,在传统指纹识别算法的基础上采用KNN匹配算法和基于权重的坐标计算方法获得待测点位置,有效降低了信号波动带来的误差,能够精确定位终端接收机位置,且反应迅速。相对于传统的室内定位方法,本发明能在环境复杂的情况下较为精确地定位请求者位置,反应迅速,高效精准,特别适合Android设备端室内位置定位。

Patent Agency Ranking