一种面向用户生成内容的分布式采集方法与系统

    公开(公告)号:CN104735138A

    公开(公告)日:2015-06-24

    申请号:CN201510102980.0

    申请日:2015-03-09

    CPC classification number: H04L67/02 G06F17/30861

    Abstract: 本发明提供一种面向用户生成内容的分布式采集方法,包括:1)根据采集页面的采集量和采集难度划分页面类型,基于页面类型构建采集任务并将其加入采集队列;其中,所述采集任务包括复合采集任务,所述复合采集任务根据采集量和采集难度将多个同类型的采集页面划入;2)并发地从所述采集任务队列取出采集任务,执行该采集任务并返回所采集的信息。本发明还提供了相应的分布式采集系统,包括主控节点和多个子节点,主控节点用于构建并维护采集任务队列;各个所述子节点用于并发地执行采集任务。本发明的采集速度快,显著地提高了UGC新闻采集的实时性;可以适用于各种不同类型页面的采集,执行多样化的采集任务;能够规避采集对象的监控措施。

    一种基于微博平台的事件舆情信息提取方法及系统

    公开(公告)号:CN104615627A

    公开(公告)日:2015-05-13

    申请号:CN201410490602.X

    申请日:2014-09-23

    CPC classification number: G06F17/2765

    Abstract: 本发明涉及舆情事件提取技术,本发明公开了一种基于微博平台的事件舆情信息提取方法及系统,该方法包括:获取所述事件的关键词、起始时间、截止时间,并根据所述微博平台搜索服务的链接格式,构造待采样页面的页面链接;根据所述页面链接进行微博采样,生成样本微博,根据所述样本微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;根据所述微博抓取周期,结合所述页面链接,获取与所述事件相关的微博页面。提取所述微博页面的微博信息,以完成提取所述事件的所述舆情信息。本发明获取事件舆情信息更全面而高效,能采集到实时的舆情信息。

    一种基于微博信息源的新闻认证方法及系统

    公开(公告)号:CN104572807A

    公开(公告)日:2015-04-29

    申请号:CN201410594515.9

    申请日:2014-10-29

    CPC classification number: G06F17/3089 G06Q50/01

    Abstract: 本发明涉及微博新闻可信度领域,特别涉及一种基于微博信息源的新闻认证方法及系统,该方法包括:提取新闻的信息源,作为待认证信息源,获取与所述待认证信息源相对应用户的用户信息;获取所述用户的互粉比例、认证粉丝比例、粉丝数与关注数比例,并根据以上三个比例,获取所述用户的社交关系可信度值;获取所述用户的用户活跃度与历史微博平均影响力,将所述用户活跃度与所述历史微博平均影响力的乘积作为所述用户的社交行为可信度值;获取微博的评价舆情指数,同时查找所述微博的评论微博,并获取所述评论微博的评论舆情指数,将所述评价舆情指数与所述评论舆情指数作为社交评价可信度值;将以上三个可信度值进行线性加权求和作为综合可信度值。

    基于微博内容的关键词挖掘方法及系统

    公开(公告)号:CN104504024A

    公开(公告)日:2015-04-08

    申请号:CN201410768704.3

    申请日:2014-12-11

    CPC classification number: G06F17/30616

    Abstract: 本发明提供一种基于微博内容的关键词挖掘方法,对于所有微博文本经分词得到的所有词的集合中的每个词,基于该词在每个微博文本中出现的次数及该微博文本被转发的次数来计算该词的权重;并选取其权重大于预定阈值的词作为从该微博数据集中挖掘的关键词。该方法即考虑了词语在各个微博文本中出现的频率,又考虑了同一微博文本在微博数据集中转发情况对挖掘关键词的准确性的影响,因此提高了获取微博文本关键词的精确度。

    球门检测方法
    75.
    发明授权

    公开(公告)号:CN100442307C

    公开(公告)日:2008-12-10

    申请号:CN200510135214.0

    申请日:2005-12-27

    CPC classification number: G06K9/00711

    Abstract: 本发明公开了一种球门检测和基于球门检测的足球视频精彩事件检测方法。球门检测的方法步骤包括:(1)提取一帧彩色足球视频图像;(2)对视频帧图像采用草帽变换提取边缘图像;(3)在边缘图像的基础上搜索竖直方向邻域符合一定阈值的线段;(4)在上一步骤得到的线段中,采用哈夫变换选取两根最长的线段作为候选球门柱;(5)采用第二启发式规则确定上一步骤中的候选球门柱是否是球门。基于球门检测的足球视频精彩事件检测方法步骤包括:1)球门检测;2)在检测到球门的基础上,结合第一启发式规则检测足球视频中的精彩事件。本发明具有准确、快速、误检率低的优点。

    球门检测和基于球门检测的足球视频精彩事件检测方法

    公开(公告)号:CN1991864A

    公开(公告)日:2007-07-04

    申请号:CN200510135214.0

    申请日:2005-12-27

    CPC classification number: G06K9/00711

    Abstract: 本发明公开了一种球门检测和基于球门检测的足球视频精彩事件检测方法。球门检测的方法步骤包括:(1)提取一帧彩色足球视频图像;(2)对视频帧图像采用草帽变换提取边缘图像;(3)在边缘图像的基础上搜索竖直方向邻域符合一定阈值的线段;(4)在上一步骤得到的线段中,采用哈夫变换选取两根最长的线段作为候选球门柱;(5)采用第二启发式规则确定上一步骤中的候选球门柱是否是球门。基于球门检测的足球视频精彩事件检测方法步骤包括:1)球门检测;2)在检测到球门的基础上,结合第一启发式规则检测足球视频中的精彩事件。本发明具有准确、快速、误检率低的优点。

    基于扩散模型的虚拟主播全身视频生成方法及系统

    公开(公告)号:CN117979115A

    公开(公告)日:2024-05-03

    申请号:CN202410069876.5

    申请日:2024-01-17

    Abstract: 本发明提出一种基于扩散模型的虚拟主播全身视频生成方法和系统,包括:获取人物视频,每个人物视频具有对应的人物外观控制图像;构建用于生成视频的扩散模型,输入人物外观控制图像至图像编码器,得到训练外观描述;为人物视频的帧画面添加噪声数据得到含噪图像;图像去噪模型根据训练外观描述和含噪图像对应的三维人体数据,进行图像去噪,构建损失函数训练扩散网络,得到虚拟人物视频生成模型;获取人物全身姿态的多帧目标三维数据和其目标虚拟人物图像,输入目标虚拟人物图像至图像编码器,得到目标外观描述;虚拟人物视频生成模型的图像去噪模型根据目标外观描述和目标三维数据,为噪声图像降噪,得到目标虚拟人物视频。

    一种基于换脸的合成人脸修复方法、介质和电子设备

    公开(公告)号:CN116523806A

    公开(公告)日:2023-08-01

    申请号:CN202310208841.0

    申请日:2023-03-06

    Abstract: 本发明提供了一种基于换脸的合成人脸修复方法、介质和电子设备,其中,合成人脸修复模型的构建方法包括:利用合成人脸图像集训练第一自编码器进行人脸图像重构,得到经训练的第一自编码器,其中,第一自编码器包括编码器和解码器,合成人脸图像集包括目标人物说话状态的合成人脸图像;利用源人脸图像集训练第二自编码器进行人脸图像重构,得到经训练的第二自编码器,其中,第二自编码器包括编码器和解码器,源人脸图像集包括目标人物正常说话状态的人脸图像;构建用于对人脸图像进行修复的人脸修复模型,其由经训练的第一自编码器的编码器以及经训练的第二自编码器的解码器构成;以得到能够对合成人脸进行高效、高质量修复的人脸修复模型。

    图像增强方法、真伪商品鉴别方法及设备

    公开(公告)号:CN112699726B

    公开(公告)日:2023-04-07

    申请号:CN202011251301.3

    申请日:2020-11-11

    Abstract: 本发明涉及一种图像增强方法、真伪商品鉴别方法及设备。本发明的目的是提供一种图像增强方法、真伪商品鉴别方法及设备,以避免数据集有偏导致分类模型过拟合到无关因子。本发明的技术方案是:一种图像增强方法,其特征在于:S01、对于具体的图像分类任务分析其中分类无关的有偏因子,控制有偏因子对应的属性为唯一变量,摄取图像作为源域数据集;S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x’=G(x,a);S03、在目标数据集上,应用经训练的生成器G扩充样本,对于目标数据集上的每一个样本,通过遍历有偏因子对应属性所有的取值a,得到无偏的生成样本。本发明适用于计算机视觉领域。

    基于领域和样例级别迁移的跨领域虚假新闻检测方法及系统

    公开(公告)号:CN115563272A

    公开(公告)日:2023-01-03

    申请号:CN202211106105.6

    申请日:2022-09-09

    Abstract: 本发明提出一种基于领域和样例级别迁移的跨领域虚假新闻检测方法和系统,包括:获取多个源领域和一个目标领域的新闻数据,作为训练数据,基于该训练数据,通过元学习的方式训练得到泛化模型;基于该目标领域的新闻数据,执行掩码语言训练任务,训练掩码语言模型,得到用于进行迁移性度量的语言模型;在该源领域的新闻数据上计算语言模型的迁移性,根据该迁移性对该源领域的新闻数据进行加权;使用该目标领域的新闻数据和加权后的源领域的新闻数据引导该泛化模型适应目标领域,得到该目标领域的虚假新闻检测模型;通过该虚假新闻检测模型完成对该目标领域新闻的虚假检测。

Patent Agency Ranking