-
公开(公告)号:CN119835489A
公开(公告)日:2025-04-15
申请号:CN202411833769.1
申请日:2024-12-12
Applicant: 中电信人工智能科技(北京)有限公司
Inventor: 蒋树庆
IPC: H04N21/81 , H04N21/854 , H04N21/44 , H04N21/21 , H04N21/234
Abstract: 本发明实施例提供了一种数字人视频生成方法、系统、设备及介质,应用于数字人视频生成系统,视频编辑器获取视频内容配置信息并发送给视频工厂,视频工厂将视频内容配置信息转换为视频参数并根据视频参数生成渲染任务,以及根据远程过程调用框架发送包含视频参数的视频生成请求至分布式渲染引擎,分布式渲染引擎从渲染任务队列中获取渲染任务,并根据视频生成请求对渲染任务进行处理生成对应的数字人视频。本发明实施例通过视频工厂根据视频参数生成高质量的渲染任务,并且根据远程过程调用框架快速传递和处理视频生成请求,以及通过分布式渲染引擎对渲染任务进行并行处理,实现了高效、高质量、实时的数字人视频生成。
-
公开(公告)号:CN119815135A
公开(公告)日:2025-04-11
申请号:CN202411980794.2
申请日:2024-12-31
Applicant: 北京阿派朗创造力科技有限公司
IPC: H04N21/81 , G06F40/30 , G06T11/00 , G09F9/33 , G10L15/06 , G10L15/07 , G10L15/16 , G10L15/26 , G10L25/60
Abstract: 本申请提供一种基于对话内容实时生成动态影像的方法、系统及电子设备,该方法通过获取输入的语音信号,确定该语音信号对应的交互主题、情感倾向量化值、交互时间、交互位置、交互角色以及根据该交互位置预先设置的交互任务等交互参数,然后根据该交互参数确定出与该交互参数中各项参数相匹配的视觉元素组合,基于该视觉元素组合中预先根据交互场景中的各交互参数设计的各个视觉对象单元生成会动的动态影像。将该动态影像映射至用于显示的LED阵列上,根据动态影像的像素位置控制LED阵列中对应的LED发光单元的状态变化。可实现在交互过程中围绕参与者的人机交互对话,伴随式地生成相匹配的动态影像,为参与者提供更为沉浸的交互体验。
-
公开(公告)号:CN119815134A
公开(公告)日:2025-04-11
申请号:CN202411977776.9
申请日:2024-12-30
Applicant: 北京百度网讯科技有限公司
Inventor: 刘利华
IPC: H04N21/81 , H04N21/854 , H04N21/234 , H04N23/95
Abstract: 本公开提供了一种实况图片生成方法、装置、电子设备及介质,涉及数据处理技术领域,尤其涉及图像处理、人工智能技术领域。具体实现方案为:确定待处理图片,然后从各备选图片中,确定待处理图片的相似图片,待处理图片和备选图片均为非实况图片。之后在待处理图片和相似图片之间进行插帧处理,插帧处理结果用于生成实况图片。实现了在实况图片的生成过程中,简化用户操作,并使实况图片的播放效果更流畅。
-
公开(公告)号:CN119815072A
公开(公告)日:2025-04-11
申请号:CN202411811608.2
申请日:2021-01-28
Applicant: 斯纳普公司
Inventor: 布雷德利·科措普洛斯 , 高扬
IPC: H04N21/234 , H04N21/258 , H04N21/482 , H04N21/4788 , H04N21/472 , H04N21/4786 , H04N21/431 , H04N21/45 , H04N21/845 , H04N21/262 , H04N21/81
Abstract: 本公开涉及选择要包括在按需生成的视频中的化身。方法开始于处理器使电子节目指南(EPG)显示在与第一用户相关联的第一客户端设备上。处理器检测第一用户对与媒体内容项相关联的EPG中包括的可选项的选择。处理器识别在通信平台上连接至第一用户的第二用户。处理器检索与第一用户相关联的主用户标识和与第二用户相关联的次用户标识,并且生成对媒体内容项的请求,该请求包括媒体内容标识、主用户标识和次用户标识。处理器然后接收与媒体内容项相关联的、包括媒体内容项片段的播放列表,该媒体内容项片段包括与第一用户相关联的第一化身和与第二用户相关联的第二化身。本文中公开了其他实施方式。
-
公开(公告)号:CN119814744A
公开(公告)日:2025-04-11
申请号:CN202411877973.3
申请日:2024-12-19
Applicant: 湖南麒麟信安科技股份有限公司
IPC: H04L65/75 , H04N21/4782 , H04N21/81 , G06F9/451 , H04N21/4402 , H04N21/431
Abstract: 本发明公开了一种桌面协议区域成流方法、桌面协议服务端、桌面协议系统、存储介质及计算机程序产品。其中,方法包括获取桌面协议服务端产生的多张图片数据;判断所述多张图片数据是否具有关联性以及所述多张图片数据绘制的目标区域是否具有关联性;在判断所述多张图片数据具有关联性以及所述多张图片数据绘制的目标区域也具有关联性的情况下;将所述多张图片数据绘制的目标区域的并集作为区域成流的目标区域,进行区域成流。本发明提供的方案通过判断图片关联性、图片绘制目标区域关联性来进行区域成流的判断,可以降低成流的检测时间,减少网络带宽的消耗,提高用户的使用体验。
-
公开(公告)号:CN119788931A
公开(公告)日:2025-04-08
申请号:CN202411770697.0
申请日:2024-12-04
Applicant: 天翼云科技有限公司
Inventor: 陈旭东
IPC: H04N21/81 , H04N21/431 , H04N21/434
Abstract: 本申请实施例提供了一种数据回放方法、装置和存储介质,其中数据回放方法包括:展示广告展示页面;监听所述广告展示页中的页面控件对应的页面事件;获取所述页面事件对应所述页面控件的页面变化数据与第一时间戳;获取当前所述广告展示页面对应的流量数据,所述流量数据至少包含与第一时间戳对应的第二时间戳;根据所述页面变化数据和所述第一时间戳生成页面回放数据;将所述页面回放数据和流量数据发送到回放终端,所述回放终端用于按照所述第二时间戳展示所述页面回放数据和流量数据。该方法可以实现真实全面地记录广告展示页面的变化,还原广告曝光过程,为广告流量检验提供强有力的可视化凭据。
-
公开(公告)号:CN119788907A
公开(公告)日:2025-04-08
申请号:CN202411828251.9
申请日:2024-12-12
Applicant: 西安点告网络科技有限公司
IPC: H04N21/44 , H04N21/439 , H04N21/81 , G06F18/25 , G06V40/16 , G06V10/62 , G06T7/269 , G10L15/16 , G10L15/02 , G10L15/22 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0499
Abstract: 本公开提供一种数字人合成方法、装置、电子设备及存储介质,涉及人工智能技术领域。所述方法包括:获取目标图像、驱动视频及目标音频;提取所述目标图像中的三维人脸数据和三维隐式关键点,以及所述目标音频的音频特征;基于所述三维人脸数据及所述音频特征,预测所述音频特征映射的所述三维人脸数据;获取所述驱动视频中人物的头部姿态数据,并基于所述头部姿态数据、所述三维隐式关键点及所述音频特征映射的所述三维人脸数据预测所述目标图像的运动光流;基于所述运动光流合成所述数字人的视频帧图像,以得到所述数字人播报所述目标音频的视频。本公开保证了数字人的人脸细节描述及头部摆动连续自然,提高了数字人口播视频的效果及稳定性。
-
公开(公告)号:CN119762156A
公开(公告)日:2025-04-04
申请号:CN202410923151.8
申请日:2024-07-10
Applicant: 深圳喜悦机器人有限公司
IPC: G06Q30/0241 , G06V20/40 , G06V10/26 , H04N21/234 , H04N21/458 , H04N21/81 , H04N21/2187
Abstract: 本发明公开了基于图像识别的视频中动态植入广告的方法、系统及装置,涉及视频处理技术领域,由训练后的场景识别模型对当前视频直播中的场景类型,将识别获取的视频场景及相关信息输出;将视频帧分割为若干个分割区域,在分割区域内选择广告植入的目标区域并向外部发出植入指令;使用广告推荐算法匹配出相应的目标广告,将目标广告植入目标区域,由广告推荐数据生成植入广告后的推荐系数,若推荐系数低于预期,重新匹配目标广告并植入;于各个观察周期内获取广告反馈数据并生成改善度,并对当前阶段内的广告植入频率进行约束。通过使广告与当前的直播场景及观众兴趣偏好更高的匹配性,能够获取更好的反馈。
-
公开(公告)号:CN119743656A
公开(公告)日:2025-04-01
申请号:CN202411953200.9
申请日:2024-12-27
Applicant: 中荟知(常州)科技有限公司
Inventor: 何涛
IPC: H04N21/81 , H04N21/44 , H04N21/454
Abstract: 本发明涉及广告生成技术领域,提供一种视频广告的生成方法和系统,其中,所述方法包括以下步骤:获取所述视频广告所需的视频数据、视频要求以及视频模板;判断所述视频数据是否符合广告商的要求;对所述视频数据进行滤波处理;将滤波处理后的视频数据存储至所述视频模板中;所述视频模板根据所述视频要求对滤波处理后的视频数据进行编排以形成所述视频广告。本发明能够提高视频广告的画面质量,进而提升户外视频广告的观看效果。
-
公开(公告)号:CN119743567A
公开(公告)日:2025-04-01
申请号:CN202411432329.5
申请日:2024-10-14
Applicant: 内蒙古电力(集团)有限责任公司电力营销服务与运营管理分公司
Abstract: 本发明公开了基于大模型的数字人客服通话方法及系统,所述方法包括:接收视频请求,并获取当前用户的基础信息;调度后台空闲客服,并操作视频接听;捕捉用户的视频和音频并向客服展示;捕捉客服音频,通过客服音频生成数字人视频流;向用户展示数字人视频流,实现数字人客服通话。根据本发明的技术方案,基于视频通话数据,将客服端的回答内容转换成数字人数据进行展示,有利于为用户提供一个统一的沟通环境,从而有助于提高用户粘性,同时可以响应客服人员的辅助请求,以智能获得用户所需的精确答案,并且将答案融入数字人输出中,以实现即时的视频服务。
-
-
-
-
-
-
-
-
-