-
公开(公告)号:CN119233009B
公开(公告)日:2025-03-25
申请号:CN202411721423.2
申请日:2024-11-28
Applicant: 深圳鲲云信息科技有限公司
IPC: H04N21/433 , H04N21/443 , H04N21/426 , H04N21/81 , G06F9/445 , G06N20/00
Abstract: 本发明提供了一种基于人工智能的屏幕录制系统和电子设备,涉及屏幕录制技术领域。屏幕录制系统包括:数据处理模块,采集电子设备端的屏幕信息和音频信息,对屏幕信息和音频信息进行数据处理以得到屏幕数据和音频数据;数据存储模块,本地存储屏幕数据和音频数据,建立索引;人工智能处理模块,基于预设人工智能模型对屏幕数据和音频数据进行识别处理,根据索引响应用户查询指令;插件处理模块,响应用户指令设置自定义功能插件,以生成目标媒体管道;媒体管道处理模块,响应用户指令,基于目标媒体管道进行屏幕数据和音频数据的数据流的处理和转换。本发明具有隐私安全性较高、可扩展性强、人工智能集成性较高和对电子设备端的适配性较好的特点。
-
公开(公告)号:CN119676532A
公开(公告)日:2025-03-21
申请号:CN202411822988.X
申请日:2024-12-10
Applicant: 浙江大学
IPC: H04N21/854 , H04N21/81 , H04N21/234 , H04N21/44 , G06T5/70 , G06V10/70
Abstract: 本发明公开了一种多扩散模型融合的图像及视频定制化方法和系统,基于预训练模块、融合模块及生成模块,通过选择融合策略对多个预训练的扩散模型的权重进行融合,基于融合权重生成输出目标内容,相比于现有方法而言,该方法支持融合具有不同架构、训练过程和采样调度器的扩散模型,从而实现无需训练或架构修改即可融合扩散模型;并基于各个扩散模型的互补优势,使得生成的图像和视频在视觉真实感、身份保持和风格一致性方面具有更高质量,并且能为不同场景和用户需求提供定制化解决方案,适用于基于扩散理论的复杂现实场景的应用;本发明还提供了一种多扩散模型融合的图像及视频定制化装置,实现多扩散模型融合的图像及视频定制化方法。
-
公开(公告)号:CN119676485A
公开(公告)日:2025-03-21
申请号:CN202411936928.0
申请日:2024-12-26
Applicant: 杭州分效科技有限公司
IPC: H04N21/242 , H04N21/43 , H04N21/482 , H04N21/81
Abstract: 本发明公开了一种用于广告机节目准时播出的节目编排方法,包括如下步骤:设备连接互联网;设备进行时间校准;设备与可获取播单的服务端建立通信;从服务器获取当天24小时的播放列表1;将每个需要播出的节目段排序,获得列表2;获取设备当前时间t1;根据设备当前时间t1,依次与列表2中的时间段进行比较,当发现列表2中时间段的播放开始时间大于播放结束时间的时候,就停止查找,并记录此时间段的播放开始时间为t2;计算t2与t1的时间差d;开启一个定时任务,定时任务到达设定时间后,开始播放第一个节目;播出第一个节目以后,重复执行步骤S06到步骤S09,即可达到下一节目准点播出的效果。
-
公开(公告)号:CN119653150A
公开(公告)日:2025-03-18
申请号:CN202411550697.X
申请日:2024-11-01
Applicant: 成都维泰数智科技有限公司
IPC: H04N21/43 , H04N21/8547 , H04N21/81 , H04N21/44 , H04N21/4402 , G06V20/20 , G06V40/20 , G06V10/62 , G06V10/77 , G06T7/277
Abstract: 本申请公开了一种人物姿态数据同步方法、装置以及存储介质,用于解决数据同步过程中出现的画面不流畅和卡顿的现象。本申请方法包括:通过图形识别设备获取动画数据,所述动画数据包括人物的关节位置数据;使用PCA技术提取所述动画数据目标特征,并根据所述目标特征对所述动画数据进行压缩,以获取低维动作数据;基于时间戳的同步机制将所述低维动作数据发送给接收端,以使得当所述接收端在接收到所述低维动作数据之后,通过所述目标特征对所述低维动作数据重构还原,获得人物动作数据,并使用卡尔曼滤波算法对所述人物动作数据进行平滑处理,以得到目标动作数据。
-
公开(公告)号:CN119648295A
公开(公告)日:2025-03-18
申请号:CN202411693346.4
申请日:2024-11-25
Applicant: 江门市新会维新无纺布有限公司
Inventor: 张国新
IPC: G06Q30/0241 , G06Q30/0251 , H04N21/431 , H04N21/4402 , H04N21/81 , H04N21/2387
Abstract: 本发明涉及服装设计网上广告技术领域,且公开了一种基于用户反馈的服装设计网上广告服务平台,包括:将所有预售服装的展示视频首尾相连得到服装广告;若用户在观看服装广告时暂停,将暂停处的展示视频记为标记视频;执行增加展示策略,在用户暂停处展示图片集,所述图片集中包含多张预售服装的展示图;计算每个用户观看服装广告的平均播放倍速;执行倍速定值策略,预测用户以平均播放倍速观看服装广告时购买预售服装概率,记为预测概率;执行配套展示策略,展示预售服装的配套视频;计算用户观看服装广告的平均播放倍速,预测用户购买预售服装的概率,帮助服装商家确定预售服装的销售额,增加市场的洞察力,提高营销效果。
-
公开(公告)号:CN119316678B
公开(公告)日:2025-03-18
申请号:CN202411835274.2
申请日:2024-12-13
Applicant: 成都开心音符科技有限公司
Inventor: 肖杰
IPC: H04N21/81 , G06N3/0455 , G06N3/08 , G06N3/0475 , H04N21/43 , G10L21/055 , G10L25/30
Abstract: 本申请提供一种音频和视频生成方法、电子设备和计算机可读存储介质,该方法包括:获取目标文本,其中,目标文本包括目标文本特征;将目标文本输入预先训练完成的音视频生成扩散模型,获得音视频生成扩散模型输出的目标视频特征以及目标音频特征;对目标视频特征以及目标音频特征分别进行解码,获得目标文本对应的目标视频以及目标音频,由于音视频生成扩散模型在生成目标音频特征的扩散变换过程中将视频特征作为扩散考虑条件,音视频生成扩散模型在生成目标视频特征的时空扩散变换过程中将音频特征作为扩散考虑条件,因此,生成的目标音频特征与视频特征实现关联,使得本方案生成的目标视频和音频同步性高,进而使得音画同步性和质量更高。
-
公开(公告)号:CN117640967B
公开(公告)日:2025-03-18
申请号:CN202210999321.1
申请日:2022-08-19
Applicant: 北京字跳网络技术有限公司
IPC: H04N21/218 , H04N21/2343 , H04N21/4402 , H04N21/643 , H04N21/81 , H04N13/117 , H04N13/15 , H04N13/161 , H04N13/106 , H04N19/597 , H04L69/22
Abstract: 本公开提供了一种图像显示方法、图像处理方法、装置、设备及介质,该方法包括:接收服务器发送的二维图像集合,二维图像集合用于记录三维对象模型在多个不同视角下的二维图像;响应于对三维对象模型在目标视角下的显示指令,从二维图像集合中,解析与目标视角对应的二维目标图像;显示二维目标图像。通过上述过程,客户端能够从二维图像集合中直接确定出目标视角的二维目标图像进行显示,并且二维目标图像的复杂度与占用内存较小,因此客户端显示图像的过程不会占用过多的网络资源和内存,从而避免图像显示过程出现卡顿,最终提升了用户的观看体验。
-
公开(公告)号:CN115955586B
公开(公告)日:2025-03-18
申请号:CN202211674642.0
申请日:2022-12-26
Applicant: 湖南快乐阳光互动娱乐传媒有限公司
IPC: H04N21/41 , H04N21/4627 , H04N21/61 , H04N21/81
Abstract: 本发明提供一种插件化方法、装置及相关设备,该方法包括:当IPTV软终端检测到宿主APP处于登录状态后,建立IPTV软终端与宿主APP之间的通信;在宿主APP预先开启之后,启动IPTV业务的零配置APK;基于零配置APK,对IPTV业务进行开机认证;若认证通过,拉起IPTV业务的流程插件和EPG显示播放系统的插件;若认证未通过,向宿主APP反馈认证失败信息,使宿主APP基于认证失败信息进行认证处理。在本方案中,在宿主APP预先开启之后,对IPTV业务进行开机认证,并在认证通过后,拉起IPTV业务的流程插件和EPG显示播放系统的插件,从而减少硬件成本、提升APP加载速度以及交互体验。
-
公开(公告)号:CN119631414A
公开(公告)日:2025-03-14
申请号:CN202380057399.4
申请日:2023-07-28
Applicant: 皇家飞利浦有限公司
Inventor: T·E·阿姆托尔
IPC: H04N21/431 , H04N21/436 , H04N21/4788 , H04N21/81 , A61B8/00 , G16H30/20 , G16H30/40 , G16H40/67 , G16H50/20 , G16H80/00
Abstract: 远程专家在医学成像检查期间帮助医学成像设备的本地操作者。在可由远程专家操作的辅助器电子设备上提供用户界面(UI)。UI显示由医学成像设备的电子控制器输出的控制器视频。经由辅助器电子设备的至少一个用户输入设备接收用于更新控制器视频的图形注释。叠加有所述图形注释的控制器视频被显示在医学成像设备的控制器显示器上。在一种方法中,这需要将控制器视频拆分成多个馈送,将所述馈送中的一个馈送传输到辅助器电子设备,并且将所述馈送中的另一个馈送传输到屏幕叠加处理器,所述屏幕叠加处理器还从辅助器电子设备接收图形注释并且生成叠加有图形注释的所述控制器视频。
-
公开(公告)号:CN119629432A
公开(公告)日:2025-03-14
申请号:CN202411692359.X
申请日:2024-11-22
Applicant: 平安科技(深圳)有限公司
IPC: H04N21/81 , H04N21/854 , G06N3/0455 , G06N3/0464
Abstract: 本申请实施例提供了一种视频生成方法和装置、电子设备及存储介质,属于视频生成技术领域,适用于金融科技领域。该方法包括:获取样本视频和样本视频生成指示文本;基于预设视频生成模型、预设的时间步数据和样本视频进行自注意力噪声扩散,得到目标噪声;基于预设视频生成模型、时间步数据、样本视频生成指示文本对目标噪声进行语义融合,得到语义噪声;根据预设掩码对语义噪声进行数据拼接,得到掩码噪声;根据掩码噪声和样本视频对预设视频生成模型进行训练,得到目标视频生成模型;获取目标视频生成指示文本,根据目标视频生成模型对目标视频生成指示文本进行视频生成。本申请实施例能够基于文本生成上下连贯的视频。
-
-
-
-
-
-
-
-
-