-
公开(公告)号:CN119904726A
公开(公告)日:2025-04-29
申请号:CN202510398463.6
申请日:2025-04-01
Applicant: 北京青藤科技股份有限公司
Inventor: 纪方圆
IPC: G06V10/80 , G06V10/77 , G06V10/143 , G06V10/82 , G06N3/0464 , G06N3/0455
Abstract: 本发明涉及图像优化技术领域,公开了一种基于深度特征提取的图像无损融合方法及系统,其方法包括以下步骤,收集来自不同传感器的多模态输入数据,对多模态输入数据中的每种模态进行预处理,多模态输入数据包括可见光图像、红外图像、深度图,使用多层脉冲神经元网络用于模拟生物神经元的脉冲发放特性,对多模态输入数据进行时序特征提取,捕捉不同层次的特征表示。本发明通过SNN算法进行深度特征提取进行图像融合,能够有效解决传统方法在处理红外与可见光图像时面临的特征互斥和模态冲突问题,可从具象图像转换为抽象特征,再将抽象特征转换到融合图像的端到端转换流程,满足动态场景下的实时性与保真度需求。
-
公开(公告)号:CN119625144A
公开(公告)日:2025-03-14
申请号:CN202510170228.3
申请日:2025-02-17
Applicant: 北京青藤科技股份有限公司
Inventor: 纪方圆
Abstract: 本发明涉及虚拟人生成技术领域,公开了一种虚拟人生成系统的图像处理方法及装置,其中虚拟人生成系统的图像处理方法包括:将第一对象集合和第二对象集合的对象的融合特征输入图像生成器中分别生成角色虚拟图像和场景虚拟图像;计算用户文本特征与第一对象集合和第二对象集合中的对象关联的特定的特征的语义相似度,将语义相似度最大的第一对象和第二对象所对应的角色虚拟图像和场景虚拟图像展示给用户;本发明通过设计图设计结合小说文本分析来生成代表小说角色的虚拟人图像,并且能够根据用户的交互文本来调整虚拟人图像和虚拟场景图像,将会大大提高用户的代入感。
-
公开(公告)号:CN119299746A
公开(公告)日:2025-01-10
申请号:CN202411833274.9
申请日:2024-12-13
Applicant: 北京青藤科技股份有限公司
Inventor: 纪方圆
IPC: H04N21/24 , H04N21/25 , H04N21/258 , H04N21/266 , H04N21/2187 , G06F18/2431 , G06F18/2415 , G06F18/213 , G06F18/25 , G06F16/901
Abstract: 本发明涉及人机交互技术领域,公开了一种用于大数据和人工智能的虚拟人全景直播的动态图像融合方法,包括以下步骤:采集直播数据;构建图结构数据;将图结构数据输入情感识别模型,情感识别模型输出表示粉丝情感状态的结果;将图结构数据输入响应模型,响应模型输出表示虚拟偶像互动策略的结果;将由互动策略编码获得的二号序列数据输入审核模型,审核模型输出表示虚拟偶像互动策略的安全状态的结果;本发明通过定时收集直播信息,综合考虑用户的意图与情绪状态,提供情绪改善效果好、安全性较佳的虚拟偶像的互动策略,相较于仅依据用户意图提供互动策略,该方法能够平衡多种交互目标,提高用户体验。
-
公开(公告)号:CN117935766B
公开(公告)日:2024-06-04
申请号:CN202410324909.6
申请日:2024-03-21
Applicant: 北京青藤科技股份有限公司
Inventor: 纪方圆
IPC: G10L13/027 , G10L25/03 , G10L25/15 , G10L25/21 , G10L25/30 , G10L15/02 , G10L15/04 , G06F18/213 , G06F18/214 , G06F18/23 , G06F18/241
Abstract: 本发明公开了一种AIGC模型的语音数据处理方法及系统,方法包括:对原始语音数据进行声谱动态映射处理,以匹配预设AIGC模型;将处理后的语音数据分割成多个语音样本,并提取每个语音样本的声学特征;对提取的声学特征进行熵值计算,得到熵声纹;根据所述熵声纹对语音样本进行归类,将归类后的语音样本通过所述预设AIGC模型,生成目标语音内容。利用本发明实施例,能够更全面地分析和处理语音数据,改善声学特征提取的多维性和多样性,并且能够增强AIGC模型生成语音的自然度和准确性。
-
-
-