使用图像和时间跟踪神经网络进行的3D面部捕获和修改

    公开(公告)号:CN119206817A

    公开(公告)日:2024-12-27

    申请号:CN202411225463.8

    申请日:2018-06-14

    Abstract: 本公开涉及使用图像和时间跟踪神经网络进行的3D面部捕获和修改。讨论了与以下内容有关的技术:使用图像和时间跟踪神经网络捕获3D面部以及使用所捕获的3D面部修改输出视频。这样的技术包括:将第一神经网络应用于与具有人脸表示的第一视频图像相对应的输入向量以生成形变模型参数向量,将第二神经网络应用于与第一视频图像和时间上在第一视频图像之后的第二视频图像相对应的输入向量以生成形变模型参数差量向量,使用形变模型参数向量和形变模型参数差量向量来生成人脸的3D面部模型,以及使用3D面部模型生成输出视频。

    通过基于密集连接的知识提炼来训练神经网络

    公开(公告)号:CN119072695A

    公开(公告)日:2024-12-03

    申请号:CN202280094906.7

    申请日:2022-05-16

    Abstract: 可以通过知识提炼来训练神经网络。基于目标神经网络生成支持神经网络。支持神经网络是教师模型,并且目标神经网络是学生模型。支持神经网络可以具有与目标神经网络相同的层。支持神经网络的一些或所有层可以被连接来促进这些层之间的数据传送。支持神经网络和目标神经网络被合并成合并网络。合并网络被训练。支持神经网络中的至少一层连接到目标神经网络中的一层以促进训练期间从目标神经网络到支持神经网络的数据传送。在训练之后,目标神经网络被从合并网络中分离并且可以用于执行机器学习任务。

    用于图像去噪声的自适应可变形核预测网络

    公开(公告)号:CN112785486A

    公开(公告)日:2021-05-11

    申请号:CN201911081492.0

    申请日:2019-11-07

    Abstract: 本申请公开了用于图像去噪声的自适应可变形核预测网络。实施例一般地涉及用于图像去噪声的自适应可变形核预测网络。通过在计算引擎上实现的卷积神经网络对图像去噪声的方法的实施例,该图像包括多个像素,该方法包括:对于该图像的多个像素中的每一个,执行以下操作:对于该像素生成具有多个核值的卷积核;对于该像素生成多个偏移,多个偏移分别对应于多个核值,多个偏移中的每一个用于指示从该像素的像素位置的偏离量;基于该像素的像素位置和多个偏移来确定多个偏离的像素位置;以及利用该卷积核和多个偏离的像素位置的像素值来对该像素滤波,以获得去噪声的像素。

    卷积神经网络模型的分数位量化和部署

    公开(公告)号:CN119604870A

    公开(公告)日:2025-03-11

    申请号:CN202280098235.1

    申请日:2022-08-23

    Abstract: 本公开涉及CNN模型的分数位网络量化和部署。一种AI加速器,包括:输入缓冲器,被配置为缓冲输入图像;权重缓冲器,被配置为缓冲用于CNN模型的卷积层的卷积核索引;核模式缓冲器,被配置为缓冲用于CNN模型的卷积层的1位卷积核子集,其中,1位卷积核子集包括大小为K×K的2τ个1位卷积核;PE阵列,包括一个或多个PE节点,每个PE节点被配置为生成输入图像的图像区域与1位卷积核子集中对应于卷积核索引的1位卷积核的卷积结果;以及输出缓冲器,被配置为缓冲输入图像的各个图像区域与对应于卷积核索引的1位卷积核的卷积结果。

    基于动态斑块计算的多出口视觉合成网络

    公开(公告)号:CN119032382A

    公开(公告)日:2024-11-26

    申请号:CN202280094499.X

    申请日:2022-05-06

    Abstract: 本申请涉及基于动态斑块计算的多出口视觉合成网络(VSN)。提供了一种用于视觉合成的方法,并且该方法包括:将输入图像分割为多个输入斑块;利用多出口VSN的第一层至第i出口层对每个输入斑块执行合成过程以获得第i中间合成斑块,其中i是VSN的中间出口的索引并且被预定为大于或等于1的整数;基于第i中间合成斑块中的特征,预测第(i+1)中间合成斑块相对于第i中间合成斑块的增量改善;基于预测的增量改善来确定VSN的最终出口和输入斑块的最终合成斑块;并且合并多个输入斑块的相应最终合成斑块,以生成输出图像。

    用于卷积神经网络的全尺度卷积
    7.
    发明公开

    公开(公告)号:CN116420174A

    公开(公告)日:2023-07-11

    申请号:CN202080105737.3

    申请日:2020-12-23

    Abstract: 公开了用于卷积神经网络的全尺度卷积。设备的示例包括一个或多个处理器以处理数据,所述处理包括对于卷积神经网络(CNN)的处理;以及存储器以存储数据,所述数据包括CNN数据,其中由CNN进行的输入数据的处理包括在CNN的一个或多个卷积层中实现全尺度卷积,全尺度卷积到一个或多个卷积层中的卷积层中的实现至少包括在卷积层的核格的多个核中应用多个膨胀率,以及在卷积层的多个核中应用多个膨胀率的循环模式。

    具有改进的姿态跟踪的运动学交互系统

    公开(公告)号:CN115280367A

    公开(公告)日:2022-11-01

    申请号:CN202080098349.7

    申请日:2020-04-23

    Abstract: 公开了技术,用于对使用2D相机的主体提供改进的姿态跟踪,并且生成再现主体的姿态的3D图像。使用例如神经网络从主体的2D骨架图估计3D骨架图。访问或生成模板3D骨架图,其具有骨段,这些骨段具有使用例如人体测量统计基于模板3D骨架图的给定高度来设置的长度。然后通过至少重定位估计的3D骨架图的多个骨段中的一个或多个骨段,以更紧密地匹配模板3D骨架图的相应模板骨段,来产生改进的3D骨架图。然后,改进的3D骨架图可以以各种方式(例如,使用各种皮肤或图形)被动画化,以跟踪主体的相应运动。

    分辨率可切换的分割网络
    10.
    发明公开

    公开(公告)号:CN119053995A

    公开(公告)日:2024-11-29

    申请号:CN202280094893.3

    申请日:2022-05-16

    Abstract: 用于图像中对象分割的计算机模型可以用于多个输入图像尺寸,其中要跨多个图像尺寸的应用来应用共享卷积层参数。该模型还可以包括一个或多个尺寸相关层(诸如归一化层)的尺寸特定的参数。该模型可以用混合分辨率训练图像并行训练,其中训练图像被调整尺寸为多个尺寸,并且所得的预测可以基于总体预测以及从较高到较低分辨率输入图像预测的蒸馏来并行学习相应的参数。

Patent Agency Ranking