-
公开(公告)号:CN119948488A
公开(公告)日:2025-05-06
申请号:CN202380067551.7
申请日:2023-09-01
Applicant: 高通股份有限公司
Abstract: 一种处理器实现的方法包括:经由与机器人设备相关联的一个或多个传感器来观察环境。该处理器实现的方法还包括:经由推理模型基于与该机器人设备在该环境中的先验动作相关联的数据来生成对该环境的信念。该处理器实现的方法还包括:基于生成该信念来控制该机器人设备在该环境中执行动作。
-
公开(公告)号:CN117980916A
公开(公告)日:2024-05-03
申请号:CN202280063767.1
申请日:2022-09-15
Applicant: 高通股份有限公司
IPC: G06N3/0455 , H04N19/59 , H04N19/51 , H04N19/91
Abstract: 本文描述了用于使用神经网络系统来处理媒体数据的系统和技术。例如,过程可包括:获得经编码图像数据帧的潜在表示;以及通过解码器子网络的多个解码器变换器层使用该经编码图像数据帧的该潜在表示作为输入来生成经解码图像数据帧。该多个解码器变换器层中的至少一个解码器变换器层包括:一个或多个变换器块,该一个或多个变换器块用于生成一个或多个特征补丁并且在应用于该一个或多个补丁上的一个或多个窗口分区和移位窗口分区内局部地确定自注意力;和补丁去合并引擎,该补丁去合并引擎用于减小该一个或多个补丁中的每个补丁的相应大小。
-
公开(公告)号:CN113574883A
公开(公告)日:2021-10-29
申请号:CN202080020806.0
申请日:2020-03-23
Applicant: 高通股份有限公司
IPC: H04N19/13 , G06N3/08 , H04N19/20 , H04N19/136 , H04N19/90 , H04N19/186
Abstract: 本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括:接收供压缩的视频内容。所接收的视频内容一般通过可由第一人工神经网络实现的编码器被编码到隐性码空间中。经编码视频内容的经压缩版本一般通过可由第二人工神经网络实现的经训练概率性模型来生成并输出以供传输。
-
公开(公告)号:CN116982311B
公开(公告)日:2024-09-06
申请号:CN202280020968.3
申请日:2022-02-18
Applicant: 高通股份有限公司
IPC: H04N19/00
Abstract: 描述了基于应用可变尺度扭曲的运动估计对数据进行编码和/或解码的系统和技术。编码设备可以接收输入帧和参考帧,其描述不同时间的场景。编码设备可以生成光流,该光流识别两个帧之间的场景中的移动。编码设备可以生成加权图,该加权图识别参考帧在输入帧预测时所进行的扭曲是如何精细或粗糙。编码设备可以基于光流和加权图生成经编码的视频数据。解码设备可以从经编码的数据生成经重构的光流和经重构的加权图。解码设备可以通过基于经重构的光流和经重构的加权图对参考帧进行扭曲,而生成预测帧。解码设备可以基于预测帧生成经重构的输入帧。
-
公开(公告)号:CN113574883B
公开(公告)日:2024-08-27
申请号:CN202080020806.0
申请日:2020-03-23
Applicant: 高通股份有限公司
IPC: H04N19/13 , G06N3/09 , H04N19/20 , H04N19/136 , H04N19/90 , H04N19/186 , G06N3/045
Abstract: 本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括:接收供压缩的视频内容。所接收的视频内容一般通过可由第一人工神经网络实现的编码器被编码到隐性码空间中。经编码视频内容的经压缩版本一般通过可由第二人工神经网络实现的经训练概率性模型来生成并输出以供传输。
-
公开(公告)号:CN118488200A
公开(公告)日:2024-08-13
申请号:CN202410589230.X
申请日:2020-03-19
Applicant: 高通股份有限公司
IPC: H04N19/13 , G06N3/09 , H04N19/136 , H04N19/90
Abstract: 公开了使用深度生成性模型的视频压缩。本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括接收用于压缩的视频内容。一般通过自编码器将所接收的视频内容编码到隐代码空间中,该自编码器可由第一人工神经网络来实现。一般通过经训练的概率模型(经训练的概率模型可由第二人工神经网络实现)来生成经编码视频内容的经压缩版本,并且输出以供传输。
-
公开(公告)号:CN113574882B
公开(公告)日:2024-05-31
申请号:CN202080020726.5
申请日:2020-03-19
Applicant: 高通股份有限公司
IPC: H04N19/13 , G06N3/09 , H04N19/136 , H04N19/90
Abstract: 本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括接收用于压缩的视频内容。一般通过自编码器将所接收的视频内容编码到隐代码空间中,该自编码器可由第一人工神经网络来实现。一般通过经训练的概率模型(经训练的概率模型可由第二人工神经网络实现)来生成经编码视频内容的经压缩版本,并且输出以供传输。
-
公开(公告)号:CN118451704A
公开(公告)日:2024-08-06
申请号:CN202280077869.9
申请日:2022-10-28
Applicant: 高通股份有限公司
IPC: H04N19/105 , H04N19/136 , H04N19/172 , H04N19/537
Abstract: 一种用于使用人工神经网络(ANN)进行视频压缩的处理器实现的方法包括经由该ANN接收视频。该ANN提取该视频的当前帧的第一组特征和该视频的参考帧的第二组特征。该ANN确定该当前帧的该第一组特征和该参考帧的该第二组特征之间的相关特征的估计。对相关特征的该估计进行编码并且将其发射到接收器。
-
公开(公告)号:CN117716687A
公开(公告)日:2024-03-15
申请号:CN202280035149.6
申请日:2022-03-31
Applicant: 高通股份有限公司
IPC: H04N19/103 , H04N19/172 , H04N19/463 , H04N19/537 , H04N19/146 , H04N19/124 , G06N3/045 , G06N3/084
Abstract: 描述了用于使用机器学习系统来对数据进行压缩和解压缩的技术。示例过程可包括接收用于由神经网络压缩系统进行压缩的多个图像。该过程可包括基于来自该多个图像中的第一图像来确定与该神经网络压缩系统的第一模型相关联的第一多个权重值。该过程可包括生成包括第一多个权重值的经压缩版本的第一比特流。该过程可包括输出第一比特流以供传输至接收方。
-
公开(公告)号:CN116982311A
公开(公告)日:2023-10-31
申请号:CN202280020968.3
申请日:2022-02-18
Applicant: 高通股份有限公司
IPC: H04N19/00
Abstract: 描述了基于应用可变尺度扭曲的运动估计对数据进行编码和/或解码的系统和技术。编码设备可以接收输入帧和参考帧,其描述不同时间的场景。编码设备可以生成光流,该光流识别两个帧之间的场景中的移动。编码设备可以生成加权图,该加权图识别参考帧在输入帧预测时所进行的扭曲是如何精细或粗糙。编码设备可以基于光流和加权图生成经编码的视频数据。解码设备可以从经编码的数据生成经重构的光流和经重构的加权图。解码设备可以通过基于经重构的光流和经重构的加权图对参考帧进行扭曲,而生成预测帧。解码设备可以基于预测帧生成经重构的输入帧。
-
-
-
-
-
-
-
-
-