-
公开(公告)号:CN114025190B
公开(公告)日:2023-06-20
申请号:CN202111295168.6
申请日:2021-11-03
Applicant: 北京达佳互联信息技术有限公司 , 清华大学深圳国际研究生院
IPC: H04N21/2187 , H04N21/2662 , G06N3/0985
Abstract: 本公开提供一种多码率调度方法和多码率调度装置。所述多码率调度方法可包括以下步骤:从当前直播流中获取当前视频块的编码信息;基于所述当前视频块的编码信息来预测用于对所述当前视频块进行转码的各个预设码率档位的输出码率;根据预测的输出码率从所述各个预设码率档位中选择码率档位;发送关于选择的码率档位的信息。本公开基于块的粒度对视频码流的实时码率进行预测,同时在预测时考虑到视频的编码信息,使得在自适应码率调度决策时更加准确地调度相应码率的视频块。
-
公开(公告)号:CN112016595A
公开(公告)日:2020-12-01
申请号:CN202010779364.X
申请日:2020-08-05
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: G06K9/62
Abstract: 本公开关于一种图像分类方法和装置、电子设备、可读存储介质。所述方法包括:获取初始待分类图像;获取所述初始待分类图像的深度热力图;所述深度热力图是指通过不同色域来表示初始待分类图像中对象的景深深度信息的图像;组合所述初始待分类图像的RGB通道图像与所述深度热力图,得到4通道的目标待分类图像;根据所述目标待分类图像,对所述初始待分类图像进行分类,以得到所述待分类图像是否为大光圈类型的图像。本实施例中通过增加包含景深深度信息的深度热力图作为待分类图像的一个维度特征,可以提升图像分类的准确度。
-
公开(公告)号:CN114119438B
公开(公告)日:2025-02-07
申请号:CN202111334867.7
申请日:2021-11-11
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种图像拼贴模型的训练方法和设备及图像拼贴方法和设备。所述训练方法包括:获取包括多个子图像的训练样本,并将所述多个子图像拼贴为一个图像,以得到初始的待调整的拼贴图像;获取当前待调整的拼贴图像的美学特征;将获取的美学特征输入所述图像拼贴模型,得到预测的需要执行的拼贴调整动作序列,对当前待调整的拼贴图像执行预测的拼贴调整动作序列,并返回执行所述获取当前待调整的拼贴图像的美学特征的步骤;当确定不继续调整拼贴图像时,根据执行各次预测的拼贴调整动作序列的奖励函数来调整所述图像拼贴模型的参数,以对所述图像拼贴模型进行训练。
-
公开(公告)号:CN113012073B
公开(公告)日:2024-11-26
申请号:CN202110357426.2
申请日:2021-04-01
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: G06T5/60 , G06N3/0464 , G06N3/084
Abstract: 本公开关于一种视频质量提升模型的训练方法和装置,方法包括:模型中的第一阶段生成器处理第一质量的视频帧来获得第一输出图像;模型中的第二阶段生成器根据第一输出图像和随机变量获得第二输出图像;根据第二质量的视频帧和第一输出图像计算第一损失函数;根据第二质量的视频帧、第二输出图像和模型中的判别器判别第二输出图像和第二质量的视频帧的结果计算第二损失函数,第一质量的视频帧是通过对第二质量的视频帧进行编码和解码后得到的,第一质量高于第二质量;根据判别器判别第二输出图像和第二质量的视频帧的结果计算第三损失函数;根据第一、第二和第三损失函数分别调整第一阶段生成器、第二阶段生成器和判别器的模型参数训练模型。
-
公开(公告)号:CN114119438A
公开(公告)日:2022-03-01
申请号:CN202111334867.7
申请日:2021-11-11
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开提供了一种图像拼贴模型的训练方法和设备及图像拼贴方法和设备。所述训练方法包括:获取包括多个子图像的训练样本,并将所述多个子图像拼贴为一个图像,以得到初始的待调整的拼贴图像;获取当前待调整的拼贴图像的美学特征;将获取的美学特征输入所述图像拼贴模型,得到预测的需要执行的拼贴调整动作序列,对当前待调整的拼贴图像执行预测的拼贴调整动作序列,并返回执行所述获取当前待调整的拼贴图像的美学特征的步骤;当确定不继续调整拼贴图像时,根据执行各次预测的拼贴调整动作序列的奖励函数来调整所述图像拼贴模型的参数,以对所述图像拼贴模型进行训练。
-
公开(公告)号:CN114025190A
公开(公告)日:2022-02-08
申请号:CN202111295168.6
申请日:2021-11-03
Applicant: 北京达佳互联信息技术有限公司 , 清华大学深圳国际研究生院
IPC: H04N21/2187 , H04N21/2662 , G06N3/08
Abstract: 本公开提供一种多码率调度方法和多码率调度装置。所述多码率调度方法可包括以下步骤:从当前直播流中获取当前视频块的编码信息;基于所述当前视频块的编码信息来预测用于对所述当前视频块进行转码的各个预设码率档位的输出码率;根据预测的输出码率从所述各个预设码率档位中选择码率档位;发送关于选择的码率档位的信息。本公开基于块的粒度对视频码流的实时码率进行预测,同时在预测时考虑到视频的编码信息,使得在自适应码率调度决策时更加准确地调度相应码率的视频块。
-
公开(公告)号:CN113012073A
公开(公告)日:2021-06-22
申请号:CN202110357426.2
申请日:2021-04-01
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
Abstract: 本公开关于一种视频质量提升模型的训练方法和装置,方法包括:模型中的第一阶段生成器处理第一质量的视频帧来获得第一输出图像;模型中的第二阶段生成器根据第一输出图像和随机变量获得第二输出图像;根据第二质量的视频帧和第一输出图像计算第一损失函数;根据第二质量的视频帧、第二输出图像和模型中的判别器判别第二输出图像和第二质量的视频帧的结果计算第二损失函数,第一质量的视频帧是通过对第二质量的视频帧进行编码和解码后得到的,第一质量高于第二质量;根据判别器判别第二输出图像和第二质量的视频帧的结果计算第三损失函数;根据第一、第二和第三损失函数分别调整第一阶段生成器、第二阶段生成器和判别器的模型参数训练模型。
-
公开(公告)号:CN110958467B
公开(公告)日:2020-12-29
申请号:CN201911149140.4
申请日:2019-11-21
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: H04N21/234 , H04N21/44 , G06K9/62 , G06N3/08
Abstract: 本公开提供一种视频质量预测方法和装置及电子设备,包括:从视频流采集包括多个视频块的视频包,根据视频流标签确定视频包的失真分类标签或非失真分类标签;根据对视频包的标注结果确定视频包的评分值;将视频包的多个视频块作为训练数据输入分类预测模型,利用分类预测模型进行分类预测和评分值预测,以输出该视频包的失真分类标签、非失真分类标签和评分值为目标进行分类预测模型的参数调整;利用参数调整结束后得到的质量预测模型,对从待质量预测的视频流中采集的视频包进行分类预测和分数预测。本公开可以解决现有的视频质量评价方法不区分均匀失真和非均匀失真的问题,对于非均匀失真的视频质量评价结果更准确。
-
公开(公告)号:CN110958467A
公开(公告)日:2020-04-03
申请号:CN201911149140.4
申请日:2019-11-21
Applicant: 清华大学 , 北京达佳互联信息技术有限公司
IPC: H04N21/234 , H04N21/44 , G06K9/62 , G06N3/08
Abstract: 本公开提供一种视频质量预测方法和装置及电子设备,包括:从视频流采集包括多个视频块的视频包,根据视频流标签确定视频包的失真分类标签或非失真分类标签;根据对视频包的标注结果确定视频包的评分值;将视频包的多个视频块作为训练数据输入分类预测模型,利用分类预测模型进行分类预测和评分值预测,以输出该视频包的失真分类标签、非失真分类标签和评分值为目标进行分类预测模型的参数调整;利用参数调整结束后得到的质量预测模型,对从待质量预测的视频流中采集的视频包进行分类预测和分数预测。本公开可以解决现有的视频质量评价方法不区分均匀失真和非均匀失真的问题,对于非均匀失真的视频质量评价结果更准确。
-
公开(公告)号:CN114208172B
公开(公告)日:2025-05-16
申请号:CN202080055525.9
申请日:2020-09-24
Applicant: 北京达佳互联信息技术有限公司
IPC: H04N19/11 , H04N19/147 , H04N19/182 , H04N19/593
Abstract: 一种电子设备执行编码和解码视频数据的方法。该方法包括:识别用于调色板模式编码的编码块;针对该编码块确定调色板表;通过对该编码块进行率失真分析来更新该调色板表,其中该编码块的率计算和失真计算被设置为使用用于该编码块的参考样本的内部编码比特深度;以及将更新了的调色板表和所述编码块的对应调色板索引图编码成比特流。
-
-
-
-
-
-
-
-
-