-
公开(公告)号:CN101226647B
公开(公告)日:2010-12-01
申请号:CN200810002739.0
申请日:2008-01-16
Applicant: 索尼株式会社
IPC: G06T17/00
CPC classification number: G06T13/40
Abstract: 本发明提供了一种图像处理设备、方法和程序以及目标函数。该图像处理设备基于通过对运动中的对象的时间连续成像而得到的多幅帧图像,使用由多个部分构成的三维(3D)人体来对所述对象的运动建模。该设备包括:用于获取成像所得的帧图像的获取装置;用于计算3D人体的关节的坐标的第一矩阵和该3D人体的每个部分的坐标的第二矩阵,并生成第一运动向量的估计装置;用于计算第二运动向量的计算装置;以及用于确定所述3D人体的确定装置。
-
公开(公告)号:CN101872616A
公开(公告)日:2010-10-27
申请号:CN200910135606.5
申请日:2009-04-22
Applicant: 索尼株式会社
Abstract: 本发明涉及一种端点检测方法以及使用该方法的系统,其使用基频提取结合子带能量的方法对语音进行检测,由于元音有基频,而基频拥有很强的语音特征,受噪声影响较小,使得元音的提取拥有很高的鲁棒性。使用子带能量在元音前后约束的范围内寻找辅音,并且子带能量的门限能够根据噪声分布变化而即时更新,使得辅音的检测受噪声影响也大大降低。因此,系统即使对于不断变化的复杂噪声也有很好的检测结果。
-
公开(公告)号:CN101833768A
公开(公告)日:2010-09-15
申请号:CN200910119520.3
申请日:2009-03-12
Applicant: 索尼株式会社
Abstract: 本申请提出一种对视频中的运动矢量进行可靠性分类的方法和系统,所述方法包括:按块分类步骤,用于对将输入视频的指定视频帧分块得到的各块进行运动矢量可靠性分类;以及按帧分类步骤,用于根据所述指定视频帧内的各块的运动矢量可靠性分类,在所述指定视频帧内进行运动矢量可靠性分类优化,以便获得所述指定视频帧内各块的运动矢量的最优分类。因此,可提高视频运动矢量可靠性分类的正确率。
-
公开(公告)号:CN101686338A
公开(公告)日:2010-03-31
申请号:CN200810169210.8
申请日:2008-09-26
Applicant: 索尼株式会社
CPC classification number: G06T7/11 , G06T7/194 , G06T2207/10016
Abstract: 本发明公开了分割视频中的前景和背景的系统和方法,其中,该系统包括:视频拍摄模块,用于拍摄视频;数据读取模块,用于读取视频的每一帧;初次分割模块,用于对每一帧的每一个像素在第一颜色空间内建立多个高斯模型,并执行当前帧的每一个像素与该像素对应的多个高斯模型的匹配处理,根据匹配处理的结果将像素初次分割为前景和背景;以及分割再判断模块,用于对经过初次分割处理的前景和背景在第二颜色空间中进行再判断处理,从而得到最终确定的前景和背景。本发明利用颜色空间的联合并引入像素之间的联系,改善了前景分割的效果。
-
-
公开(公告)号:CN101996400B
公开(公告)日:2015-09-09
申请号:CN200910166494.X
申请日:2009-08-19
IPC: G06T7/00
Abstract: 本发明公开一种更新目标检测器的方法和装置。所述目标检测器由多个子分类器组成,用于检测视频中的目标。所述方法包括:可信度判断步骤,判断所述目标检测器的可信度是否满足预定更新条件;以及更新步骤,如果所述可信度满足预定更新条件,则用新的子分类器取代所述多个子分类器中的至少一个分类能力最低的子分类器。根据本发明的更新目标检测器的方法和装置通过在检测过程中根据目标检测器的可信度来更新目标检测器中至少一个分类能力最低的子分类器,使得目标检测器能够适应视频中的目标的状态变化,从而鲁棒地检测和跟踪目标。
-
公开(公告)号:CN101686338B
公开(公告)日:2013-12-25
申请号:CN200810169210.8
申请日:2008-09-26
Applicant: 索尼株式会社
CPC classification number: G06T7/11 , G06T7/194 , G06T2207/10016
Abstract: 本发明公开了分割视频中的前景和背景的系统和方法,其中,该系统包括:视频拍摄模块,用于拍摄视频;数据读取模块,用于读取视频的每一帧;初次分割模块,用于对每一帧的每一个像素在第一颜色空间内建立多个高斯模型,并执行当前帧的每一个像素与该像素对应的多个高斯模型的匹配处理,根据匹配处理的结果将像素初次分割为前景和背景;以及分割再判断模块,用于对经过初次分割处理的前景和背景在第二颜色空间中进行再判断处理,从而得到最终确定的前景和背景。本发明利用颜色空间的联合并引入像素之间的联系,改善了前景分割的效果。
-
公开(公告)号:CN101872616B
公开(公告)日:2013-02-06
申请号:CN200910135606.5
申请日:2009-04-22
Applicant: 索尼株式会社
IPC: G10L25/18
Abstract: 本发明涉及一种端点检测方法以及使用该方法的系统,其使用基频提取结合子带能量的方法对语音进行检测,由于元音有基频,而基频拥有很强的语音特征,受噪声影响较小,使得元音的提取拥有很高的鲁棒性。使用子带能量在元音前后约束的范围内寻找辅音,并且子带能量的门限能够根据噪声分布变化而即时更新,使得辅音的检测受噪声影响也大大降低。因此,系统即使对于不断变化的复杂噪声也有很好的检测结果。
-
公开(公告)号:CN101872476A
公开(公告)日:2010-10-27
申请号:CN200910137360.5
申请日:2009-04-24
Applicant: 索尼株式会社
IPC: G06T7/00
CPC classification number: G06T7/77
Abstract: 估计图像中对象姿势视角的方法、设备。基于输入图像进行训练的设备包括:提取单元,其从具有视角类别的多个输入图像的每个输入图像中提取图像特征;映射估计单元,其针对多个视角类别中的每个视角类别,通过线性回归分析估计将从属于所述视角类别的输入图像中提取的图像特征转换为与所述输入图像相应的三维对象姿势信息的映射模型;和概率模型计算单元,其基于通过将所述图像特征与相应三维对象姿势信息连接而得到的样本,计算联合概率分布模型,其中所述联合概率分布模型所基于的单概率分布模型对应于不同视角类别,并且每个所述单概率分布模型基于包含从相应视角类别的输入图像提取的图像特征的样本。
-
公开(公告)号:CN101853389A
公开(公告)日:2010-10-06
申请号:CN200910132668.0
申请日:2009-04-01
Applicant: 索尼株式会社
IPC: G06K9/62
CPC classification number: G06K9/6257
Abstract: 本发明涉及多类目标的检测装置及其检测方法,其中检测装置包括:输入单元,被配置成输入待检测数据;联合分类器,其内部包含多个可处理多个类别目标数据的强分类器,其中,每个强分类器由一组弱分类器相加得到,每个弱分类器使用一个特征对待检测数据进行弱分类;判别单元,被配置成根据多个强分类器的分类结果,对待检测数据属于哪个类别的目标数据进行判别,所述联合分类器内部包含共享特征列表,其中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用;使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。
-
-
-
-
-
-
-
-
-