-
公开(公告)号:CN102073636A
公开(公告)日:2011-05-25
申请号:CN200910208955.5
申请日:2009-10-30
Applicant: 索尼株式会社 , 中国科学院声学研究所
IPC: G06F17/30
Abstract: 提供检索节目高潮的高潮检索系统和方法以及相应计算机产品。该高潮检索系统包括:滑动窗特征提取器,用于对待处理音频流加窗并提取窗内音频流片段的特征信息;模型分类器,用于在混合高斯模型上对每一个音频流片段进行打分以判断高潮片段;频谱能量分析器,用于对检索到的高潮片段和背景环境噪声进行频谱子带能量分析,并计算高潮片段的平均能量值作为频谱子带能量阈值;以及边界寻找器,对检索出的高潮片段的边界位置分别向前、向后计算子带平均能量,并寻找到所述平均能量低于所述频谱子带能量阈值的位置作为高潮片段的实际边界,以检索出整个高潮片段。
-
公开(公告)号:CN102073635A
公开(公告)日:2011-05-25
申请号:CN200910208950.2
申请日:2009-10-30
Applicant: 索尼株式会社 , 中国科学院声学研究所
IPC: G06F17/30
CPC classification number: G06F17/30743 , G06F17/30749
Abstract: 本发明涉及多媒体内容的检索,提供一种节目端点时间检测装置,通过对节目的音频信号进行处理,从而检测节目的端点时间,其包括:音频分类单元,将音频信号分类为语音信号部分和非语音信号部分;关键词检索单元,从语音信号部分检索表示节目开始或结束的端点关键词,作为候选的端点关键词;内容分析单元,对通过关键词检索单元检索出的候选的端点关键词的上下文进行内容分析,以确定候选的端点关键词是否为有效的端点关键词;节目端点时间确定单元,基于关键词检索单元的检索结果和内容分析单元的确定结果进行统计分析,确定节目的端点时间。另外,本发明还提供一种节目信息检索系统。通过本发明,可以迅速得到有关用户关注的节目的节目信息。
-
公开(公告)号:CN102024455A
公开(公告)日:2011-04-20
申请号:CN200910170552.6
申请日:2009-09-10
Applicant: 索尼株式会社
Abstract: 本发明公开了一种说话人识别系统及其方法。根据本发明的说话人识别系统包括:特征提取单元,配置为提取说话人的语音数据的特征矢量;背景模型生成单元,配置为对背景说话人的语音数据的特征矢量进行内部聚类并根据内部聚类的结果生成针对一般说话人的通用背景模型;注册说话人模型生成单元,配置为利用每一个注册说话人的语音数据的特征矢量对通用背景模型自适应,生成每一个注册说话人的注册说话人模型;度量值计算单元,配置为计算测试说话人的特征矢量在背景模型生成单元生成的通用背景模型和注册说话人模型生成单元生成的每一个注册说话人的注册说话人模型上的度量值;以及识别单元,配置为根据度量值计算单元所计算的度量值识别测试说话人。
-
公开(公告)号:CN101996326A
公开(公告)日:2011-03-30
申请号:CN200910168491.X
申请日:2009-08-26
Applicant: 索尼株式会社
IPC: G06K9/62
Abstract: 公开了多类目标的检测装置和检测方法。该检测装置包括:输入单元,用于输入待检测数据;以及至少一个用于判别预定类别的目标数据的级联分类器。级联分类器包括多个串联的级分类器,每个级分类器包括用于检测目标类别的强分类器和用于对目标类别与其它类别进行区分的强分类器。每个强分类器均由一组弱分类器相加得到,每个弱分类器使用一个特征对所述待检测数据进行弱分类。每个级分类器包括共享特征列表,在每个级分类器中,共享特征列表中的每个特征被对应的属于用于检测目标类别的强分类器的弱分类器以及对应的属于用于对目标类别与其它类别进行区分的强分类器的弱分类器所共享使用,使用同一特征的不同的弱分类器具有彼此不同的参数值。
-
公开(公告)号:CN101826150A
公开(公告)日:2010-09-08
申请号:CN200910117846.2
申请日:2009-03-06
Applicant: 索尼株式会社
Abstract: 公开了用于从输入的原始图像中检测出其中包含的头部图像的头部检测方法和设备,以及用于从输入的原始图像中检测出其中包含的头部图像并对其进行类别判断的头部检测及类别判断方法和设备。根据本发明的实施例,通过基于TGF特征的第一级头部检测快速地剔除原始图像中包含的明显不是头部图像的ROI图像,然后通过基于形状特征的第二级头部检测,从其余的ROI图像中确定出头部图像。此外,还可以根据需要对经过两级头部检测后被确定为是头部图像的ROI图像进行进一步的验证和类别判断,从而确定这些ROI图像是正面、侧面或背面头部图像,还是实际上被误检为头部图像的非头部图像。根据本发明,可以在保证低漏检率的同时提高头部检测的准确度,降低误检率。
-
公开(公告)号:CN101814145A
公开(公告)日:2010-08-25
申请号:CN200910005387.9
申请日:2009-02-24
Applicant: 索尼株式会社
IPC: G06K9/62
Abstract: 本发明公开了一种目标区分方法及目标区分装置。根据本发明的目标区分方法包括:特征提取步骤,提取目标区域内每一个目标的特征;目标差异计算步骤,计算每一个待区分目标的当前特征与特征提取步骤提取的目标区域内每一个目标的特征之间的差异;以及差异区分步骤,将目标差异计算步骤计算的每一个待区分目标的当前特征与目标区域内每一个目标的特征之间的差异作为每一个待区分目标的新特征,计算各个待区分目标的新特征之间的差异以区分各个待区分目标。
-
公开(公告)号:CN101114343A
公开(公告)日:2008-01-30
申请号:CN200710130566.6
申请日:2007-07-16
Applicant: 索尼株式会社
CPC classification number: G06K9/00711
Abstract: 本发明提供一种图像处理装置和方法以及程序,一种用于更高效率地管理并处理影像内容的影像解析技术。例如,重点提取基本上在三个层Layer1至Layer3中进行。Layer1是表示镜头间的镜头类型的时间关联性规则、即表示这种关联性规则的统计模型的层。Layer2是表示构成规定镜头的帧中具有含义的帧间的时间关联性规则的层。Layer3是通过帧内的特征量对该帧进行含义添加的层。即,表示由该Layer3添加了含义后的镜头内的各帧关联性规则的层就成为Layer2。本发明能够应用在处理影像内容的领域中。
-
公开(公告)号:CN101685538B
公开(公告)日:2014-10-22
申请号:CN200810166407.6
申请日:2008-09-26
Applicant: 索尼株式会社
Abstract: 本发明提供了一种对象跟踪方法和装置,其中,对象跟踪方法可以包括以下步骤:跟踪对象提取步骤,从输入图像中提取出作为跟踪对象的前景区域;对象初始化步骤,对于跟踪对象进行初始化处理以使跟踪对象具有在各个像素区域利用多色彩模型的分布特征;色彩评价步骤,根据多色彩模型,对在各个像素区域内的色彩信息与跟踪对象的相似性进行评价;运动评价步骤,根据相似性的评价结果,基于跟踪对象在前帧或后帧之间的运动量,计算跟踪对象的运动模型;以及对象确定步骤,基于多色彩模型和运动模型,对在前景区域内的各个像素区域进行处理以确定跟踪对象。
-
-
-
-
-
-
-