-
公开(公告)号:CN101004914A
公开(公告)日:2007-07-25
申请号:CN200710001950.6
申请日:2007-01-17
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: G10L19/0208 , G10L19/0017 , G10L19/035
Abstract: 声音编码装置(100),具有:对于输入的声音信号施行频率变换的频率变换部(13);对于所述声音信号的每一频率成分计算重要度的频带重要度计算部(19);以该计算出来的重要度高的顺序进行平均信息量编码的平均信息量编码部(20)。平均信息量编码部(20),比较通过平均信息量编码得到的生成代码量和预先设定的目标代码量,在该生成代码量达到目标代码量之前,以重要度高的顺序进行平均信息量编码,由此,来减低声音编码中的运算量。
-
公开(公告)号:CN1277238C
公开(公告)日:2006-09-27
申请号:CN200410032960.2
申请日:2004-04-19
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: H04N1/00827 , A61B5/1172 , G06K9/00026 , G06K9/00046 , H04N1/121 , H04N1/193
Abstract: 一种指纹图像读取装置,在设于指纹读取部(20)内的透明辊(29)的外周面上绕一周附加有给定图案。由辊内部的线传感器(24)同时读取附加在辊上的图案及与辊接触的指纹图像。CPU(10)从读取到的图案部的图像中为线传感器的每个摄像元件生成修正用数据,抽出旋转检测用图像并根据其变化,判断图像取入时间。在取入指纹图像时,从所取入的指纹图像数据中检测出最大值与最小值,算出该像素值范围,针对各像素计算出表示像素值相对像素值范围之比的归一化数据以及归一化数据的平均值,根据该平均值及像素取得的像素值,例如两者之比,修正各像素的像素值。由此,能够从所取入的图像数据中排除摄像元件或透镜光学系统等的随机偏差的影响。
-
公开(公告)号:CN102737103A
公开(公告)日:2012-10-17
申请号:CN201210091591.9
申请日:2012-03-30
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
IPC: G06F17/30
CPC classification number: G06F17/30675
Abstract: 本发明提供一种检索方法和检索装置。检索装置(1)具备:提取部(101),其从多个文档数据(文档数据群300)中提取出包含多个检索字符串的文档数据;取得部(102),其在提取出的各个文档数据中取得包含全部多个检索字符串的字符串、即包含字符串;设定部(103),其对于提取出的各个文档数据,根据在该文档数据中取得的包含字符串的字符数设定输出优先度;以及输出部(104),其与所设定的输出优先度对应地输出所提取出的文档数据。
-
公开(公告)号:CN101523485B
公开(公告)日:2012-10-10
申请号:CN200780036617.7
申请日:2007-09-19
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
IPC: G10L19/02
CPC classification number: G10L19/035
Abstract: 在编码过程中,CPU(9121)将音频信号从实时域变换为频域,并将该信号变换为由多个MDCT系数组成的频谱。CPU(9121)将音频信号划分为几个频带,在每一个频带内执行比特移位,以便可以用预先配置的比特数表示MDCT系数。CPU(9121)针对各个频带以不同的精度重新量化MDCT系数,将由此获得的数值和移位比特数作为编码数据发送。同时,在解码过程中,CPU(9121)接收编码数据,逆重新量化和逆比特移位该数据,从而恢复MDCT系数。而且,CPU(9121)通过使用逆MDCT,将数据从频域变换为实时域,恢复并输出音频信号。
-
公开(公告)号:CN101123091A
公开(公告)日:2008-02-13
申请号:CN200710140237.X
申请日:2007-08-06
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: G10L19/087
Abstract: 本发明提供一种声音编码装置、声音解码装置、声音编码方法、声音解码方法、以及计算机可读取的记录媒体。在声音编码装置(111)中,带域滤波器部(133)将由预测分析部(131)生成的残差信号分解成每个带域的成分。然后,增益算出部(135)和有声无声判别以及音调提取部(137)求出带有各带域特征的强度、有声音和无声音的区别、以及有声音时的音调频率。该所求出的信息与预测系数一起被编码,并传递至声音解码装置(211)。在声音解码装置(211)中,在反映原来的残差信号的各带域的特征的同时生成激发信号。因此,该激发信号可高效地再现原来的残差信号。
-
公开(公告)号:CN104143332B
公开(公告)日:2017-10-20
申请号:CN201410189831.8
申请日:2014-05-07
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: G10L17/14
Abstract: 本发明提供一种声音处理装置以及声音处理方法。声音处理装置的特征为,具备:获取声音数据中包含的元音区间的特征量的获取单元;按照每个元音通过非监督分类法将所述获取到的特征量中与多个相同元音对应的特征量,分类为多个集群的分类单元;以及对所述多个元音从分类的集群中决定与相同说话人对应的集群组合的决定单元。
-
公开(公告)号:CN104143332A
公开(公告)日:2014-11-12
申请号:CN201410189831.8
申请日:2014-05-07
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: G10L17/14
Abstract: 本发明提供一种声音处理装置以及声音处理方法。声音处理装置的特征为,具备:获取声音数据中包含的元音区间的特征量的获取单元;按照每个元音通过非监督分类法将所述获取到的特征量中与多个相同元音对应的特征量,分类为多个集群的分类单元;以及对所述多个元音从分类的集群中决定与相同说话人对应的集群组合的决定单元。
-
公开(公告)号:CN101004914B
公开(公告)日:2011-03-16
申请号:CN200710001950.6
申请日:2007-01-17
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: G10L19/0208 , G10L19/0017 , G10L19/035
Abstract: 声音编码装置(100),具有:对于输入的声音信号施行频率变换的频率变换部(13);对于所述声音信号的每一频率成分计算重要度的频带重要度计算部(19);以该计算出来的重要度高的顺序进行平均信息量编码的平均信息量编码部(20)。平均信息量编码部(20),比较通过平均信息量编码得到的生成代码量和预先设定的目标代码量,在该生成代码量达到目标代码量之前,以重要度高的顺序进行平均信息量编码,由此,来减低声音编码中的运算量。
-
公开(公告)号:CN1866355B
公开(公告)日:2010-05-12
申请号:CN200610093719.X
申请日:2006-03-16
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
CPC classification number: G10L19/032 , G10L19/0204
Abstract: 声音编码装置(100)对所输入的声音信号通过频率变换部(1)来实施频率变换。频带分割部(2)对通过频率变换得到的频率变换系数的频带,根据人的听觉的特性,按越是低频越窄、越是高频越宽地进行分割,最大值检索部(3)对通过频带分割部(2)得到的每个频带,检索频率变换系数的绝对值的最大值。移位数计算部(4)计算移位位数,使得通过最大值检索部(3)在每个频带上得到的最大值在各频带中预先设定的量化位数以下,移位处理部(5)对每个频带对频带中的频率变换系数的值,实施通过移位数计算部(4)计算的移位位数的移位处理。并且,编码部(6)对实施了移位处理的信号以规定的编码方式来实施编码。
-
公开(公告)号:CN104900231B
公开(公告)日:2018-12-28
申请号:CN201510098118.7
申请日:2015-03-05
Applicant: 卡西欧计算机株式会社
Inventor: 井手博康
IPC: G10L15/08
Abstract: 本发明提供一种语音检索装置以及语音检索方法。在本发明的语音检索装置中,检索字符串取得部(111)取得检索字符串。变换部(112)将检索字符串变换为音素列。时间长度导出部(113)导出与检索字符串对应的语音的发言时间长度。区间指定部(114)指定作为检索对象的语音信号中的似然度取得区间。似然度取得部(118)取得表示似然度取得区间是发出与检索字符串对应的语音的区间的似然性的似然度。重复部(119)改变区间指定部(114)指定的似然度取得区间,重复进行区间指定部(114)和似然度取得部(118)的处理。确定部(124)根据针对似然度取得区间分别取得的似然度,从作为检索对象的语音信号中确定被推定为发出与检索字符串对应的语音的推定区间。
-
-
-
-
-
-
-
-
-