-
公开(公告)号:DE112017006049T5
公开(公告)日:2019-09-12
申请号:DE112017006049
申请日:2017-12-15
Applicant: IBM
Inventor: ICHIKAWA OSAMU , FUKUDA TAKASHI , RAMABHADRAN BHUVANA
Abstract: Bereitgestellt werden ein durch einen Computer realisiertes Verfahren und eine Vorrichtung. Das Verfahren beinhaltet ein Erhalten eines Frequenzspektrums von Audiosignaldaten durch einen Prozessor. Das Verfahren beinhaltet des Weiteren ein Extrahieren von periodischen Anzeichen aus dem Frequenzspektrum durch den Prozessor. Das Verfahren beinhaltet außerdem ein Eingeben der periodischen Anzeichen und Komponenten des Frequenzspektrums in ein neuronales Netz durch den Prozessor. Das Verfahren beinhaltet zusätzlich ein Schätzen von Klangidentifizierungsinformationen aus dem neuronalen Netz durch den Prozessor.
-
公开(公告)号:DE112010003461T5
公开(公告)日:2012-07-26
申请号:DE112010003461
申请日:2010-07-12
Applicant: IBM
Inventor: FUKUDA TAKASHI , ICHIKAWA OSAMU , NISHIMURA MASAFUMI
Abstract: Eine Technik zum Extrahieren von Merkmalen, die in Bezug auf Störsignale, Mehrfachreflexion und dergleichen robuster sind, wird bereitgestellt. Eine Vorrichtung zur Extraktion von Sprachmerkmalen enthält Differenzberechnungsmittel zum Empfangen eines Spektrums eines Sprachsignals, das in Rahmen segmentiert ist, als eine Eingabe, und zum Berechnen einer Differenz des Spektrums zwischen fortlaufenden Rahmen (eine Differenz in dem linearen Bereich) für jeden Rahmen als ein Delta-Spektrum und Normierungsmittel zum Ausführen einer Normierung des Delta-Spektrums für den Rahmen durch Dividieren des Delta-Spektrums durch eine Funktion eines mittleren Spektrums. Eine Ausgabe der Normierungsmittel ist als ein Delta-Merkmal definiert.
-
公开(公告)号:GB2485926A
公开(公告)日:2012-05-30
申请号:GB201202741
申请日:2010-07-12
Applicant: IBM
Inventor: FUKUDA TAKASHI , ICHIKAWA OSAMU , NISHIMURA MASAFUMI
Abstract: This invention provides a technique for extracting, from audio signals, features that are stronger due to noises and/or reverberations. An audio feature extracting apparatus comprises: difference calculating means operative to receive the spectra of framed audio signals to calculate, as a delta spectrum, the difference in spectrum between each frame and each of the respective preceding and following frames (the difference in linear region); and normalizing means operative to divide the delta spectrum by an average-spectrum function, thereby normalizing the delta spectrum for each frame. The outputs of the normalizing means are used as delta features.
-
公开(公告)号:DE112018006438T5
公开(公告)日:2020-09-03
申请号:DE112018006438
申请日:2018-12-12
Applicant: IBM
Inventor: FUKUDA TAKASHI , KIKUCHI HIROAKI , YOTSUKURA SHIMPEI
IPC: G06F16/30
Abstract: Ein auf einem Computer implementiertes Verfahren und System zum Clustering von Facetten auf einem zweidimensionalen Facettenwürfel für Text-Mining. Das Verfahren und das System führen ein Text-Mining auf Grundlage von Facetten, um unstrukturierte Daten in einem oder mehreren Dokumenten zu analysieren, durch Erzeugen eines zweidimensionalen Facettenwürfels, bei dem es sich um eine Korrelationsmatrix für eine oder mehrere Facetten handelt, die einem Satz aus einem oder mehreren der Dokumente zugehörig sind; Gruppieren einer oder mehrerer der Facetten in der Korrelationsmatrix zu zumindest einem Cluster; Berechnen eines Zentrums für den Cluster; und Erkennen von Facetten, die sich in der Nähe des berechneten Zentrums des Clusters befinden, als repräsentativ für den Cluster durch.
-
公开(公告)号:GB2485926B
公开(公告)日:2013-06-05
申请号:GB201202741
申请日:2010-07-12
Applicant: IBM
Inventor: FUKUDA TAKASHI , ICHIKAWA OSAMU , NISHIMURA MASAFUMI
Abstract: A speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program. A speech feature extraction apparatus includes: first difference calculation module to: (i) receive, as an input, a spectrum of a speech signal segmented into frames for each frequency bin; and (ii) calculate a delta spectrum for each of the frame, where the delta spectrum is a difference of the spectrum within continuous frames for the frequency bin; and first normalization module to normalize the delta spectrum of the frame for the frequency bin by dividing the delta spectrum by a function of an average spectrum; where the average spectrum is an average of spectra through all frames that are overall speech for the frequency bin; and where an output of the first normalization module is defined as a first delta feature.
-
公开(公告)号:DE102021129058A1
公开(公告)日:2022-06-09
申请号:DE102021129058
申请日:2021-11-09
Applicant: IBM
Inventor: FUKUDA TAKASHI
Abstract: Verfahren und Systeme zum Trainieren eines neuronalen Netzwerks umfassen ein Clustern eines vollständigen Satz von Trainings-Datenproben zu spezialisierten Trainingsclustern. Spezialisierte neuronale Lehrernetzwerke werden mittels jeweiliger spezialisierter Trainingscluster der spezialisierten Trainingscluster trainiert. Mittels spezialisierter neuronaler Lehrernetzwerke werden veränderliche Kennsätze für den kompletten Satz von Trainings-Datenproben erzeugt. Ein Schülermodell wird mittels des kompletten Satzes von Trainings-Datenproben, der spezialisierten Trainingscluster und der veränderlichen Kennsätze trainiert.
-
公开(公告)号:DE112019002235T5
公开(公告)日:2021-02-11
申请号:DE112019002235
申请日:2019-07-17
Applicant: IBM
Inventor: FUKUDA SUSUMU , WATANABE KENTA , ISHIKAWA SHUNSUKE , FUKUDA TAKASHI
IPC: G06F16/35 , G06F16/31 , G06F16/36 , G06F40/279
Abstract: Ausführungsformen sind auf ein System, Computerprogrammprodukt und Verfahren zur dynamischen Facetten-Wörterbuchverwaltung ausgerichtet. Wenn eine oder mehrere Annotationen auf eine Sammlung von Dokumenten angewendet werden, werden elektronischer Text und zugehörige Facetten identifiziert. Zusätzliche Facetten und Facettenwerte werden identifiziert und selektiv auf eine Wissensdatenbank angewendet. Aus dem selektiven Anwenden wird ein Wörterbuch bestehend aus Facetten und zugehörigen Facettenwerten erstellt. Durch Anwenden des Wörterbuchs auf die Wissensdatenbank wird eine gezielte Sammlung von Dokumenten identifiziert und zurückgeliefert. Entsprechend werden Facettengewinnung und Wörterbucherstellung dynamisch auf die Wissensdatenbank angewandt.
-
公开(公告)号:DE112017006049B4
公开(公告)日:2022-06-30
申请号:DE112017006049
申请日:2017-12-15
Applicant: IBM
Inventor: ICHIKAWA OSAMU , FUKUDA TAKASHI , RAMABHADRAN BHUVANA
Abstract: Durch einen Computer realisiertes Verfahren, aufweisend:ein Erhalten (S110) eines Frequenzspektrums von Audiosignaldaten durch einen Prozessor;ein Extrahieren (S150) von periodischen Anzeichen aus dem Frequenzspektrum durch den Prozessor;ein Eingeben der periodischen Anzeichen und Komponenten des Frequenzspektrums in ein neuronales Netz durch den Prozessor;ein Schätzen (S210) von Klangidentifizierungsinformationen aus dem neuronalen Netz durch den Prozessor,wobei das neuronale Netz ein faltendes neuronales Netz oder ein tiefes neuronales Netz ist,wobei das Eingeben in das neuronale Netz ein Eingeben der periodischen Anzeichen in eine zweite Schicht oder eine darauffolgende Schicht des neuronalen Netzes beinhaltet.
-
公开(公告)号:DE112010003461B4
公开(公告)日:2019-09-05
申请号:DE112010003461
申请日:2010-07-12
Applicant: IBM
Inventor: ICHIKAWA OSAMU , FUKUDA TAKASHI , NISHIMURA MASAFUMI
Abstract: Vorrichtung zur Extraktion von Sprachmerkmalen, wobei die Vorrichtung Folgendes umfasst:eine erste Differenzberechnungseinheit (600, 700, 800) zum Empfangen eines Spektrums für jede einer Mehrzahl von Frequenzgruppen eines Sprachsignals, wobei das Sprachsignal für jede Frequenzgruppe in Rahmen segmentiert ist, und zum Berechnen, für jeden Rahmen jeder Frequenzgruppe, einer Differenz des Spektrums zwischen fortlaufenden Rahmen für die Frequenzgruppe als ein Delta-Spektrum; undeine erste Normierungseinheit (605, 710, 810) zum Ausführen einer Normierung des Delta-Spektrums für jeden Rahmen jeder Frequenzgruppe durch Dividieren des Delta-Spektrums durch eine Funktion des mittleren Spektrums, welches durch einen Mittelwert von Spektren über alle Sprache darstellenden Rahmen gegeben ist.
-
公开(公告)号:JP2009058708A
公开(公告)日:2009-03-19
申请号:JP2007225195
申请日:2007-08-31
Applicant: Internatl Business Mach Corp
, インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation Inventor: ICHIKAWA OSAMU , FUKUDA TAKASHI , NISHIMURA MASAFUMI
Abstract: PROBLEM TO BE SOLVED: To provide a voice processing technique attaining stable voice recognition even in noise. SOLUTION: A high-order term and a low-order term of cepstrum of an observation voice are cut to design a filter directly from the observation voice itself. The filter is thereby made a filter with weight at a harmonic structure part in a section of a voiced sound, and a filter close to flat in a section of voiceless sound without the harmonic structure. Since this change is continuous, stable processing can be performed without distinguishing the voiced sound section from the voiceless sound section. COPYRIGHT: (C)2009,JPO&INPIT
Abstract translation: 要解决的问题:提供甚至在噪声中实现稳定语音识别的语音处理技术。 解决方案:切割观察语音的倒谱的高阶项和低阶项,直接从观察声音本身设计滤波器。 由此,过滤器在声音的一部分中的谐波结构部分处具有重量的滤波器,并且在没有谐波结构的无声声音部分中接近平坦的滤波器。 由于该变化是连续的,因此可以进行稳定的处理,而不区分浊音部分与无声音部分。 版权所有(C)2009,JPO&INPIT
-
-
-
-
-
-
-
-
-