Klangidentifizierung anhand periodischer Anzeichen

    公开(公告)号:DE112017006049T5

    公开(公告)日:2019-09-12

    申请号:DE112017006049

    申请日:2017-12-15

    Applicant: IBM

    Abstract: Bereitgestellt werden ein durch einen Computer realisiertes Verfahren und eine Vorrichtung. Das Verfahren beinhaltet ein Erhalten eines Frequenzspektrums von Audiosignaldaten durch einen Prozessor. Das Verfahren beinhaltet des Weiteren ein Extrahieren von periodischen Anzeichen aus dem Frequenzspektrum durch den Prozessor. Das Verfahren beinhaltet außerdem ein Eingeben der periodischen Anzeichen und Komponenten des Frequenzspektrums in ein neuronales Netz durch den Prozessor. Das Verfahren beinhaltet zusätzlich ein Schätzen von Klangidentifizierungsinformationen aus dem neuronalen Netz durch den Prozessor.

    VORRICHTUNG ZUR EXTRAKTION VON SPRACHMERKMALEN,VERFAHREN ZUR EXTRAKTION VON SPRACHMERKMALEN UND PROGRAMM ZUREXTRAKTION VON SPRACHMERKMALEN

    公开(公告)号:DE112010003461T5

    公开(公告)日:2012-07-26

    申请号:DE112010003461

    申请日:2010-07-12

    Applicant: IBM

    Abstract: Eine Technik zum Extrahieren von Merkmalen, die in Bezug auf Störsignale, Mehrfachreflexion und dergleichen robuster sind, wird bereitgestellt. Eine Vorrichtung zur Extraktion von Sprachmerkmalen enthält Differenzberechnungsmittel zum Empfangen eines Spektrums eines Sprachsignals, das in Rahmen segmentiert ist, als eine Eingabe, und zum Berechnen einer Differenz des Spektrums zwischen fortlaufenden Rahmen (eine Differenz in dem linearen Bereich) für jeden Rahmen als ein Delta-Spektrum und Normierungsmittel zum Ausführen einer Normierung des Delta-Spektrums für den Rahmen durch Dividieren des Delta-Spektrums durch eine Funktion eines mittleren Spektrums. Eine Ausgabe der Normierungsmittel ist als ein Delta-Merkmal definiert.

    AUDIO FEATURE EXTRACTING APPARATUS, AUDIO FEATURE EXTRACTING METHOD, AND AUDIO FEATURE EXTRACTING PROGRAM

    公开(公告)号:GB2485926A

    公开(公告)日:2012-05-30

    申请号:GB201202741

    申请日:2010-07-12

    Applicant: IBM

    Abstract: This invention provides a technique for extracting, from audio signals, features that are stronger due to noises and/or reverberations. An audio feature extracting apparatus comprises: difference calculating means operative to receive the spectra of framed audio signals to calculate, as a delta spectrum, the difference in spectrum between each frame and each of the respective preceding and following frames (the difference in linear region); and normalizing means operative to divide the delta spectrum by an average-spectrum function, thereby normalizing the delta spectrum for each frame. The outputs of the normalizing means are used as delta features.

    CLUSTERING VON FACETTEN AUF EINEM ZWEIDIMENSIONALEN FACETTENWÜRFEL FÜR TEXT-MINING

    公开(公告)号:DE112018006438T5

    公开(公告)日:2020-09-03

    申请号:DE112018006438

    申请日:2018-12-12

    Applicant: IBM

    Abstract: Ein auf einem Computer implementiertes Verfahren und System zum Clustering von Facetten auf einem zweidimensionalen Facettenwürfel für Text-Mining. Das Verfahren und das System führen ein Text-Mining auf Grundlage von Facetten, um unstrukturierte Daten in einem oder mehreren Dokumenten zu analysieren, durch Erzeugen eines zweidimensionalen Facettenwürfels, bei dem es sich um eine Korrelationsmatrix für eine oder mehrere Facetten handelt, die einem Satz aus einem oder mehreren der Dokumente zugehörig sind; Gruppieren einer oder mehrerer der Facetten in der Korrelationsmatrix zu zumindest einem Cluster; Berechnen eines Zentrums für den Cluster; und Erkennen von Facetten, die sich in der Nähe des berechneten Zentrums des Clusters befinden, als repräsentativ für den Cluster durch.

    SPEECH FEATURE EXTRACTING APPARATUS, SPEECH FEATURE EXTRACTING METHOD, AND SPEECH FEATURE EXTRACTING PROGRAM

    公开(公告)号:GB2485926B

    公开(公告)日:2013-06-05

    申请号:GB201202741

    申请日:2010-07-12

    Applicant: IBM

    Abstract: A speech feature extraction apparatus, speech feature extraction method, and speech feature extraction program. A speech feature extraction apparatus includes: first difference calculation module to: (i) receive, as an input, a spectrum of a speech signal segmented into frames for each frequency bin; and (ii) calculate a delta spectrum for each of the frame, where the delta spectrum is a difference of the spectrum within continuous frames for the frequency bin; and first normalization module to normalize the delta spectrum of the frame for the frequency bin by dividing the delta spectrum by a function of an average spectrum; where the average spectrum is an average of spectra through all frames that are overall speech for the frequency bin; and where an output of the first normalization module is defined as a first delta feature.

    WISSENSDESTILLATION MITTELS DEEP CLUSTERING

    公开(公告)号:DE102021129058A1

    公开(公告)日:2022-06-09

    申请号:DE102021129058

    申请日:2021-11-09

    Applicant: IBM

    Inventor: FUKUDA TAKASHI

    Abstract: Verfahren und Systeme zum Trainieren eines neuronalen Netzwerks umfassen ein Clustern eines vollständigen Satz von Trainings-Datenproben zu spezialisierten Trainingsclustern. Spezialisierte neuronale Lehrernetzwerke werden mittels jeweiliger spezialisierter Trainingscluster der spezialisierten Trainingscluster trainiert. Mittels spezialisierter neuronaler Lehrernetzwerke werden veränderliche Kennsätze für den kompletten Satz von Trainings-Datenproben erzeugt. Ein Schülermodell wird mittels des kompletten Satzes von Trainings-Datenproben, der spezialisierten Trainingscluster und der veränderlichen Kennsätze trainiert.

    EINBINDEN EINES WÖRTERBUCH-BEARBEITUNGSSYSTEMS IN EIN TEXT MINING

    公开(公告)号:DE112019002235T5

    公开(公告)日:2021-02-11

    申请号:DE112019002235

    申请日:2019-07-17

    Applicant: IBM

    Abstract: Ausführungsformen sind auf ein System, Computerprogrammprodukt und Verfahren zur dynamischen Facetten-Wörterbuchverwaltung ausgerichtet. Wenn eine oder mehrere Annotationen auf eine Sammlung von Dokumenten angewendet werden, werden elektronischer Text und zugehörige Facetten identifiziert. Zusätzliche Facetten und Facettenwerte werden identifiziert und selektiv auf eine Wissensdatenbank angewendet. Aus dem selektiven Anwenden wird ein Wörterbuch bestehend aus Facetten und zugehörigen Facettenwerten erstellt. Durch Anwenden des Wörterbuchs auf die Wissensdatenbank wird eine gezielte Sammlung von Dokumenten identifiziert und zurückgeliefert. Entsprechend werden Facettengewinnung und Wörterbucherstellung dynamisch auf die Wissensdatenbank angewandt.

    Verfahren und Vorrichtung zur Klangidentifizierung anhand periodischer Anzeichen

    公开(公告)号:DE112017006049B4

    公开(公告)日:2022-06-30

    申请号:DE112017006049

    申请日:2017-12-15

    Applicant: IBM

    Abstract: Durch einen Computer realisiertes Verfahren, aufweisend:ein Erhalten (S110) eines Frequenzspektrums von Audiosignaldaten durch einen Prozessor;ein Extrahieren (S150) von periodischen Anzeichen aus dem Frequenzspektrum durch den Prozessor;ein Eingeben der periodischen Anzeichen und Komponenten des Frequenzspektrums in ein neuronales Netz durch den Prozessor;ein Schätzen (S210) von Klangidentifizierungsinformationen aus dem neuronalen Netz durch den Prozessor,wobei das neuronale Netz ein faltendes neuronales Netz oder ein tiefes neuronales Netz ist,wobei das Eingeben in das neuronale Netz ein Eingeben der periodischen Anzeichen in eine zweite Schicht oder eine darauffolgende Schicht des neuronalen Netzes beinhaltet.

    Vorrichtung zur Extraktion von Sprachmerkmalen, Verfahren zur Extraktion von Sprachmerkmalen und Programm zur Extraktion von Sprachmerkmalen

    公开(公告)号:DE112010003461B4

    公开(公告)日:2019-09-05

    申请号:DE112010003461

    申请日:2010-07-12

    Applicant: IBM

    Abstract: Vorrichtung zur Extraktion von Sprachmerkmalen, wobei die Vorrichtung Folgendes umfasst:eine erste Differenzberechnungseinheit (600, 700, 800) zum Empfangen eines Spektrums für jede einer Mehrzahl von Frequenzgruppen eines Sprachsignals, wobei das Sprachsignal für jede Frequenzgruppe in Rahmen segmentiert ist, und zum Berechnen, für jeden Rahmen jeder Frequenzgruppe, einer Differenz des Spektrums zwischen fortlaufenden Rahmen für die Frequenzgruppe als ein Delta-Spektrum; undeine erste Normierungseinheit (605, 710, 810) zum Ausführen einer Normierung des Delta-Spektrums für jeden Rahmen jeder Frequenzgruppe durch Dividieren des Delta-Spektrums durch eine Funktion des mittleren Spektrums, welches durch einen Mittelwert von Spektren über alle Sprache darstellenden Rahmen gegeben ist.

    Voice processing system, method and program
    10.
    发明专利
    Voice processing system, method and program 有权
    语音处理系统,方法和程序

    公开(公告)号:JP2009058708A

    公开(公告)日:2009-03-19

    申请号:JP2007225195

    申请日:2007-08-31

    CPC classification number: G10L15/20 G10L15/02 G10L25/24

    Abstract: PROBLEM TO BE SOLVED: To provide a voice processing technique attaining stable voice recognition even in noise. SOLUTION: A high-order term and a low-order term of cepstrum of an observation voice are cut to design a filter directly from the observation voice itself. The filter is thereby made a filter with weight at a harmonic structure part in a section of a voiced sound, and a filter close to flat in a section of voiceless sound without the harmonic structure. Since this change is continuous, stable processing can be performed without distinguishing the voiced sound section from the voiceless sound section. COPYRIGHT: (C)2009,JPO&INPIT

    Abstract translation: 要解决的问题:提供甚至在噪声中实现稳定语音识别的语音处理技术。 解决方案:切割观察语音的倒谱的高阶项和低阶项,直接从观察声音本身设计滤波器。 由此,过滤器在声音的一部分中的谐波结构部分处具有重量的滤波器,并且在没有谐波结构的无声声音部分中接近平坦的滤波器。 由于该变化是连续的,因此可以进行稳定的处理,而不区分浊音部分与无声音部分。 版权所有(C)2009,JPO&INPIT

Patent Agency Ranking