-
1.
公开(公告)号:WO2015147662A8
公开(公告)日:2016-10-06
申请号:PCT/PL2014050017
申请日:2014-03-28
Applicant: INTEL CORP
Inventor: BOCKLET TOBIAS , MAREK ADAM
Abstract: Various systems, apparatuses, and methods for training classifiers using selected cohort sample subsets are disclosed herein. In an example, a set of target supervectors, representing a target class, is received, and a set of cohort supervectors, representing a cohort class, is received. A distance metric is calculated from a respective cohort supervector to a respective target supervector, and a proper subset of cohort supervectors are selected based on the calculated distance metrics. The set of target supervectors and the selected proper subset of cohort supervectors are used to train a classifier. Further examples described herein describe how training classifiers using selected cohort sample subsets may be used to increase performance and decrease resource consumption in voice biometric systems.
Abstract translation: 本文公开了使用所选队列样本子集训练分类器的各种系统,装置和方法。 在一个示例中,接收表示目标类的一组目标超级向量,并且接收表示队列类的一组队列超级向量。 从相应的队列超向量到相应的目标超向量计算距离度量,并且基于所计算的距离度量来选择队列超级向量的适当子集。 目标超级医生和选定的队列超级医生子集用于训练分类器。 本文描述的其它示例描述了如何使用选择的队列样本子集的训练分类器可用于增加语音生物测定系统中的性能并降低资源消耗。
-
公开(公告)号:DE102020202489A8
公开(公告)日:2020-10-15
申请号:DE102020202489
申请日:2020-02-27
Applicant: INTEL CORP
Inventor: CZYRYBA SEBASTIAN , BOCKLET TOBIAS , LOPATKA KUBA
-
公开(公告)号:DE102020130041A1
公开(公告)日:2021-05-20
申请号:DE102020130041
申请日:2020-11-13
Applicant: INTEL CORP , INTEL DEUTSCHLAND GMBH
Inventor: STEMMER GEORG , HOFER JOACHIM , BAUER JOSEF , BOCKLET TOBIAS , GEORGES MUNIR NIKOLAI ALEXANDER
Abstract: Eine beispielhafte Einrichtung zum Verbergen von Phrasen in Audio beinhaltet einen Empfänger zum Empfangen einer detektierten Phrase über ein Netzwerk. Die detektierte Phrase basiert auf Audio, das in der Nähe einer Quelle eines Audiostroms erfasst wird. Die Einrichtung beinhaltet außerdem einen Spracherkenner zum Erzeugen eines Auslösers als Reaktion auf das Detektieren, dass ein Abschnitt des Audiostroms eine bestätigte Phrase enthält. Die Einrichtung beinhaltet ferner einen Phrasenverberger zum Verbergen des Abschnitts des Audiostroms als Reaktion auf den Auslöser.
-
4.
公开(公告)号:DE102019122180A1
公开(公告)日:2020-03-19
申请号:DE102019122180
申请日:2019-08-19
Applicant: INTEL CORP
Inventor: BOCKLET TOBIAS , OSSOWSKI JACEK , DORAU TOMASZ , MUCHLINSKI MACIEJ , PEARCE DAVID , ROZEN PIOTR
Abstract: Ein Verfahren und ein System betreffen eine autonome Schlüsselausdruckserkennung auf der Grundlage eines neuronalen Netzes und schließen die Erzeugung und Verwendung eines mehrere Elemente aufweisenden Zustandsbewertungsvektors unter Verwendung neuronaler Netzoperationen und im Wesentlichen ohne Verwendung eines digitalen Signalprozessors (DSP) zur Ausführung der Schlüsselausdruckserkennung ein.
-
5.
公开(公告)号:DE102019113534A1
公开(公告)日:2020-01-02
申请号:DE102019113534
申请日:2019-05-21
Applicant: INTEL CORP
Inventor: BANG SUYOUNG , KHELLAH MUHAMMAD , PAUL SOMNATH , AUGUSTINE CHARLES , MAJUMDER TURBO , LIM WOOTAEK , BOCKLET TOBIAS , PEARCE DAVID
Abstract: Ein System, Gegenstand und Verfahren zur Zeitdomänen-Merkmalsextraktion für die automatische Spracherkennung.
-
公开(公告)号:DE102020127622A1
公开(公告)日:2021-05-27
申请号:DE102020127622
申请日:2020-10-20
Applicant: INTEL CORP
IPC: G10L15/22
Abstract: Eine beispielhafte Einrichtung zur Spracherkennung beinhaltet einen Audioempfänger zum Empfangen eines Audiostroms. Die Einrichtung beinhaltet außerdem einen Schlüsselphrasendetektor zum Detektieren einer Schlüsselphrase in dem Audiostrom. Die Einrichtung beinhaltet ferner eine Modellanpassungseinrichtung zum dynamischen Anpassen eines Modells basierend auf der detektierten Schlüsselphrase. Die Einrichtung beinhaltet auch einen Anfragenerkenner zum Detektieren einer Sprachanfrage im Anschluss an die Schlüsselphrase in einem Audiostrom mittels des angepassten Modells.
-
公开(公告)号:DE102019109148A1
公开(公告)日:2019-11-07
申请号:DE102019109148
申请日:2019-04-08
Applicant: INTEL CORP
Inventor: DORAU TOMASZ , BOCKLET TOBIAS , TOMASZEWSKI PRZEMYSLAW , CZYRYBA SEBASTIAN , CHOJECKI JULIUSZ NORMAN
IPC: G10L15/04
Abstract: Es werden Techniken zur Segmentierung einer Schlüsselphrase bereitgestellt. Eine die Techniken implementierende Methodik gemäß einer Ausführungsform beinhaltet Akkumulieren von Merkmalsvektoren, die aus Zeitsegmenten eines Audiosignals extrahiert werden, und Erzeugen eines Satzes akustischer Bewertungen basierend auf diesen Merkmalsvektoren. Jede dieser akustischen Bewertungen in dem Satz repräsentiert eine Wahrscheinlichkeit für eine mit den Zeitsegmenten assoziierte phonetische Klasse. Das Verfahren beinhaltet ferner Erzeugen einer Progression bewerteter Modellzustandssequenzen, wobei jede der bewerteten Modellzustandssequenzen auf einer Detektion von phonetischen Einheiten basiert, die mit einem entsprechenden der Sätze akustischer Bewertungen, die aus den Zeitsegmenten des Audiosignals erzeugt werden, assoziiert sind. Das Verfahren beinhaltet ferner Analysieren der Progression bewerteter Zustandssequenzen, um ein mit der Progression assoziiertes Muster zu detektieren, und Bestimmen eines Start- und Endpunkts zur Segmentierung der Schlüsselphrase basierend auf einer Abstimmung des detektierten Musters mit einem erwarteten Muster.
-
公开(公告)号:DE102018127773A1
公开(公告)日:2019-06-13
申请号:DE102018127773
申请日:2018-11-07
Applicant: INTEL CORP
Inventor: LOPATKA KUBA , BOCKLET TOBIAS , KOTARSKI MATEUSZ
Abstract: Es werden Techniken zur Detektion eines akustischen Ereignisses bereitgestellt. Eine Methodik, die die Techniken gemäß einer Ausführungsform implementiert, beinhaltet Extrahieren von akustischen Merkmalen aus einem empfangenen Audiosignal. Die akustischen Merkmale können zum Beispiel ein oder mehrere Kurzzeit-Fourier-Transformation-Frames oder andere Spektralenergiecharakteristiken des Audiosignals beinhalten. Das Verfahren beinhaltet außerdem Anwenden eines trainierten Klassifizierers bei den extrahierten akustischen Merkmalen, um akustische Ereignisunterabschnitte des Audiosignals zu identifizieren und zu bezeichnen und Bewertungen, die mit den Unterabschnitten assoziiert sind, zu erzeugen. Das Verfahren beinhaltet ferner Durchführen einer Sequenzdecodierung der akustischen Ereignisunterabschnitte und assoziierten Bewertungen, um akustische Zielereignisse von Interesse basierend auf den Bewertungen und der zeitlichen Ordnungssequenz der Ereignisunterabschnitte zu detektieren. Der Klassifizierer wird an akustischen Ereignisunterabschnitten trainiert, die durch nicht überwachte Subspace-Clustering-Techniken erzeugt werden, die bei Trainingsdaten angewendet werden, die akustische Zielereignisse beinhalten.
-
9.
公开(公告)号:DE102019113534B4
公开(公告)日:2022-12-22
申请号:DE102019113534
申请日:2019-05-21
Applicant: INTEL CORP
Inventor: BANG SUYOUNG , KHELLAH MUHAMMAD , PAUL SOMNATH , AUGUSTINE CHARLES , MAJUMDER TURBO , LIM WOOTAEK , BOCKLET TOBIAS , PEARCE DAVID
Abstract: Computerimplementiertes Verfahren (300) zur Merkmalsextraktion für die automatische Spracherkennung, umfassend:Empfangen (302) eines Eingangssprachsignals;Durchführen (304) einer Delta-Modulation, umfassend:Vergleichen (306) eines repräsentativen Werts einer Abtastung des Eingangssprachsignals mit oberen und unteren Schwellenwerten mehrerer Schwellenwertniveaus, undBereitstellen (308) wenigstens eines Gültigkeitsindikators und eines Verschiebungsindikators als Ausgabe der Delta-Modulation,wobei der Gültigkeitsindikator eine Änderung entlang des Eingangssprachsignals um mindestens ein Schwellenwertniveau von einem vorherigen repräsentativen Wert zur nächsten Abtastung anzeigt (310), undwobei der Verschiebungsindikator ein einzelner Wert ist, der die Gesamtzahl von mit dem Gültigkeitsindikator assoziierten Schwellenwertniveau-Änderungen von einem vorherigen repräsentativen Wert zur nächsten Abtastung anzeigt, einschließlich einer Änderung um mehrere Niveaus (312); undVerwenden (314) des Gültigkeits- und des Verschiebungsindikators zum Bilden von Mel-Frequenz bezogenen Koeffizienten, die zum Erkennen von Sprache im Eingangssprachsignal verwendet werden sollen.
-
公开(公告)号:DE102019112380A1
公开(公告)日:2019-12-24
申请号:DE102019112380
申请日:2019-05-13
Applicant: INTEL CORP
Inventor: HUANG JONATHAN J , BOCKLET TOBIAS
Abstract: Hier werden Techniken in Bezug auf ein Verfahren und System zur robusten Sprechererkennungsaktivierung beschrieben. Diese Techniken wenden eine Schlüsselausdruckserkennung und Sprechererkennung auf einen nachfolgenden Ausdruck nach der Erkennung eines Aufweckschlüsselausdrucks an.
-
-
-
-
-
-
-
-
-