TRAINING CLASSIFIERS USING SELECTED COHORT SAMPLE SUBSETS
    1.
    发明申请
    TRAINING CLASSIFIERS USING SELECTED COHORT SAMPLE SUBSETS 审中-公开
    使用选择的联合样本附件培训分类器

    公开(公告)号:WO2015147662A8

    公开(公告)日:2016-10-06

    申请号:PCT/PL2014050017

    申请日:2014-03-28

    Applicant: INTEL CORP

    CPC classification number: G10L17/04 G10L17/02 G10L17/08 G10L17/16

    Abstract: Various systems, apparatuses, and methods for training classifiers using selected cohort sample subsets are disclosed herein. In an example, a set of target supervectors, representing a target class, is received, and a set of cohort supervectors, representing a cohort class, is received. A distance metric is calculated from a respective cohort supervector to a respective target supervector, and a proper subset of cohort supervectors are selected based on the calculated distance metrics. The set of target supervectors and the selected proper subset of cohort supervectors are used to train a classifier. Further examples described herein describe how training classifiers using selected cohort sample subsets may be used to increase performance and decrease resource consumption in voice biometric systems.

    Abstract translation: 本文公开了使用所选队列样本子集训练分类器的各种系统,装置和方法。 在一个示例中,接收表示目标类的一组目标超级向量,并且接收表示队列类的一组队列超级向量。 从相应的队列超向量到相应的目标超向量计算距离度量,并且基于所计算的距离度量来选择队列超级向量的适当子集。 目标超级医生和选定的队列超级医生子集用于训练分类器。 本文描述的其它示例描述了如何使用选择的队列样本子集的训练分类器可用于增加语音生物测定系统中的性能并降低资源消耗。

    ADAPTIVES ERKENNEN VON SPRACHE UNTER VERWENDUNG VON SCHLÜSSELPHRASEN

    公开(公告)号:DE102020127622A1

    公开(公告)日:2021-05-27

    申请号:DE102020127622

    申请日:2020-10-20

    Applicant: INTEL CORP

    Abstract: Eine beispielhafte Einrichtung zur Spracherkennung beinhaltet einen Audioempfänger zum Empfangen eines Audiostroms. Die Einrichtung beinhaltet außerdem einen Schlüsselphrasendetektor zum Detektieren einer Schlüsselphrase in dem Audiostrom. Die Einrichtung beinhaltet ferner eine Modellanpassungseinrichtung zum dynamischen Anpassen eines Modells basierend auf der detektierten Schlüsselphrase. Die Einrichtung beinhaltet auch einen Anfragenerkenner zum Detektieren einer Sprachanfrage im Anschluss an die Schlüsselphrase in einem Audiostrom mittels des angepassten Modells.

    WAKE-ON-VOICE-SCHLÜSSELPHRASENSEGMENTIERUNG

    公开(公告)号:DE102019109148A1

    公开(公告)日:2019-11-07

    申请号:DE102019109148

    申请日:2019-04-08

    Applicant: INTEL CORP

    Abstract: Es werden Techniken zur Segmentierung einer Schlüsselphrase bereitgestellt. Eine die Techniken implementierende Methodik gemäß einer Ausführungsform beinhaltet Akkumulieren von Merkmalsvektoren, die aus Zeitsegmenten eines Audiosignals extrahiert werden, und Erzeugen eines Satzes akustischer Bewertungen basierend auf diesen Merkmalsvektoren. Jede dieser akustischen Bewertungen in dem Satz repräsentiert eine Wahrscheinlichkeit für eine mit den Zeitsegmenten assoziierte phonetische Klasse. Das Verfahren beinhaltet ferner Erzeugen einer Progression bewerteter Modellzustandssequenzen, wobei jede der bewerteten Modellzustandssequenzen auf einer Detektion von phonetischen Einheiten basiert, die mit einem entsprechenden der Sätze akustischer Bewertungen, die aus den Zeitsegmenten des Audiosignals erzeugt werden, assoziiert sind. Das Verfahren beinhaltet ferner Analysieren der Progression bewerteter Zustandssequenzen, um ein mit der Progression assoziiertes Muster zu detektieren, und Bestimmen eines Start- und Endpunkts zur Segmentierung der Schlüsselphrase basierend auf einer Abstimmung des detektierten Musters mit einem erwarteten Muster.

    Detektion eines akustischen Ereignisses basierend auf der Modellierung einer Sequenz von Ereignisunterabschnitten

    公开(公告)号:DE102018127773A1

    公开(公告)日:2019-06-13

    申请号:DE102018127773

    申请日:2018-11-07

    Applicant: INTEL CORP

    Abstract: Es werden Techniken zur Detektion eines akustischen Ereignisses bereitgestellt. Eine Methodik, die die Techniken gemäß einer Ausführungsform implementiert, beinhaltet Extrahieren von akustischen Merkmalen aus einem empfangenen Audiosignal. Die akustischen Merkmale können zum Beispiel ein oder mehrere Kurzzeit-Fourier-Transformation-Frames oder andere Spektralenergiecharakteristiken des Audiosignals beinhalten. Das Verfahren beinhaltet außerdem Anwenden eines trainierten Klassifizierers bei den extrahierten akustischen Merkmalen, um akustische Ereignisunterabschnitte des Audiosignals zu identifizieren und zu bezeichnen und Bewertungen, die mit den Unterabschnitten assoziiert sind, zu erzeugen. Das Verfahren beinhaltet ferner Durchführen einer Sequenzdecodierung der akustischen Ereignisunterabschnitte und assoziierten Bewertungen, um akustische Zielereignisse von Interesse basierend auf den Bewertungen und der zeitlichen Ordnungssequenz der Ereignisunterabschnitte zu detektieren. Der Klassifizierer wird an akustischen Ereignisunterabschnitten trainiert, die durch nicht überwachte Subspace-Clustering-Techniken erzeugt werden, die bei Trainingsdaten angewendet werden, die akustische Zielereignisse beinhalten.

    Verfahren und System zur Zeitdomänen-Merkmalsextraktion für die automatische Spracherkennung

    公开(公告)号:DE102019113534B4

    公开(公告)日:2022-12-22

    申请号:DE102019113534

    申请日:2019-05-21

    Applicant: INTEL CORP

    Abstract: Computerimplementiertes Verfahren (300) zur Merkmalsextraktion für die automatische Spracherkennung, umfassend:Empfangen (302) eines Eingangssprachsignals;Durchführen (304) einer Delta-Modulation, umfassend:Vergleichen (306) eines repräsentativen Werts einer Abtastung des Eingangssprachsignals mit oberen und unteren Schwellenwerten mehrerer Schwellenwertniveaus, undBereitstellen (308) wenigstens eines Gültigkeitsindikators und eines Verschiebungsindikators als Ausgabe der Delta-Modulation,wobei der Gültigkeitsindikator eine Änderung entlang des Eingangssprachsignals um mindestens ein Schwellenwertniveau von einem vorherigen repräsentativen Wert zur nächsten Abtastung anzeigt (310), undwobei der Verschiebungsindikator ein einzelner Wert ist, der die Gesamtzahl von mit dem Gültigkeitsindikator assoziierten Schwellenwertniveau-Änderungen von einem vorherigen repräsentativen Wert zur nächsten Abtastung anzeigt, einschließlich einer Änderung um mehrere Niveaus (312); undVerwenden (314) des Gültigkeits- und des Verschiebungsindikators zum Bilden von Mel-Frequenz bezogenen Koeffizienten, die zum Erkennen von Sprache im Eingangssprachsignal verwendet werden sollen.

Patent Agency Ranking