-
1.
公开(公告)号:DE102019110272A1
公开(公告)日:2019-11-21
申请号:DE102019110272
申请日:2019-04-18
Applicant: INTEL CORP
Inventor: KUPRYJANOW ADAM , LOPATKA KUBA
Abstract: Es werden Techniken zur Vorverarbeitungsverbesserung eines Sprachsignals bereitgestellt. Eine Methodik, die die Techniken gemäß einer Ausführungsform implementiert, beinhaltet Durchführen einer Enthallungsverarbeitung an Signalen, die von einem Array von Mikrofonen empfangen werden, wobei die Signale Sprache und Rauschen umfassen. Das Verfahren beinhaltet auch Erzeugen von Zeit-Frequenz-Masken (TFMs) für jedes der Signale. Die TFMs geben die Wahrscheinlichkeit an, dass eine Zeit-Frequenz-Komponente des mit diesem TFM-Element assoziierten Signals Sprache enthält. Die TFM-Erzeugung basiert auf einer Anwendung eines rekurrenten Neuronalnetzwerks an den Signalen. Das Verfahren beinhaltet ferner Erzeugen von Lenkvektoren basierend auf Sprachkovarianzmatrizen und Rauschkovarianzmatrizen. Die TFMs werden eingesetzt, um Sprachkomponenten der Signale zur Berechnung der Sprachkovarianz zu filtern und Rauschkomponenten der Signale zur Berechnung der Rauschkovarianz zu filtern. Das Verfahren beinhaltet ferner Durchführen einer Strahlformung an den Signalen basierend auf den Lenkvektoren, um das verbesserte Sprachsignal zu erzeugen.
-
公开(公告)号:DE102018128728A1
公开(公告)日:2019-06-19
申请号:DE102018128728
申请日:2018-11-15
Applicant: INTEL CORP
Inventor: CILINGIR GOKCEN , PEARCE DAVID , KUPRYJANOW ADAM , JABER SUHEL , MEYER PAULO LOPEZ
Abstract: Systeme, Einrichtungen und Verfahren zur sicheren Audioakquisition. Das Verfahren beinhaltet Empfangen von Audiodaten über ein digitales Mikrofon. Das digitale Mikrofon gibt ein einziges Bit mit einer hohen Abtastrate aus. Die Ausgabe des digitalen Mikrofons wird in ein Vollbereichsaudiosignal umgewandelt. Das Vollbereichsaudiosignal wird gefiltert, um eine bandbegrenzte Audioausgabe bereitzustellen, die das Erfassen eines ausreichenden Sprachspektralbereichs, damit Sprache verständlich ist, vermeidet.
-
公开(公告)号:DE102018125628A1
公开(公告)日:2019-06-13
申请号:DE102018125628
申请日:2018-10-16
Applicant: INTEL CORP
Inventor: MAZIEWSKI PRZEMYSLAW , KUPRYJANOW ADAM
IPC: G06F3/16
Abstract: Es ist ein Mechanismus zum Ermöglichen einer Mehreinrichtung-Nachhallschätzung gemäß einer Ausführungsform beschrieben. Eine Vorrichtung von Ausführungsformen, wie hierin beschrieben, beinhaltet eine Detektion-und-Gewinnung-Logik zum Ermöglichen, dass ein Mikrofon einer ersten sprachgestützten Einrichtung mehrerer sprachgestützter Einrichtungen einen Befehl von einem Benutzer detektiert. Die Vorrichtung beinhaltet ferner eine Berechnungslogik zum Ermöglichen, dass eine zweite sprachgestützte Einrichtung und eine dritte sprachgestützte Einrichtung Sprache-zu-Nachhall-Modulation-Energieverhältnis(SRMR)-Werte basierend auf dem Befehl berechnen, wobei die Berechnungslogik ferner Nachhallzeiten (RTs) basierend auf den SRMR-Werten schätzen soll. Die Vorrichtung beinhaltet ferner eine Entscheidung-und-Anwendung-Logik zum Durchführen einer Enthallung basierend auf den geschätzten RTs der Nachhalle.
-
公开(公告)号:DE102018128728B4
公开(公告)日:2022-05-05
申请号:DE102018128728
申请日:2018-11-15
Applicant: INTEL CORP
Inventor: CILINGIR GOKCEN , PEARCE DAVID , KUPRYJANOW ADAM , JABER SUHEL , MEYER PAULO LOPEZ
IPC: G10L21/00 , G06F3/16 , G10L21/007 , G10L25/48 , H04R3/00
Abstract: Sicheres Audioakquisitionssystem (600), das Folgendes umfasst:eine Netzschnittstellenschaltungsanordnung (610) zum Empfangen von Audiodaten von einem digitalen Mikrofon (202) ;einen Prozessor (602), der mit der Netzschnittstellenschaltungsanordnung gekoppelt ist;eine oder mehrere Speichervorrichtungen (606, 612), die mit dem Prozessor (602) gekoppelt sind, wobei die eine oder die mehreren Speichervorrichtungen (606, 612) Befehle beinhalten, die, wenn sie durch den Prozessor (602) ausgeführt werden, bewirken, dass das System:die Audiodaten in ein Vollbereichsaudiosignal umwandelt;das Vollbereichsaudiosignal filtert, um eine bandbegrenzte Audioausgabe bereitzustellen, die eine Erfassung von Sprache vermeidet;wobei Befehle zum Filtern des Vollbereichsaudiosignals Befehle zum Filtern des Vollbereichsaudiosignals unter Verwendung eines Filters mit variabler Bandbreite, der einen Abstimmungseingang aufweist, umfassen, wobei die Befehle, wenn sie ausgeführt werden, ferner bewirken, dass das System:das Filter mit variabler Bandbreite unter Verwendung eines ersten Satzes von Parametern abstimmt, um Frequenzbereiche einzuschließen oder auszuschließen, um ein Sprachspektrum von 100 Hz bis 8 kHz teilweise oder vollständig zu vermeiden; undfalls ein Sprachanruf empfangen wird, das Filter mit variabler Bandbreite unter Verwendung eines zweiten Satzes von Parametern abstimmt, um einen vollen Bereich des Frequenzspektrums bei Bedarf zu erlangen, um eine Mehrzweckverwendung zu ermöglichen;wobei der erste Satz von Parametern einen Stets-Hören-Modus auslöst, bei dem verständliche Sprache niemals erfasst wird, und der zweite Satz von Parametern einen Spracherfassungsfähigkeitsmodus auslöst.
-
-
-