FESTSTELLEN UND WIEDERHERSTELLEN VON AUSSERHALB DES WORTSCHATZES LIEGENDEN WÖRTERN IN SPRACHE-ZU-TEXT-TRANSKRIPTIONSSYSTEMEN

    公开(公告)号:DE112020004348T5

    公开(公告)日:2022-05-25

    申请号:DE112020004348

    申请日:2020-09-10

    Applicant: IBM

    Abstract: Aspekte der vorliegenden Offenbarung beschreiben Methoden zum Identifizieren und Wiederherstellen von außerhalb des Wortschatzes liegenden Wörtern in Transkripten einer Sprachdatenaufzeichnung unter Verwendung von Spracherkennungsmodellen und Wortteileinheiten-Erkennungsmodellen. Ein Beispielverfahren enthält im Allgemeinen ein Empfangen einer Sprachdatenaufzeichnung für eine Transkription in eine Textdarstellung der Sprachdatenaufzeichnung. Die Sprachdatenaufzeichnung wird unter Verwendung eines Worterkennungsmodells in die Textdarstellung transkribiert. Ein unbekanntes Wort wird in der Textdarstellung identifiziert, und das unbekannte Wort wird auf Grundlage einer Erkennung von Teileinheiten des unbekannten Wortes rekonstruiert, die durch ein Teileinheiten-Erkennungsmodell erzeugt werden. Die Textdarstellung der Sprachdatenaufzeichnung wird modifiziert, indem das unbekannte Wort durch die Rekonstruktion des unbekannten Wortes ersetzt wird, und die modifizierte Textdarstellung wird ausgegeben.

    MULTIMODALE LUNGENKAPAZITÄTSMESSUNG ZUR PROGNOSE EINER ATEMWEGSERKRANKUNG

    公开(公告)号:DE102021123127A1

    公开(公告)日:2022-04-14

    申请号:DE102021123127

    申请日:2021-09-07

    Applicant: IBM

    Abstract: Ein Bestimmen einer Lungenkapazität umfasst ein Erfassen einer Audio-Wellenform des Benutzers, der eine Sprachäußerung ausführt, die einem Benutzer vorgegeben wird. Ein Video von dem Benutzer, der die Sprachäußerung ausführt, kann erfasst werden. Die erfasste Audio-Wellenform und das Video werden auf Konformität analysiert. Auf Grundlage der Audio-Wellenform wird ein Indikator für eine Atmungsfunktion bestimmt. Der Indikator wird mit einem Referenzindikator zum Bestimmen der Gesundheit des Benutzers verglichen. Ein Maschinenlernmodell, wie beispielsweise ein neuronales Netzwerk, kann geschult werden, um den Indikator der Atmungsfunktion auf Grundlage von Eingabemerkmalen zu prognostizieren, die Audiospektrums- und zeitliche Eigenschaften von Sprachäußerungen aufweisen. Ein Bestimmen des Indikators für eine Atmungsfunktion kann ein Ausführen des geschulten Maschinenlernmodells umfassen.

Patent Agency Ranking