Verfahren, Programmprodukt, sowie Computersystem zum Fuzzy Matching von phonetischen Mustern bei der Verarbeitung von natürlicher Sprache

    公开(公告)号:DE112018005844B4

    公开(公告)日:2021-11-25

    申请号:DE112018005844

    申请日:2018-10-31

    Applicant: IBM

    Abstract: Verfahren, das aufweist:Extrahieren eines Tokens aus einer Eingabe in natürlicher Sprache;Berechnen eines dem Token entsprechenden phonetischen Musters, wobei das phonetische Muster ein Tonmuster aufweist, das einen Teil des Tokens repräsentiert, wenn das Token gesprochen wird;Erzeugen neuer Daten aus Daten des phonetischen Musters, wobei die neuen Daten eine dem phonetischen Muster entsprechende Silbensequenz aufweisen;Ändern eines Zustands einer Datenspeichereinheit durch Speichern der neuen Daten in einer Matrix aus Silbensequenzen, die dem Token entspricht;Auswählen einer Option, die dem Token entspricht, durch Ausführen eines Fuzzy-Matching-Algorithmus unter Verwendung eines Prozessors und eines Arbeitsspeichers, wobei das Auswählen auf einer Silbensequenz in der Matrix beruht, undModifizieren, um das phonetische Muster zu bilden, eines einem zweiten Token entsprechenden phonetischen Musters in einem phonetischen Repository, wobei das zweite Token dadurch mit dem Token vergleichbar ist, dass es über ein größeres als ein Schwellenausmaß an struktureller Ähnlichkeit mit dem Token verfügt.

    Phonetische Muster zum Fuzzy Matching bei Verarbeitung natürlicher Sprache

    公开(公告)号:DE112018005844T5

    公开(公告)日:2020-08-13

    申请号:DE112018005844

    申请日:2018-10-31

    Applicant: IBM

    Abstract: Ein Token wird aus einer Eingabe in natürlicher Sprache extrahiert. Ein dem Token entsprechendes phonetisches Muster wird berechnet, wobei das phonetische Muster ein Tonmuster enthält, das einen Teil des Tokens repräsentiert, wenn das Token gesprochen wird. Neue Daten werden aus Daten des phonetischen Musters erzeugt, wobei die neuen Daten eine dem phonetischen Muster entsprechende Silbensequenz enthalten. Ein Zustand einer Datenspeichereinheit wird durch ein Speichern der neuen Daten in einer Matrix aus Silbensequenzen geändert, die dem Token entspricht. Eine dem Token entsprechende Option wird ausgewählt, indem ein Fuzzy-Matching-Algorithmus unter Verwendung eines Prozessors und eines Arbeitsspeichers ausgeführt wird, wobei das Auswählen der Option auf einer Silbensequenz in der Matrix beruht.

Patent Agency Ranking