SEMANTISCHES NORMALISIEREN BEIM DIGITALISIEREN VON DOKUMENTEN

    公开(公告)号:DE112018006131T5

    公开(公告)日:2020-08-20

    申请号:DE112018006131

    申请日:2018-11-30

    Applicant: IBM

    Abstract: Ein Verfahren zum Normalisieren eines Schlüssels in einer Dokumentabbildung umfasst Erkennen eines Kandidatenschlüssels, der einem Objekt in einer Dokumentabbildung entspricht, mit einem Schlüssel in Schlüssel-Ontologiedaten auf Grundlage davon, dass der Kandidatenschlüssel semantisch mit dem Schlüssel austauschbar ist. Ein Kontext, eine Position und eine Gestaltungsform von jedem Objekt der Dokumentabbildung sind in den Dokument-Metadaten dargestellt. Der Kandidatenschlüssel wird in eine normale Form normalisiert. Eine Schlüsselklasse, die der normalen Form entspricht, wird ermittelt, und ein Vertrauenswert wird bewertet, der angibt, mit welcher Wahrscheinlichkeit die Schlüsselklasse für den Kandidatenschlüssel repräsentativ ist. Eine semantische Datenbank wird nach Überprüfen mit der Schlüsselklasse aktualisiert, um künftige Dokumente besser zu verarbeiten.

    KOGNITIVE DOKUMENTBILD-DIGITALISIERUNG

    公开(公告)号:DE112018005418T5

    公开(公告)日:2020-07-16

    申请号:DE112018005418

    申请日:2018-11-23

    Applicant: IBM

    Abstract: Dargestellt werden Verfahren, Computerprogrammprodukte und Systeme. Die Verfahren enthalten zum Beispiel: ein Erhalten eines Dokumentbilds mit Objekten und ein Identifizieren von Mikroblöcken, die jedem Objekt entsprechen. Ein Analysieren einer Position eines Mikroblocks auf Kollinearität mit einem anderen Mikroblock auf Grundlage von jeweiligen Positionsmerkmalen und anpassbaren Kollinearitätsparametern. Kollineare Mikroblöcke werden in einem Makroblock definiert, und berechenbare Daten eines Schlüssel-Wert-Paars werden aus dem Makroblock erstellt. Eine heuristische Konfidenzebene ist dem Schlüssel-Wert-Paar zugehörig. Ebenfalls auf Grundlage einer Daten-Clusterbildung kann eine Tabelle klassifiziert und können Daten extrahiert werden.

Patent Agency Ranking