-
公开(公告)号:DE112018005418T5
公开(公告)日:2020-07-16
申请号:DE112018005418
申请日:2018-11-23
Applicant: IBM
Inventor: NORTHRUP KEVIN , TRIM CRAIG , KHAMIS BADR , SEHGAL KARAN , PADOLE CHANDRASHEKHAR , ADENIRAN ABISOLA
IPC: G06K9/72
Abstract: Dargestellt werden Verfahren, Computerprogrammprodukte und Systeme. Die Verfahren enthalten zum Beispiel: ein Erhalten eines Dokumentbilds mit Objekten und ein Identifizieren von Mikroblöcken, die jedem Objekt entsprechen. Ein Analysieren einer Position eines Mikroblocks auf Kollinearität mit einem anderen Mikroblock auf Grundlage von jeweiligen Positionsmerkmalen und anpassbaren Kollinearitätsparametern. Kollineare Mikroblöcke werden in einem Makroblock definiert, und berechenbare Daten eines Schlüssel-Wert-Paars werden aus dem Makroblock erstellt. Eine heuristische Konfidenzebene ist dem Schlüssel-Wert-Paar zugehörig. Ebenfalls auf Grundlage einer Daten-Clusterbildung kann eine Tabelle klassifiziert und können Daten extrahiert werden.
-
公开(公告)号:DE112018006131T5
公开(公告)日:2020-08-20
申请号:DE112018006131
申请日:2018-11-30
Applicant: IBM
Inventor: NORTHRUP KEVIN , TRIM CRAIG , HICKEY TERRY , ADENIRAN ABISOLA , NORTHRUP KENJI
IPC: G06F16/31 , G06F16/215 , G06F16/36 , G06F16/93 , G06F40/00 , G06F40/295
Abstract: Ein Verfahren zum Normalisieren eines Schlüssels in einer Dokumentabbildung umfasst Erkennen eines Kandidatenschlüssels, der einem Objekt in einer Dokumentabbildung entspricht, mit einem Schlüssel in Schlüssel-Ontologiedaten auf Grundlage davon, dass der Kandidatenschlüssel semantisch mit dem Schlüssel austauschbar ist. Ein Kontext, eine Position und eine Gestaltungsform von jedem Objekt der Dokumentabbildung sind in den Dokument-Metadaten dargestellt. Der Kandidatenschlüssel wird in eine normale Form normalisiert. Eine Schlüsselklasse, die der normalen Form entspricht, wird ermittelt, und ein Vertrauenswert wird bewertet, der angibt, mit welcher Wahrscheinlichkeit die Schlüsselklasse für den Kandidatenschlüssel repräsentativ ist. Eine semantische Datenbank wird nach Überprüfen mit der Schlüsselklasse aktualisiert, um künftige Dokumente besser zu verarbeiten.
-
公开(公告)号:DE112018005616T5
公开(公告)日:2020-07-09
申请号:DE112018005616
申请日:2018-11-23
Applicant: IBM
Inventor: NORTHRUP KEVIN , TRIM CRAIG , HICKEY TERRY , JAVU THOZAMILE
IPC: G06K9/00
Abstract: Verfahren, Computerprogrammprodukte und Systeme werden dargestellt. Die Verfahren umfassen zum Beispiel: Erhalten eines Dokumentabbilds, wobei das Dokumentabbild eine Mehrzahl von Objekten enthält; Identifizieren einer Mehrzahl von Makroblöcken innerhalb des Dokumentabbilds; Durchführen einer Mikroblockverarbeitung innerhalb von Makroblöcken der Mehrzahl der Makroblöcke, wobei die Mikroblockverarbeitung Prüfen von Inhalt von Mikroblöcken innerhalb eines Makroblocks zur Extraktion von Schlüssel-Wert-Paaren umfasst, wobei das Prüfen von Inhalt Durchführen einer ontologischen Analyse von Mikroblöcken umfasst, wobei die Mikroblockverarbeitung Zuordnen von Vertrauensniveaus zu den extrahierten Schlüssel-Wert-Paaren umfasst; und Ausgeben von Metadaten beruhend auf dem Durchführen einer Mikroblockverarbeitung innerhalb von Makroblöcken der Mehrzahl der Makroblöcke.
-
-