DOKUMENTZUGANGSKONTROLLE AUF GRUNDLAGE VON DOKUMENTKOMPONENTEN-LAYOUTS

    公开(公告)号:DE102021128519A1

    公开(公告)日:2022-06-02

    申请号:DE102021128519

    申请日:2021-11-03

    Applicant: IBM

    Abstract: In einem Ansatz zum Bereitstellen einer Dokumentzugangskontrolle auf Grundlage von Dokumentkomponenten-Layouts erfasst ein Prozessor ein Layout eines Dokuments, wobei das Layout eine oder mehrere Komponenten des Dokuments umfasst. Ein Prozessor definiert eine Zugangsrichtlinie für einen Zugang zu der einen oder den mehreren Komponenten auf Grundlage des Layouts. Ein Prozessor autorisiert eine Anforderung für einen Zugang zu der einen oder den mehreren Komponenten auf Grundlage der Zugangsrichtlinie und des Layouts. Ein Prozessor ruft die eine oder die mehreren Komponenten auf Grundlage der Zugangsrichtlinie und der genehmigten Anforderung ab.

    AUTOMATISCHE TRENNUNG UND EXTRAKTION VON TABELLENDATEN UNTER VERWENDUNG VON MASCHINELLEM LERNEN

    公开(公告)号:DE112020005095T5

    公开(公告)日:2022-08-04

    申请号:DE112020005095

    申请日:2020-10-20

    Applicant: IBM

    Abstract: Ein computerrealisiertes Verfahren zum Verwenden eines Modells für maschinelles Lernen (ML), um Tabellendaten automatisch aus einem Bild zu extrahieren, enthält ein Empfangen eines Satzes von Bildern von Tabellendaten und eines Satzes von Markup-Daten, die jeweils den Bildern von Tabellendaten entsprechen. Das Verfahren enthält des Weiteren ein Trainieren eines ersten neuronalen Netzwerks, um die Tabellendaten unter Verwendung der Markup-Daten in Zellen zu trennen, und ein Trainieren eines zweiten neuronalen Netzwerks, um unter Verwendung der Markup-Daten einen Inhalt der Zellen in den Tabellendaten zu ermitteln. Das Verfahren enthält des Weiteren ein Empfangen eines Eingabebildes, das erste Tabellendaten ohne jegliche Markup-Daten enthält, ein Erzeugen einer elektronischen Ausgabe, die den ersten Tabellendaten entspricht, durch ein Ermitteln der Struktur der ersten Tabellendaten unter Verwendung des ersten neuronalen Netzwerks und ein Extrahieren von Inhalt der ersten Tabellendaten unter Verwendung des zweiten neuronalen Netzwerks.

Patent Agency Ranking