BLOCKWEISE EXTRAKTION VON DOKUMENTMETADATEN

    公开(公告)号:DE112018005616T5

    公开(公告)日:2020-07-09

    申请号:DE112018005616

    申请日:2018-11-23

    Applicant: IBM

    Abstract: Verfahren, Computerprogrammprodukte und Systeme werden dargestellt. Die Verfahren umfassen zum Beispiel: Erhalten eines Dokumentabbilds, wobei das Dokumentabbild eine Mehrzahl von Objekten enthält; Identifizieren einer Mehrzahl von Makroblöcken innerhalb des Dokumentabbilds; Durchführen einer Mikroblockverarbeitung innerhalb von Makroblöcken der Mehrzahl der Makroblöcke, wobei die Mikroblockverarbeitung Prüfen von Inhalt von Mikroblöcken innerhalb eines Makroblocks zur Extraktion von Schlüssel-Wert-Paaren umfasst, wobei das Prüfen von Inhalt Durchführen einer ontologischen Analyse von Mikroblöcken umfasst, wobei die Mikroblockverarbeitung Zuordnen von Vertrauensniveaus zu den extrahierten Schlüssel-Wert-Paaren umfasst; und Ausgeben von Metadaten beruhend auf dem Durchführen einer Mikroblockverarbeitung innerhalb von Makroblöcken der Mehrzahl der Makroblöcke.

Patent Agency Ranking