DIGITALE BILDBEARBEITUNG
    2.
    发明专利

    公开(公告)号:DE112021000371T5

    公开(公告)日:2022-11-03

    申请号:DE112021000371

    申请日:2021-01-27

    Applicant: IBM

    Abstract: Computergestütztes Verfahren zum Bearbeiten eines digitalen Bildes. Das digitale Bild weist eine oder mehrere Textzellen auf, wobei jede der einen oder mehreren Textzellen eine Zeichenfolge und eine Umrahmung aufweist. Das Verfahren weist ein Empfangen des digitalen Bildes in einem ersten Format auf, wobei das erste Format einen Zugriff auf die Zeichenfolgen und die Umrahmungen der einen oder mehreren Textzellen bereitstellt. Ferner weisen die Verfahren ein Codieren der Zeichenfolgen der einen oder mehreren Textzellen als visuelles Muster gemäß einem vorgegebenen Zeichenfolgen-Codierungsschema und ein Bereitstellen des digitalen Bildes in einem zweiten Format auf. Das zweite Format weist das visuelle Muster der Zeichenfolgen der einen oder mehreren Textzellen auf. Es werden ein entsprechendes System und ein zugehöriges Computerprogrammprodukt bereitgestellt.

    LEISTUNGSFÄHIGES KOMMENTIEREN DER GRUNDWAHRHEIT

    公开(公告)号:DE112021000392T5

    公开(公告)日:2022-10-13

    申请号:DE112021000392

    申请日:2021-01-28

    Applicant: IBM

    Abstract: Es wird ein computergestütztes Verfahren zum Ermitteln eines Satzes Zielobjekte bereitgestellt, die zum Trainieren einer Anwendung für maschinelles Lernen kommentiert werden sollen. Das Verfahren weist ein Bereitstellen eines Satzes Trainingsdaten mit einem Satz Datenstichproben und eines Auto-Codierers mit einem Klassifizierer auf. Der Auto-Codierer weist ein Einbettungsmodell auf, das den Satz Datenstichproben auf einen Satz komprimierter Merkmalsvektoren abbildet. Durch den Satz komprimierter Merkmalsvektoren ist eine Matrix komprimierter Merkmale definiert. Weiterhin werden bereitgestellt: eine Definition eines der Matrix komprimierter Merkmale zugehörigen Graphen, ein Anwenden eines Cluster-Algorithmus zum Erkennen von Knotenclustern des Graphen und ein Anwenden eines Zentralitäts-Algorithmus zum Erkennen von zentralen Knoten der Knotencluster, ein Abrufen von Knotenmarkierungen für die zentralen Knoten von einem Kommentator, ein Weiterleiten der kommentierten Knotenmarkierungen an andere Knoten des Graphen und ein Durchführen eines Trainings des Einbettungsmodells und des Klassifizierers mit den kommentierten und weitergeleiteten Knotenmarkierungen.

    Efficient ground truth annotation

    公开(公告)号:AU2021231419A1

    公开(公告)日:2022-08-25

    申请号:AU2021231419

    申请日:2021-01-28

    Applicant: IBM

    Abstract: A computer-implemented method for determining a set of target items to be annotated for training a machine learning application. The method comprises providing a training data set with a set of data samples and an auto-encoder with a classifier. The auto-encoder comprises an embedding model that maps the set of data samples to a set of compressed feature vectors. The set of compressed feature vectors define a compressed feature matrix. Further provided are: a definition of a graph associated to the compressed feature matrix, applying a clustering-algorithm to identify node clusters of the graph and applying a centrality algorithm to identify central nodes of the node clusters, retrieving from an annotator node labels for the central nodes, propagating the annotated node labels to other nodes of the graph and performing a training of the embedding model and the classifier with the annotated and the propagated node labels.

    Digital image processing
    5.
    发明专利

    公开(公告)号:AU2021229659A1

    公开(公告)日:2022-08-25

    申请号:AU2021229659

    申请日:2021-01-27

    Applicant: IBM

    Abstract: A computer-implemented method for processing a digital image. The digital image comprises one or more text cells, wherein each of the one or more text cells comprises a string and a bounding box. The method comprises receiving the digital image in a first format, the first format providing access to the strings and the bounding boxes of the one more text cells. The methods further comprises encoding the strings of the one or more text cells as visual pattern according to a predefined string encoding scheme and providing the digital image in a second format. The second format comprises the visual pattern of the strings of the one or more text cells. A corresponding system and a related computer program product is provided.

Patent Agency Ranking