-
公开(公告)号:DE112020002961T5
公开(公告)日:2022-04-07
申请号:DE112020002961
申请日:2020-06-16
Applicant: IBM
Inventor: STAAR PETER WILLEM JAN , DOLFI MICHELE , AUER CHRISTOPH , GEORGOPOULOS LEONIDAS , SOBCZYK ALEKSANDROS , BACCAERT TIM JAN , BEKAS KONSTANTINOS
IPC: G06F16/832 , G06F16/2452 , G06F40/279 , G06N20/00
Abstract: Ein durch einen Computer implementiertes Verfahren zum Erzeugen von Ground Truth für Abfragen in natürlicher Sprache kann ein Bereitstellen eines Wissensgraphen als Datenmodell, ein Empfangen einer Abfrage in natürlicher Sprache von einem Benutzer und ein Übersetzen der Abfrage in natürlicher Sprache in eine formale Datenabfrage umfassen. Außerdem kann das Verfahren ein Sichtbarmachen der formalen Datenabfrage für den Benutzer und ein Empfangen einer Rückmeldungsantwort vom Benutzer umfassen. Die Rückmeldungsantwort kann eine geprüfte und/oder bearbeitet formale Datenabfrage umfassen. Außerdem kann das Verfahren ein Speichern der Abfrage in natürlicher Sprache und der entsprechenden Rückmeldungsantwort als Ground-Truth-Paar umfassen. Ein entsprechendes System und ein zugehöriges Computerprogrammprodukt können bereitgestellt werden.
-
公开(公告)号:DE112021000392T5
公开(公告)日:2022-10-13
申请号:DE112021000392
申请日:2021-01-28
Applicant: IBM
Inventor: STAAR PETER , DOLFI MICHELLE , AUER CHRISTOPH , GEORGOPOULOS LEONIDAS , KAESTNER RALF , VELIZHEV ALEXANDER , NOGUER HIDALGO DAL , KUZNETSOVA RITA , BEKAS KONSTANTINOS
Abstract: Es wird ein computergestütztes Verfahren zum Ermitteln eines Satzes Zielobjekte bereitgestellt, die zum Trainieren einer Anwendung für maschinelles Lernen kommentiert werden sollen. Das Verfahren weist ein Bereitstellen eines Satzes Trainingsdaten mit einem Satz Datenstichproben und eines Auto-Codierers mit einem Klassifizierer auf. Der Auto-Codierer weist ein Einbettungsmodell auf, das den Satz Datenstichproben auf einen Satz komprimierter Merkmalsvektoren abbildet. Durch den Satz komprimierter Merkmalsvektoren ist eine Matrix komprimierter Merkmale definiert. Weiterhin werden bereitgestellt: eine Definition eines der Matrix komprimierter Merkmale zugehörigen Graphen, ein Anwenden eines Cluster-Algorithmus zum Erkennen von Knotenclustern des Graphen und ein Anwenden eines Zentralitäts-Algorithmus zum Erkennen von zentralen Knoten der Knotencluster, ein Abrufen von Knotenmarkierungen für die zentralen Knoten von einem Kommentator, ein Weiterleiten der kommentierten Knotenmarkierungen an andere Knoten des Graphen und ein Durchführen eines Trainings des Einbettungsmodells und des Klassifizierers mit den kommentierten und weitergeleiteten Knotenmarkierungen.
-
公开(公告)号:AU2021231419A1
公开(公告)日:2022-08-25
申请号:AU2021231419
申请日:2021-01-28
Applicant: IBM
Inventor: STAAR PETER , DOLFI MICHELLE , AUER CHRISTOPH , GEORGOPOULOS LEONIDAS , KAESTNER RALF , VELIZHEV ALEXANDER , NOGUER HIDALGO DAL , KUZNETSOVA RITA , BEKAS KONSTANTINOS
IPC: G06K9/00
Abstract: A computer-implemented method for determining a set of target items to be annotated for training a machine learning application. The method comprises providing a training data set with a set of data samples and an auto-encoder with a classifier. The auto-encoder comprises an embedding model that maps the set of data samples to a set of compressed feature vectors. The set of compressed feature vectors define a compressed feature matrix. Further provided are: a definition of a graph associated to the compressed feature matrix, applying a clustering-algorithm to identify node clusters of the graph and applying a centrality algorithm to identify central nodes of the node clusters, retrieving from an annotator node labels for the central nodes, propagating the annotated node labels to other nodes of the graph and performing a training of the embedding model and the classifier with the annotated and the propagated node labels.
-
公开(公告)号:AU2021229659A1
公开(公告)日:2022-08-25
申请号:AU2021229659
申请日:2021-01-27
Applicant: IBM
Inventor: STAAR PETER , DOLFI MICHELE , AUER CHRISTOPH , GEORGOPOULOS LEONIDAS , BEKAS KONSTANTINOS
Abstract: A computer-implemented method for processing a digital image. The digital image comprises one or more text cells, wherein each of the one or more text cells comprises a string and a bounding box. The method comprises receiving the digital image in a first format, the first format providing access to the strings and the bounding boxes of the one more text cells. The methods further comprises encoding the strings of the one or more text cells as visual pattern according to a predefined string encoding scheme and providing the digital image in a second format. The second format comprises the visual pattern of the strings of the one or more text cells. A corresponding system and a related computer program product is provided.
-
公开(公告)号:DE112021000371T5
公开(公告)日:2022-11-03
申请号:DE112021000371
申请日:2021-01-27
Applicant: IBM
Inventor: STAAR PETER , DOLFI MICHELE , AUER CHRISTOPH , GEORGOPOULOS LEONIDAS , BEKAS KONSTANTINOS
IPC: G06T9/00
Abstract: Computergestütztes Verfahren zum Bearbeiten eines digitalen Bildes. Das digitale Bild weist eine oder mehrere Textzellen auf, wobei jede der einen oder mehreren Textzellen eine Zeichenfolge und eine Umrahmung aufweist. Das Verfahren weist ein Empfangen des digitalen Bildes in einem ersten Format auf, wobei das erste Format einen Zugriff auf die Zeichenfolgen und die Umrahmungen der einen oder mehreren Textzellen bereitstellt. Ferner weisen die Verfahren ein Codieren der Zeichenfolgen der einen oder mehreren Textzellen als visuelles Muster gemäß einem vorgegebenen Zeichenfolgen-Codierungsschema und ein Bereitstellen des digitalen Bildes in einem zweiten Format auf. Das zweite Format weist das visuelle Muster der Zeichenfolgen der einen oder mehreren Textzellen auf. Es werden ein entsprechendes System und ein zugehöriges Computerprogrammprodukt bereitgestellt.
-
-
-
-