LEISTUNGSFÄHIGES KOMMENTIEREN DER GRUNDWAHRHEIT

    公开(公告)号:DE112021000392T5

    公开(公告)日:2022-10-13

    申请号:DE112021000392

    申请日:2021-01-28

    Applicant: IBM

    Abstract: Es wird ein computergestütztes Verfahren zum Ermitteln eines Satzes Zielobjekte bereitgestellt, die zum Trainieren einer Anwendung für maschinelles Lernen kommentiert werden sollen. Das Verfahren weist ein Bereitstellen eines Satzes Trainingsdaten mit einem Satz Datenstichproben und eines Auto-Codierers mit einem Klassifizierer auf. Der Auto-Codierer weist ein Einbettungsmodell auf, das den Satz Datenstichproben auf einen Satz komprimierter Merkmalsvektoren abbildet. Durch den Satz komprimierter Merkmalsvektoren ist eine Matrix komprimierter Merkmale definiert. Weiterhin werden bereitgestellt: eine Definition eines der Matrix komprimierter Merkmale zugehörigen Graphen, ein Anwenden eines Cluster-Algorithmus zum Erkennen von Knotenclustern des Graphen und ein Anwenden eines Zentralitäts-Algorithmus zum Erkennen von zentralen Knoten der Knotencluster, ein Abrufen von Knotenmarkierungen für die zentralen Knoten von einem Kommentator, ein Weiterleiten der kommentierten Knotenmarkierungen an andere Knoten des Graphen und ein Durchführen eines Trainings des Einbettungsmodells und des Klassifizierers mit den kommentierten und weitergeleiteten Knotenmarkierungen.

    Efficient ground truth annotation

    公开(公告)号:AU2021231419A1

    公开(公告)日:2022-08-25

    申请号:AU2021231419

    申请日:2021-01-28

    Applicant: IBM

    Abstract: A computer-implemented method for determining a set of target items to be annotated for training a machine learning application. The method comprises providing a training data set with a set of data samples and an auto-encoder with a classifier. The auto-encoder comprises an embedding model that maps the set of data samples to a set of compressed feature vectors. The set of compressed feature vectors define a compressed feature matrix. Further provided are: a definition of a graph associated to the compressed feature matrix, applying a clustering-algorithm to identify node clusters of the graph and applying a centrality algorithm to identify central nodes of the node clusters, retrieving from an annotator node labels for the central nodes, propagating the annotated node labels to other nodes of the graph and performing a training of the embedding model and the classifier with the annotated and the propagated node labels.

Patent Agency Ranking