-
1.
公开(公告)号:DE102021125859A1
公开(公告)日:2022-05-25
申请号:DE102021125859
申请日:2021-10-05
Applicant: IBM
Inventor: MUNIGALA VITOBHA , SAHA DIPTIKALYAN , KUNDU SATTWATI , ADINARAYAN GEETHA
Abstract: Vorgelegt wird ein System, Computerprogrammprodukt und Verfahren zum Bereitstellen von Konfidenzwerten für Ersatzdaten für Daten mit Problemen, die auf Fehler hinweisen, wobei die Datenprobleme, die Ersatzdaten und die Konfidenzwerte in einer Beziehung zu einer oder mehreren Leistungskennzahlen (Key Performance Metrics, KPls) stehen. Das Verfahren enthält ein Identifizieren einer oder mehrerer potenziell fehlerhafter Dateninstanzen und ein Ermitteln eines oder mehrerer vorhergesagter Ersatzwerte für die potenziell fehlerhaften Dateninstanzen. Das Verfahren enthält des Weiteren ein Ermitteln eines Konfidenzwerts für jeden vorhergesagten Ersatzwert und ein Berichtigen der einen oder der mehreren potenziell fehlerhaften Dateninstanzen mit einem vorhergesagten Ersatzwert des einen oder der mehreren vorhergesagten Ersatzwerte. Das Verfahren enthält außerdem ein Erzeugen einer erläuternden Grundlage für die Berichtigung der einen oder der mehreren potenziell fehlerhaften Dateninstanzen.
-
公开(公告)号:DE112020003820T5
公开(公告)日:2022-05-25
申请号:DE112020003820
申请日:2020-09-22
Applicant: IBM
Inventor: HANS SANDEEP , SHAIKH SAMIULLA ZAKIR HUSSAIN , ANATHANARAYANAN REMA , SAHA DIPTIKALYAN , AGGARWAL ANIYA , SINGH GAGANDEEP , LOHIA PRANAY KUMAR , BHIDE MANISH ANAND , MEHTA SAMEEP
IPC: G06F16/215 , G06F17/18 , G06N5/00
Abstract: Ein durch einen Computer implementiertes Verfahren umfasst Beziehen eines Datensatzes und von Informationen, die eine Domäne des Datensatzes anzeigen; Beziehen von Einschränkungen aus einem domänenindizierten Einschränkungs-Repository auf Grundlage des Datensatzes und der Informationen, wobei das domänenindizierte Einschränkungs-Repository einen Wissensgraphen mit einer Mehrzahl von Knoten aufweist, wobei jeder Knoten ein Attribut, das mindestens einer einer Mehrzahl von Domänen zugeordnet ist, und dem Attribut entsprechende Einschränkungen aufweist; Erkennen von Anomalien in dem Datensatz basierend darauf, ob Teile des Datensatzes die abgerufenen Einschränkungen verletzen; Erzeugen einer Erklärung für jede der Anomalien, die jeweils die den verletzten Einschränkungen entsprechenden Attribute beschreibt; und Ausgeben eines Hinweises auf die Anomalien und der entsprechenden Erklärung.
-