MESSEN DER DATENQUALITÄT VON DATEN IN EINER GRAPHENDATENBANK

    公开(公告)号:DE102021123578A1

    公开(公告)日:2022-05-05

    申请号:DE102021123578

    申请日:2021-09-13

    Applicant: IBM

    Abstract: Verfahren, Computerprogrammprodukte und/oder Systeme werden bereitgestellt, die die folgenden Operationen durchführen: Erhalten eines ersten Graphen, der erste Knoten aufweist, die erste Entitäten und erste Kanten darstellen, die Beziehungen zwischen ersten Entitäten darstellen, wobei die ersten Knoten ersten Entitätenattributen zugehörig sind, die die ersten Entitäten beschreiben, die durch die ersten Knoten dargestellt werden, wobei die ersten Kanten ersten Kantenattributen zugehörig sind, die die Beziehungen beschreiben, die durch die ersten Kanten dargestellt werden; Ermitteln eines ersten Teilgraphen für einen bestimmten Knoten der ersten Knoten des ersten Graphen, wobei der erste Teilgraph den bestimmten Knoten und mindestens einen benachbarten Knoten des bestimmten Knotens umfasst; und Ermitteln eines Datenqualitätsproblems in Bezug auf den bestimmten Knoten mindestens teilweise auf der Grundlage des Anwendens einer oder mehrerer anwendbarer Regeln einer Menge von Datenqualitätsregeln auf erste Entitätsattributwerte und erste Kantenattributwerte des ersten Teilgraphen.

    MASKIEREN VON SENSIBLEN INFORMATIONEN IN EINEM DOKUMENT

    公开(公告)号:DE102021123058A1

    公开(公告)日:2022-04-21

    申请号:DE102021123058

    申请日:2021-09-07

    Applicant: IBM

    Abstract: Die beispielhaften Ausführungsformen offenbaren ein Verfahren, ein Computerprogrammprodukt und ein Computersystem zum Schutz von sensiblen Informationen. Zu den beispielhaften Ausführungsformen kann ein Verwenden eines invertierten Textindex zum Auswerten von einem oder mehreren statistischen Maßen eines Indextokens des invertierten Textindex, ein Verwenden des einen oder der mehreren statistischen Maße zum Auswählen eines Satzes von Kandidatentoken, ein Entnehmen von Metadaten aus dem invertierten Textindex, ein Zuordnen des Satzes von Kandidatentoken zu jeweiligen Tokenmetadaten, ein Zerlegen von mindestens einem Dokument in Token, was ein oder mehrere Dokumenttoken ergibt, ein Vergleichen des einen oder der mehreren Dokumenttoken mit dem Satz von Kandidatentoken, ein Auswählen eines Satzes von zu maskierenden Dokumenttoken, ein Auswählen von mindestens einem Teil des Satzes von Dokumenttoken, der gemäß den zugehörigen Tokenmetadaten sensible Informationen aufweist, ein Maskieren des mindestens einen Teils des Satzes von Dokumenttoken und ein Bereitstellen von einem oder mehreren maskierten Dokumenten gehören.

Patent Agency Ranking