Garantieren der Anonymität von Linked Data-Graphen

    公开(公告)号:DE112014000976T5

    公开(公告)日:2015-12-31

    申请号:DE112014000976

    申请日:2014-04-08

    Applicant: IBM

    Abstract: Ein Verfahren, System und Computerprogrammprodukt zum Umwandeln eines Linked Data-Graphen in einen entsprechenden anonymisierten Linked Data-Graphen, bei dem die Semantik bewahrt bleibt und Verknüpfungen verfolgt werden können, um den anonymen Graphen bis zu r-mal zu erweitern, ohne die Anonymität zu verletzen (d. h. Anonymität bei r-Dereferenzierbarkeit). Ein Anonymisieren eines Linked Data-Graphen bei r-Dereferenzierbarkeit stellt Vertraulichkeitsgarantien von Varianten der k-Anonymität oder l-Diversität bereit, wobei die umfangreiche Semantik des Graphen berücksichtigt wird und bewahrt bleibt.

    DATEN-DEIDENTIFIKATION AUF DER GRUNDLAGE EINES ERKENNENS VON ZULÄSSIGEN KONFIGURATIONEN FÜR DATEN-DEIDENTIFIKATIONSPROZESSE

    公开(公告)号:DE112018005725T5

    公开(公告)日:2020-08-20

    申请号:DE112018005725

    申请日:2018-11-29

    Applicant: IBM

    Abstract: Ein System zum Deidentifizieren von Daten ermittelt einen oder mehrere Identifikatoren, die eine Entität eines Datensatzes identifizieren. Ein oder mehrere Daten-Deidentifikationsprozesse werden identifiziert und dem einen oder den mehreren ermittelten Identifikatoren zugewiesen. Jedem Daten-Deidentifikationsprozess werden ein oder mehrere Sätze von Konfigurationsoptionen zugewiesen, die Informationen angeben, die in dem Datensatz zu bewahren sind. Die identifizierten Daten-Deidentifikationsprozesse werden an dem Datensatz gemäß den zugehörigen Sätzen von Konfigurationsoptionen ausgeführt, um Datensätze mit unterschiedlichen bewahrten Informationen zu erstellen. Die erstellten Datensätze werden auf Datenschutz-Schwachstellen hin ausgewertet, und auf der Grundlage der Auswertung werden ein Daten-Deidentifikationsprozess und ein zugehöriger Satz von Konfigurationsoptionen ausgewählt. Der ausgewählte Daten-Deidentifikationsprozess wird an dem Datensatz gemäß dem zugehörigen Satz von Konfigurationsoptionen ausgeführt, um einen sich ergebenden deidentifizierten Datensatz zu erzeugen. Zu Ausführungsformen gehören ein Verfahren und ein Computerprogrammprodukt zum Deidentifizieren von Daten in im Wesentlichen derselben Weise wie oben beschrieben.

    Method and system for mining patterns in a dataset

    公开(公告)号:GB2525572A

    公开(公告)日:2015-11-04

    申请号:GB201320016

    申请日:2013-11-13

    Applicant: IBM

    Abstract: A computer implemented method for accessing data in a database system (100), the database system (100) comprising a receiver module (129), pattern module (131) and an analysis module (133). The method comprises: receiving, by the receiver module (129), from a first user, a first query for a dataset stored in the database system (100); providing, by the pattern module (131), a first set of patterns in the dataset, and providing for each pattern in the first set of patterns a significance value in response to the received first query; providing, by the pattern module (131), a set of tags for flagging a pattern of the first set of patterns the set of tags indicating at least two data categories describing the pattern; receiving, by the receiver module (129), from the first user, input information indicating tags of at least a first subset of patterns of the first set of patterns, wherein each tag of the tags is selected from the set of tags; adjusting, by the analysis module (133), the significance values of the first subset of patterns based on the tags.

    Verfahren und System zum Mining von Mustern in einem Datensatz

    公开(公告)号:DE102014116117B4

    公开(公告)日:2020-06-18

    申请号:DE102014116117

    申请日:2014-11-05

    Applicant: IBM

    Abstract: Durch Computer realisiertes Verfahren zum Zugreifen auf Daten in einem Datenbanksystem (100), wobei das Datenbanksystem (100) ein Empfangsmodul (129), ein Mustermodul (131) und ein Analysemodul (133) aufweist, wobei das Verfahren aufweist:- Empfangen einer ersten Abfrage von einem ersten Benutzer nach einem in dem Datenbanksystem (100) gespeicherten Datensatz mithilfe des Empfangsmoduls (129);- als Reaktion auf die empfangene erste Abfrage, Bereitstellen einer ersten Menge von Mustern (Muster_1 bis Muster_n) in der Datenbank mithilfe des Mustermoduls (131), mit entsprechenden ersten Signifikanzwerten;- Bereitstellen, mithilfe des Mustermoduls (131), einer Menge von Markierungen (Markierung_1 bis Markierung_3) zum Markieren eines ersten Musters aus der ersten Menge von Mustern (Muster_1 bis Muster_n), wobei die Menge von Markierungen (Markierung_1 bis Markierung_3) mindestens zwei das Muster beschreibende Datenkategorien anzeigt;- Empfangen eingegebener Informationen von dem ersten Benutzer mithilfe des Empfangsmoduls (129), die Markierungen von mindestens einer ersten Teilmenge von Mustern (Muster_1 bis Muster_m) der ersten Menge von Mustern (Muster_1 bis Muster_n) anzeigen, wobei die Markierungen aus der Menge von Markierungen (Markierung_1 bis Markierung_3) ausgewählt sind;- Anpassen der ersten Signifikanzwerte der ersten Teilmenge von Mustern (Muster_1 bis Muster_m) auf Grundlage der Markierungen mithilfe des Analysemoduls (133);- Empfangen einer zweiten Abfrage nach dem Datensatz in dem Datenbanksystem (100) von einem zweiten Benutzer;- Bereitstellen einer zweiten Menge von Mustern (Muster_m - 5 bis Muster_v) mit entsprechenden Signifikanzwerten in der Datenbank als Reaktion auf die empfangene zweite Abfrage;- Empfangen von eingegebenen Informationen von dem zweiten Benutzer, die Markierungen mindestens einer zweiten Teilmenge (Muster_m - 9 bis Muster_m + 6) von Mustern aus der zweiten Menge von Mustern (Muster_m - 5 bis Muster_v) anzeigen;- Ermitteln einer Anzahl identischer Muster (Muster_m - 5 bis Muster_m), die mit derselben Markierung markiert sind, in der ersten (Muster_1 bis Muster_m) und zweiten (Muster_m - 9 bis Muster_m + 6) Teilmenge;- als Reaktion auf eine Feststellung, dass die Anzahl identischer Muster höher als ein vorgegebener Ähnlichkeits-Schwellenwert ist, Zuweisen, zu jedem Muster aus den identischen Mustern (Muster_m - 5 bis Muster_m) und zu sowohl dem ersten als auch dem zweiten Benutzer, einer gemeinsamen Menge von Markierungszählern, die jeweils der Menge von Markierungen (Markierung_1 bis Markierung_3) entsprechen, wobei die gemeinsame Menge von Markierungszählern eine Kombination aus entsprechenden Mengen von Markierungszählern ist, die separat dem ersten und zweiten Benutzer zugewiesen werden; und- Anpassen der Signifikanzwerte der identischen Muster (Muster_m - 5 bis Muster_m) mithilfe der gemeinsamen Markierungszähler.

    Guaranteeing anonymity of linked data graphs

    公开(公告)号:GB2529345A

    公开(公告)日:2016-02-17

    申请号:GB201520404

    申请日:2014-04-08

    Applicant: IBM

    Abstract: A method, system and computer program product for transforming a Linked Data graph into a corresponding anonymous Linked Data graph, in which semantics is preserved and links can be followed to expand the anonymous graph up to r times without breaching anonymity (i.e., anonymity under r-dereferenceability). Anonymizing a Linked Data graph under r- dereferenceability provides privacy guarantees of ^-anonymity or /-diversity variants, while taking into account and preserving the rich semantics of the graph.

    Verfahren und System zum Mining von Mustern in einem Datensatz

    公开(公告)号:DE102014116117A1

    公开(公告)日:2015-05-13

    申请号:DE102014116117

    申请日:2014-11-05

    Applicant: IBM

    Abstract: Die vorliegende Erfindung betrifft ein durch Computer realisiertes Verfahren zum Zugreifen auf Daten in einem Datenbanksystem (100), wobei das Datenbanksystem (100) ein Empfangsmodul (129), ein Mustermodul (131) und ein Analysemodul (133) aufweist. Das Verfahren weist ein Empfangen einer ersten Abfrage von einem ersten Benutzer nach einem in dem Datenbanksystem (100) gespeicherten Datensatz durch das Empfangsmodul (129) auf; ein Bereitstellen einer ersten Menge von Mustern in dem Datensatz mithilfe des Mustermoduls (131) und ein Bereitstellen eines Signifikanzwerts für jedes Muster in der ersten Menge von Mustern als Reaktion auf die empfangene erste Abfrage; ein Bereitstellen, mithilfe des Mustermoduls (131), einer Menge von Markierungen (Markierung_1 bis Markierung_3) zum Markieren eines Musters aus der ersten Menge von Mustern (Muster_1 bis Muster_n), wobei die Menge von Markierungen (Markierung_1 bis Markierung_3) mindestens zwei das Muster beschreibende Datenkategorien anzeigt; ein Empfangen eingegebener Informationen von dem ersten Benutzer mithilfe des Empfangsmoduls (129), die Markierungen mindestens einer ersten Teilmenge von Mustern (Muster_1 bis Muster_m) aus der ersten Menge von Mustern (Muster_1 bis Muster_n) anzeigen, wobei jede Markierung aus den Markierungen aus der Menge von Markierungen (Markierung_1 bis Markierung_3) ausgewählt ist; ein Anpassen der Signifikanzwerte der ersten Teilmenge von Mustern (Muster_1 bis Muster_m) auf Grundlage der Markierungen mithilfe des Analysemoduls (133).

Patent Agency Ranking