-
公开(公告)号:DE112021001565T5
公开(公告)日:2022-12-29
申请号:DE112021001565
申请日:2021-04-16
Applicant: IBM
Inventor: MAIER ALBERT , GRASSELT MIKE , SAILLET YANNICK , BREMER LARS , BAESSLER MICHAEL
IPC: G06F30/28
Abstract: Ein computerrealisiertes Verfahren wird zum Sortieren von Datenelementen eines bestimmten Satzes verwendet. Das Verfahren enthält ein Durchführen einer Bewertung einer ersten Art von Verwendung eines jeden Datenelements. Das Verfahren enthält ein Bestimmen eines Satzes von Datenelement-Kandidaten abhängig von der Bewertung der ersten Art von Verwendung. Das Verfahren enthält ein Durchführen einer Bewertung einer zweiten Art von Verwendung eines jeden Datenelements des Satzes von Datenelement-Kandidaten. Das Verfahren enthält ein Sortieren der Datenelemente des Satzes von Datenelement-Kandidaten abhängig von der Bewertung der zweiten Art von Verwendung eines jeden Datenelements des Satzes von Datenelement-Kandidaten. Das Verfahren enthält ein Bereitstellen der sortierten Datenelemente des Satzes von Datenelement-Kandidaten und als Reaktion hierauf ein Empfangen einer Anforderung einer Datenverarbeitung auf Grundlage der bereitgestellten sortierten Datenelemente des Satzes von Datenelement-Kandidaten.
-
公开(公告)号:DE112021001986T5
公开(公告)日:2023-01-12
申请号:DE112021001986
申请日:2021-04-16
Applicant: IBM
Inventor: BREMER LARS , ROESNER JONATHAN , FANCONI CLAUDIO , OBERHOFER MARTIN , STECKLER KARIN
IPC: G06F16/215 , G06F16/906
Abstract: Die vorliegende Offenbarung betrifft ein Verfahren, umfassend: Bereitstellen einer Gruppe von einer oder mehreren Aufzeichnungen, wobei jede Aufzeichnung der Gruppe von Aufzeichnungen eine Gruppe von einem oder mehreren Attributen aufweist; Eingeben von Werten der Gruppe von Attributen der Gruppe von Aufzeichnungen in ein trainiertes Datenrepräsentations-Lernmodell, wodurch als eine Ausgabe des trainierten Datenrepräsentationsmodells eine Gruppe von Merkmalsvektoren empfangen wird, welche entsprechend die Gruppe von Aufzeichnungen repräsentiert, und Speichern der Gruppe von Merkmalsvektoren.
-
公开(公告)号:DE102021123058A1
公开(公告)日:2022-04-21
申请号:DE102021123058
申请日:2021-09-07
Applicant: IBM
Inventor: BAESSLER MICHAEL , MAIER ALBERT , GRASSELT MIKE W , SAILLET YANNICK , BREMER LARS
IPC: G06F16/93 , G06F21/62 , G06F40/279
Abstract: Die beispielhaften Ausführungsformen offenbaren ein Verfahren, ein Computerprogrammprodukt und ein Computersystem zum Schutz von sensiblen Informationen. Zu den beispielhaften Ausführungsformen kann ein Verwenden eines invertierten Textindex zum Auswerten von einem oder mehreren statistischen Maßen eines Indextokens des invertierten Textindex, ein Verwenden des einen oder der mehreren statistischen Maße zum Auswählen eines Satzes von Kandidatentoken, ein Entnehmen von Metadaten aus dem invertierten Textindex, ein Zuordnen des Satzes von Kandidatentoken zu jeweiligen Tokenmetadaten, ein Zerlegen von mindestens einem Dokument in Token, was ein oder mehrere Dokumenttoken ergibt, ein Vergleichen des einen oder der mehreren Dokumenttoken mit dem Satz von Kandidatentoken, ein Auswählen eines Satzes von zu maskierenden Dokumenttoken, ein Auswählen von mindestens einem Teil des Satzes von Dokumenttoken, der gemäß den zugehörigen Tokenmetadaten sensible Informationen aufweist, ein Maskieren des mindestens einen Teils des Satzes von Dokumenttoken und ein Bereitstellen von einem oder mehreren maskierten Dokumenten gehören.
-
公开(公告)号:DE112020002892T5
公开(公告)日:2022-03-17
申请号:DE112020002892
申请日:2020-07-24
Applicant: IBM
Inventor: BREMER LARS , BAJPAI UTKARSH , OBERHOFER MARTIN , LUZ XAVIER DA COSTA ALEXANDRE
IPC: G06F16/215 , G06F16/25 , G06F17/18
Abstract: Das Verfahren umfasst: a) Trainieren eines maschinellen Lernmodells unter Verwendung einer aktuellen Menge von gekennzeichneten Datensätzen, wobei jeder der Datenpunkte mehrere Datensätze ist, wobei eine Kennzeichnung eines Datenpunkts eine Klassifizierung des Datenpunkts angibt, wobei das Trainieren zu einem trainierten maschinellen Lernmodell führt, das so konfiguriert ist, dass es einen Datenpunkt als eine gleiche Entität oder verschiedene Entitäten repräsentierend klassifiziert. b) eine Teilmenge von nicht gekennzeichneten Datenpunkten kann aus einer aktuellen Menge von nicht gekennzeichneten Datenpunkten unter Verwendung von Klassifizierungsergebnissen der aktuellen Menge von nicht gekennzeichneten Datenpunkten ausgewählt werden. c) die Teilmenge von nicht gekennzeichneten Datenpunkten kann an einen Klassifikator bereitgestellt werden und in Reaktion auf das Bereitstellen empfangener Kennzeichnungen der Teilmenge von nicht gekennzeichneten Datenpunkten. Die Schritte a) bis c) können unter Verwendung der Teilmenge von gekennzeichneten Datenpunkten zusätzlich zur aktuellen Menge von gekennzeichneten Datenpunkten als aktuelle Menge von gekennzeichneten Datenpunkten wiederholt werden.
-
-
-