SORTIEREN VON DATENELEMENTEN EINES BESTIMMTEN SATZES VON DATENELEMENTEN

    公开(公告)号:DE112021001565T5

    公开(公告)日:2022-12-29

    申请号:DE112021001565

    申请日:2021-04-16

    Applicant: IBM

    Abstract: Ein computerrealisiertes Verfahren wird zum Sortieren von Datenelementen eines bestimmten Satzes verwendet. Das Verfahren enthält ein Durchführen einer Bewertung einer ersten Art von Verwendung eines jeden Datenelements. Das Verfahren enthält ein Bestimmen eines Satzes von Datenelement-Kandidaten abhängig von der Bewertung der ersten Art von Verwendung. Das Verfahren enthält ein Durchführen einer Bewertung einer zweiten Art von Verwendung eines jeden Datenelements des Satzes von Datenelement-Kandidaten. Das Verfahren enthält ein Sortieren der Datenelemente des Satzes von Datenelement-Kandidaten abhängig von der Bewertung der zweiten Art von Verwendung eines jeden Datenelements des Satzes von Datenelement-Kandidaten. Das Verfahren enthält ein Bereitstellen der sortierten Datenelemente des Satzes von Datenelement-Kandidaten und als Reaktion hierauf ein Empfangen einer Anforderung einer Datenverarbeitung auf Grundlage der bereitgestellten sortierten Datenelemente des Satzes von Datenelement-Kandidaten.

    Verfahren und System zum Verarbeiten von Datenaufzeichnungen

    公开(公告)号:DE112021001986T5

    公开(公告)日:2023-01-12

    申请号:DE112021001986

    申请日:2021-04-16

    Applicant: IBM

    Abstract: Die vorliegende Offenbarung betrifft ein Verfahren, umfassend: Bereitstellen einer Gruppe von einer oder mehreren Aufzeichnungen, wobei jede Aufzeichnung der Gruppe von Aufzeichnungen eine Gruppe von einem oder mehreren Attributen aufweist; Eingeben von Werten der Gruppe von Attributen der Gruppe von Aufzeichnungen in ein trainiertes Datenrepräsentations-Lernmodell, wodurch als eine Ausgabe des trainierten Datenrepräsentationsmodells eine Gruppe von Merkmalsvektoren empfangen wird, welche entsprechend die Gruppe von Aufzeichnungen repräsentiert, und Speichern der Gruppe von Merkmalsvektoren.

    MASKIEREN VON SENSIBLEN INFORMATIONEN IN EINEM DOKUMENT

    公开(公告)号:DE102021123058A1

    公开(公告)日:2022-04-21

    申请号:DE102021123058

    申请日:2021-09-07

    Applicant: IBM

    Abstract: Die beispielhaften Ausführungsformen offenbaren ein Verfahren, ein Computerprogrammprodukt und ein Computersystem zum Schutz von sensiblen Informationen. Zu den beispielhaften Ausführungsformen kann ein Verwenden eines invertierten Textindex zum Auswerten von einem oder mehreren statistischen Maßen eines Indextokens des invertierten Textindex, ein Verwenden des einen oder der mehreren statistischen Maße zum Auswählen eines Satzes von Kandidatentoken, ein Entnehmen von Metadaten aus dem invertierten Textindex, ein Zuordnen des Satzes von Kandidatentoken zu jeweiligen Tokenmetadaten, ein Zerlegen von mindestens einem Dokument in Token, was ein oder mehrere Dokumenttoken ergibt, ein Vergleichen des einen oder der mehreren Dokumenttoken mit dem Satz von Kandidatentoken, ein Auswählen eines Satzes von zu maskierenden Dokumenttoken, ein Auswählen von mindestens einem Teil des Satzes von Dokumenttoken, der gemäß den zugehörigen Tokenmetadaten sensible Informationen aufweist, ein Maskieren des mindestens einen Teils des Satzes von Dokumenttoken und ein Bereitstellen von einem oder mehreren maskierten Dokumenten gehören.

    AKTIVES LERNEN FÜR DEN DATENABGLEICH

    公开(公告)号:DE112020002892T5

    公开(公告)日:2022-03-17

    申请号:DE112020002892

    申请日:2020-07-24

    Applicant: IBM

    Abstract: Das Verfahren umfasst: a) Trainieren eines maschinellen Lernmodells unter Verwendung einer aktuellen Menge von gekennzeichneten Datensätzen, wobei jeder der Datenpunkte mehrere Datensätze ist, wobei eine Kennzeichnung eines Datenpunkts eine Klassifizierung des Datenpunkts angibt, wobei das Trainieren zu einem trainierten maschinellen Lernmodell führt, das so konfiguriert ist, dass es einen Datenpunkt als eine gleiche Entität oder verschiedene Entitäten repräsentierend klassifiziert. b) eine Teilmenge von nicht gekennzeichneten Datenpunkten kann aus einer aktuellen Menge von nicht gekennzeichneten Datenpunkten unter Verwendung von Klassifizierungsergebnissen der aktuellen Menge von nicht gekennzeichneten Datenpunkten ausgewählt werden. c) die Teilmenge von nicht gekennzeichneten Datenpunkten kann an einen Klassifikator bereitgestellt werden und in Reaktion auf das Bereitstellen empfangener Kennzeichnungen der Teilmenge von nicht gekennzeichneten Datenpunkten. Die Schritte a) bis c) können unter Verwendung der Teilmenge von gekennzeichneten Datenpunkten zusätzlich zur aktuellen Menge von gekennzeichneten Datenpunkten als aktuelle Menge von gekennzeichneten Datenpunkten wiederholt werden.

Patent Agency Ranking