Festlegen und Übertragen von höheren Klassifikationen

    公开(公告)号:DE102021128428A1

    公开(公告)日:2022-06-02

    申请号:DE102021128428

    申请日:2021-11-02

    Applicant: IBM

    Abstract: Aspekte der vorliegenden Erfindung offenbaren ein Verfahren, Computerprogrammprodukt und System zum Regulieren eines Satzes von Informationsbeständen unter Verwendung eines Information-Governance-Systems. Das Verfahren umfasst einen oder mehrere Prozessoren, die eine oder mehrere höhere Klassifikations-Zuordnungsregeln auf einen oder mehrere Informationsbestände des Satzes von Informationsbeständen anwenden. Darüber hinaus umfasst das Verfahren einen oder mehrere Prozessoren, die eine oder mehrere höhere Klassifikations-Übertragungsregeln auf den einen oder die mehreren Informationsbestände anwendet, die mit den höheren Klassifikationszuordnungen versehenen sind, um die jeweiligen höheren Klassifikationszuordnungen innerhalb einer Einschlusshierarchie, die durch den Satz von Informationsbeständen gebildet wird, nach oben auf einen oder mehrere übergeordnete Informationsbestände des Satzes von Informationsbeständen zu übertragen.

    SORTIEREN VON DATENELEMENTEN EINES BESTIMMTEN SATZES VON DATENELEMENTEN

    公开(公告)号:DE112021001565T5

    公开(公告)日:2022-12-29

    申请号:DE112021001565

    申请日:2021-04-16

    Applicant: IBM

    Abstract: Ein computerrealisiertes Verfahren wird zum Sortieren von Datenelementen eines bestimmten Satzes verwendet. Das Verfahren enthält ein Durchführen einer Bewertung einer ersten Art von Verwendung eines jeden Datenelements. Das Verfahren enthält ein Bestimmen eines Satzes von Datenelement-Kandidaten abhängig von der Bewertung der ersten Art von Verwendung. Das Verfahren enthält ein Durchführen einer Bewertung einer zweiten Art von Verwendung eines jeden Datenelements des Satzes von Datenelement-Kandidaten. Das Verfahren enthält ein Sortieren der Datenelemente des Satzes von Datenelement-Kandidaten abhängig von der Bewertung der zweiten Art von Verwendung eines jeden Datenelements des Satzes von Datenelement-Kandidaten. Das Verfahren enthält ein Bereitstellen der sortierten Datenelemente des Satzes von Datenelement-Kandidaten und als Reaktion hierauf ein Empfangen einer Anforderung einer Datenverarbeitung auf Grundlage der bereitgestellten sortierten Datenelemente des Satzes von Datenelement-Kandidaten.

    ZUFALLSABTASTEN AUS EINER SUCHMASCHINE

    公开(公告)号:DE112020002465T5

    公开(公告)日:2022-02-17

    申请号:DE112020002465

    申请日:2020-07-01

    Applicant: IBM

    Abstract: Die Erfindung betrifft ein Verfahren zum Bereitstellen eines oder mehrerer Zufallsabtastdokumente aus einem Korpus von Dokumenten unter Verwendung einer Suchmaschinenschnittstelle einer Suchmaschine. Das Bereitstellen jedes der Zufallsabtastdokumente weist ein zufälliges Auswählen einer zeitbezogenen Gruppierung (bucket) aus einem Satz von zeitbezogenen Gruppierungen auf. Eine Suchabfrage wird an die Suchmaschinenschnittstelle gesendet und definiert eine Suche nach Dokumenten des Korpus mit Zeitstempeln innerhalb des Zeitfensters, das durch die zufällig ausgewählte zeitbezogene Gruppierung definiert ist. Als Reaktion auf das Senden der Suchabfrage wird von der Suchmaschinenschnittstelle ein Suchergebnis empfangen. Das Suchergebnis weist einen Satz aus allen Dokumenten des Korpus mit Zeitstempeln innerhalb des Zeitfensters auf, das durch die zufällig ausgewählte zeitbezogene Gruppierung definiert ist. Des Weiteren wird eines der Dokumente, aus denen der empfangene Satz von Dokumenten besteht, zufällig ausgewählt.

    MASKIEREN VON SENSIBLEN INFORMATIONEN IN EINEM DOKUMENT

    公开(公告)号:DE102021123058A1

    公开(公告)日:2022-04-21

    申请号:DE102021123058

    申请日:2021-09-07

    Applicant: IBM

    Abstract: Die beispielhaften Ausführungsformen offenbaren ein Verfahren, ein Computerprogrammprodukt und ein Computersystem zum Schutz von sensiblen Informationen. Zu den beispielhaften Ausführungsformen kann ein Verwenden eines invertierten Textindex zum Auswerten von einem oder mehreren statistischen Maßen eines Indextokens des invertierten Textindex, ein Verwenden des einen oder der mehreren statistischen Maße zum Auswählen eines Satzes von Kandidatentoken, ein Entnehmen von Metadaten aus dem invertierten Textindex, ein Zuordnen des Satzes von Kandidatentoken zu jeweiligen Tokenmetadaten, ein Zerlegen von mindestens einem Dokument in Token, was ein oder mehrere Dokumenttoken ergibt, ein Vergleichen des einen oder der mehreren Dokumenttoken mit dem Satz von Kandidatentoken, ein Auswählen eines Satzes von zu maskierenden Dokumenttoken, ein Auswählen von mindestens einem Teil des Satzes von Dokumenttoken, der gemäß den zugehörigen Tokenmetadaten sensible Informationen aufweist, ein Maskieren des mindestens einen Teils des Satzes von Dokumenttoken und ein Bereitstellen von einem oder mehreren maskierten Dokumenten gehören.

    Method and system for data de-duplication

    公开(公告)号:GB2513341A

    公开(公告)日:2014-10-29

    申请号:GB201307333

    申请日:2013-04-23

    Applicant: IBM

    Abstract: Comparison of the quality of matching file formats, so as to store those having higher quality in a file de-deduplication system. A transformation matrix (2C3) indicative of a conversion between the file formats are used, such that on receiving a request to store a first file having a first format, if the second format has a higher quality indicator value than the first format and the second format is convertible to the first format deleting the first file. Otherwise the first file is stored file and on receiving a request to retrieve a file with a file format, if the transformation matrix indicates that the format of the stored file is convertible to the format of the requested file, converting the stored file format to the format of the requested file and sending the converted stored file, or otherwise sending the unconverted stored file. Stored files in different formats may be ranked according to quality, which may be based on sampling rate, resolution, compression ratio and an information richness of the content for a media file or an e-mail format.

Patent Agency Ranking