Multiplex classification for tabular data compression

    公开(公告)号:GB2515428A

    公开(公告)日:2014-12-24

    申请号:GB201417927

    申请日:2013-03-13

    Applicant: IBM

    Abstract: For multiplexer classification for column compression of tabular data, Similar type data segments are classified into classes for grouping the data segments into compression streams associated with each one of the classes. The compression streams are encoded based on a class-specific optimized encoding operation. The compression streams into one output buffer, wherein the compression streams are extracted.

    ERFASSUNG VON TABELLENGRENZEN IN DATENBLÖCKEN ZUR KOMPRESSION

    公开(公告)号:DE102013205738A1

    公开(公告)日:2013-10-17

    申请号:DE102013205738

    申请日:2013-04-02

    Applicant: IBM

    Abstract: Daten werden unter Verwendung eines Suffixbaums in eine minimierte Datendarstellung umgesetzt durch Sortieren von Datenströmen gemäß symbolischen Darstellungen zum Bilden von Tabellengrenzen-Erzeugungsmustern. Die umgesetzten Daten sind für eine Rekonstruktion vollständig umkehrbar, während minimale Vorsatzinformationen gesichert werden.

    Multiplex-Klassifizierung zum Komprimieren von Tabellendaten

    公开(公告)号:DE112013000734T5

    公开(公告)日:2014-11-13

    申请号:DE112013000734

    申请日:2013-03-13

    Applicant: IBM

    Abstract: Für eine Multiplex-Klassifizierung zum Spaltenkomprimieren von Tabellendaten werden Datensegmente ähnlichen Typs in Klassen klassifiziert, um die Datensegmente in Komprimierungsdatenströmen zu gruppieren, die jeder der Klassen zugehörig sind. Die Komprimierungsdatenströme werden auf der Grundlage einer klassenspezifischen optimierten Codieroperation codiert. Die Komprimierung geht in einen Ausgabepuffer, wobei die Komprimierungsdatenströme extrahiert werden.

    Zusammenfassen von Einträgen in einem Deduplizierungs-lndex

    公开(公告)号:DE102013208930B4

    公开(公告)日:2020-12-17

    申请号:DE102013208930

    申请日:2013-05-15

    Applicant: IBM

    Abstract: Computerprogrammprodukt zum Ausführen einer Deduplizierung für einen Speicher, wobei das Computerprogrammprodukt ein computerlesbares Speichermedium mit einem darin verkörperten computerlesbaren Programmcode aufweist, mit den Schritten:- Verwalten eines Indexes von Datenblocksignaturen, die aus Datenblöcken von Daten in Datenobjekten in dem Speicher berechnet wurden, wobei jeder Indexeintrag aus der Vielzahl von Indexeinträgen mindestens eine der Datenblocksignaturen und einen Verweis auf den Datenblock enthält, aus dem die Signatur berechnet wurde;- Auswählen von Einträgen in dem Index, die zusammengefasst werden sollen, durch Ermitteln von Einträgen aus der Vielzahl von Einträgen in dem Index auf der Grundlage eines Kriteriums der Datenblöcke von Daten, auf die in den Einträgen verwiesen wird, wobei das Kriterium◯ ein Alter der Datenblöcke in dem Speicher, wobei das Alter eine Zeitspanne seit dem Einfügen des Datenblocks in den Speicher oder nach dem Aktualisieren;◯ und/oder eine Häufigkeit von Eingabe/Ausgabe- (E/A-) Zugriffen auf die Datenblöcke in dem Speicher;◯ und/oder eine Häufigkeit, mit der die Datenblöcke in dem Speicher in Datenobjekten erscheinen, die in den Speicher eingefügt wurden;◯ und/oder einen Bereich des Speichers, in dem die Datenblöcke gespeichert sind;◯ und/oder einen Datentyp in den Datenblöcken aufweist;- Ausführen einer Zusammenfassungsoperation mit den Datenblocksignaturen in den ausgewählten Einträgen, um eine zusammengefasste Signatur zu erzeugen;- Einfügen eines Eintrags in den Index, der die zusammengefasste Signatur und einen Verweis auf die Datenblöcke in dem Speicher, auf die in den zusammengefassten ausgewählten Einträgen verwiesen wird;- Entfernen der ausgewählten Einträge aus dem Index, die zum Erzeugen der zusammengefassten Signatur verwendet wurden, wobei die entstandenen zusammengefassten Einträge und von der Zusammenfassungsoperation nicht betroffene Einträge auf alle Datenblöcke in dem Speicher verweisen, die in den im Speicher verwalteten Datenobjekten enthalten sind; und- Verwenden des Indexes der Signaturen bei Deduplizierungs-Operationen, wenn Datenobjekte in den Speicher eingefügt werden.

Patent Agency Ranking