Abstract:
Für eine Echtzeitklassifizierung von Daten in Datenkomprimierungsdomänen wird eine Entscheidung darüber, an welche der Datenkomprimierungsdomänen Schreiboperationen weitergeleitet werden sollten, durch Lesen beliebig ausgewählter Daten der Schreiboperationen zum Berechnen eines Satzes von Klassifizierungsheuristiken getroffen, wodurch ein Fingerabdruck für jede der Schreiboperationen erstellt wird. Die Schreiboperationen mit einem ähnlichen Fingerabdruck werden zusammen in einem ähnlichen Komprimierungsstrom komprimiert.
Abstract:
For multiplexer classification for column compression of tabular data, Similar type data segments are classified into classes for grouping the data segments into compression streams associated with each one of the classes. The compression streams are encoded based on a class-specific optimized encoding operation. The compression streams into one output buffer, wherein the compression streams are extracted.
Abstract:
Daten werden unter Verwendung eines Suffixbaums in eine minimierte Datendarstellung umgesetzt durch Sortieren von Datenströmen gemäß symbolischen Darstellungen zum Bilden von Tabellengrenzen-Erzeugungsmustern. Die umgesetzten Daten sind für eine Rekonstruktion vollständig umkehrbar, während minimale Vorsatzinformationen gesichert werden.
Abstract:
For real-time classification of data into data compression domains, a decision is made for which of the data compression domains write operations should be forwarded by reading randomly selected data of the write operations for computing a set of classifying heuristics thereby creating a fingerprint for each of the write operations. The write operations having a similar fingerprint are compressed together in a similar compression stream.
Abstract:
Für eine Multiplex-Klassifizierung zum Spaltenkomprimieren von Tabellendaten werden Datensegmente ähnlichen Typs in Klassen klassifiziert, um die Datensegmente in Komprimierungsdatenströmen zu gruppieren, die jeder der Klassen zugehörig sind. Die Komprimierungsdatenströme werden auf der Grundlage einer klassenspezifischen optimierten Codieroperation codiert. Die Komprimierung geht in einen Ausgabepuffer, wobei die Komprimierungsdatenströme extrahiert werden.
Abstract:
Computerprogrammprodukt zum Ausführen einer Deduplizierung für einen Speicher, wobei das Computerprogrammprodukt ein computerlesbares Speichermedium mit einem darin verkörperten computerlesbaren Programmcode aufweist, mit den Schritten:- Verwalten eines Indexes von Datenblocksignaturen, die aus Datenblöcken von Daten in Datenobjekten in dem Speicher berechnet wurden, wobei jeder Indexeintrag aus der Vielzahl von Indexeinträgen mindestens eine der Datenblocksignaturen und einen Verweis auf den Datenblock enthält, aus dem die Signatur berechnet wurde;- Auswählen von Einträgen in dem Index, die zusammengefasst werden sollen, durch Ermitteln von Einträgen aus der Vielzahl von Einträgen in dem Index auf der Grundlage eines Kriteriums der Datenblöcke von Daten, auf die in den Einträgen verwiesen wird, wobei das Kriterium◯ ein Alter der Datenblöcke in dem Speicher, wobei das Alter eine Zeitspanne seit dem Einfügen des Datenblocks in den Speicher oder nach dem Aktualisieren;◯ und/oder eine Häufigkeit von Eingabe/Ausgabe- (E/A-) Zugriffen auf die Datenblöcke in dem Speicher;◯ und/oder eine Häufigkeit, mit der die Datenblöcke in dem Speicher in Datenobjekten erscheinen, die in den Speicher eingefügt wurden;◯ und/oder einen Bereich des Speichers, in dem die Datenblöcke gespeichert sind;◯ und/oder einen Datentyp in den Datenblöcken aufweist;- Ausführen einer Zusammenfassungsoperation mit den Datenblocksignaturen in den ausgewählten Einträgen, um eine zusammengefasste Signatur zu erzeugen;- Einfügen eines Eintrags in den Index, der die zusammengefasste Signatur und einen Verweis auf die Datenblöcke in dem Speicher, auf die in den zusammengefassten ausgewählten Einträgen verwiesen wird;- Entfernen der ausgewählten Einträge aus dem Index, die zum Erzeugen der zusammengefassten Signatur verwendet wurden, wobei die entstandenen zusammengefassten Einträge und von der Zusammenfassungsoperation nicht betroffene Einträge auf alle Datenblöcke in dem Speicher verweisen, die in den im Speicher verwalteten Datenobjekten enthalten sind; und- Verwenden des Indexes der Signaturen bei Deduplizierungs-Operationen, wenn Datenobjekte in den Speicher eingefügt werden.
Abstract:
Verschiedene Ausführungsformen für eine effiziente Datenübertragung in einer Remote-Direct-Memory-Access-(RDMA)Operation durch eine Arbeitsspeichereinheit. Ein Dateiprotokoll-Header der Daten wird durch einen Blockprotokoll-Header ersetzt. Der Blockprotokoll-Header ermöglicht eine Übertragung über einen direkten Datenpfad durch eine Transport-schicht von einer Quelle zu einem Ziel ohne äußere Beeinflussung durch eine Zentraleinheit (CPU).