Abstract:
There are provided a method of transforming a non-transformed stored logical data object (LO) device into a transformed LO and system thereof. The method includes: a) in response to a respective transformation request, logically dividing the non-transformed LO in a first segment and one or more non-transformed subsequent segments, the segments having predefined size; b) generating a header for the respective transformed LO; c) processing the first segment; d) overwriting the first segment by said generated header and the transformed first segment; e) indexing the first transformed segment and the one or more non-transformed subsequent segments as constituting a part of the transformed LO; f) generating at least one index section; and g) updating the indication in the header to point that the non-transformed LO has been transformed in the transformed LO including the generated header, the first transformed segment, the one or more subsequent segments including data in non-transformed form and the at least one index section.
Abstract:
Für eine Multiplex-Klassifizierung zum Spaltenkomprimieren von Tabellendaten werden Datensegmente ähnlichen Typs in Klassen klassifiziert, um die Datensegmente in Komprimierungsdatenströmen zu gruppieren, die jeder der Klassen zugehörig sind. Die Komprimierungsdatenströme werden auf der Grundlage einer klassenspezifischen optimierten Codieroperation codiert. Die Komprimierung geht in einen Ausgabepuffer, wobei die Komprimierungsdatenströme extrahiert werden.
Abstract:
Es werden Ausführungsformen eines Verfahrens, eines Systems und eines Computerprogrammprodukts zur effizienten Datenbereinigung in einem System mit komprimierten Journaldateien bereitgestellt. Gemäß einer Ausführungsform wird lediglich anhand eines Beispiels ein Abbild konfiguriert, das Datenblöcken mit überschriebenen komprimierten Journaleinträgen entspricht. Es werden gewichtete Bedingungen für jeden überschriebenen komprimierten Journaleinträge berechnet. Die gewichteten Bedingungen werden in dem Abbild von den niedrigsten bis zu den höchsten Werten angeordnet. Eine der gewichteten Bedingungen weist eine Vorrangvariable zum Auswählen von Datenblöcken mit einem freien Platz an einem Ende mindestens eines zugehörigen Datensatzes auf. Es werden weitere Ausführungsformen des Systems und das Computerprogrammprodukts offenbart und die damit verbundenen Vorteile dargelegt.
Abstract:
Efficient garbage collection in a compressed journal file system, by configuring a map corresponding to data blocks with overwritten compressed journal entries. Weighted conditions for each of the overwritten compressed journal entries are calculated. The weighted conditions are arranged in the map from lowest to highest. One of the weighted conditions includes a biasing variable towards selecting data blocks having free space at an end of at least one associated record. The size of the map may be limited by the age of data blocks to exclude those with high numbers of valid records, for example in mass storage RAID devices.
Abstract:
Verfahren in einem Datenverarbeitungssystem (200; 400) für verteilte, ortsbezogene Datenspeicherung, wobei das Verfahren Folgendes umfasst:durch einen Speichermechanismus (406) erfolgendes Empfangen (502) einer Anfrage von einem Hostsystem (102; 402) zum Schreiben einer Datendatei in eine Referrer-Speicherregion (408) in einer Menge aus Speicherregionen (404a, 404b, 404c, 404d, 404n, 404max) undfür jedes Datensegment der Datendatei:in Reaktion darauf, dass ein Vergleich (506) eines Hashwerts für das Datensegment mit anderen Hashwerten für andere in der Referrer-Speicherregion referenzierte gespeicherte Datensegmente anzeigt, dass das Datensegment in der Referrer-Speicherregion nicht vorhanden ist, durch den Speichermechanismus erfolgendes Ermitteln (602), ob die Daten in einer anderen Speicherregion in der Menge aus Speicherregionen vorhanden sind,in Reaktion darauf, dass das Datensegment in einer anderen Speicherregion in der Menge aus Speicherregionen vorhanden ist, durch den Speichermechanismus erfolgendes Ermitteln, ob es sich bei der Speicherregion um eine aus einer vorab bestimmten Anzahl N an der Referrer-Speicherregion zugehörigen Eigner-Speicherregionen (410a, 410b, 410c, 410n) handelt,in Reaktion darauf, dass es sich bei der Speicherregion nicht um eine aus der vorab bestimmten Anzahl N an der Referrer-Speicherregion zugehörigen Eigner-Speicherregionen handelt, durch den Speichermechanismus erfolgendes Ermitteln, ob die Anzahl an Eigner-Speicherregionen in der vorab bestimmten Anzahl N an Eigner-Speicherregionen erreicht wurde (606), undin Reaktion darauf, dass die vorab bestimmte Anzahl N an Eigner-Speicherregionen nicht erreicht wurde, durch den Speichermechanismus erfolgendes Speichern (610) eines Verweises auf das Datensegment in der Referrer-Speicherregion.
Abstract:
Für eine Echtzeitklassifizierung von Daten in Datenkomprimierungsdomänen wird eine Entscheidung darüber, an welche der Datenkomprimierungsdomänen Schreiboperationen weitergeleitet werden sollten, durch Lesen beliebig ausgewählter Daten der Schreiboperationen zum Berechnen eines Satzes von Klassifizierungsheuristiken getroffen, wodurch ein Fingerabdruck für jede der Schreiboperationen erstellt wird. Die Schreiboperationen mit einem ähnlichen Fingerabdruck werden zusammen in einem ähnlichen Komprimierungsstrom komprimiert.
Abstract:
For multiplexer classification for column compression of tabular data, Similar type data segments are classified into classes for grouping the data segments into compression streams associated with each one of the classes. The compression streams are encoded based on a class-specific optimized encoding operation. The compression streams into one output buffer, wherein the compression streams are extracted.
Abstract:
Ausführungsformen zum Verringern der Wiederherstellungszeit durch einen Prozessor in einer Computerspeicherumgebung werden bereitgestellt. Die Fehlerfreiheit von einem oder mehreren fehlerhaften Plattenlaufwerken in einem redundanten Array unabhängiger Platten (RAID)-6 kann durch Bereithalten von mindestens drei Paritätsstreifen pro Stripe und gleichzeitiges Verwenden eines oder mehrerer der mindestens drei Paritätsstreifen entsprechend dem einen oder den mehreren Plattenlaufwerkfehlern wiederhergestellt werden.
Abstract:
Bereitgestellt wird ein Mechanismus für verteilte, ortsbezogene Datenspeicherung. Es wird eine Anfrage zum Schreiben einer Datendatei in eine Referrer-Speicherregion in einer Menge aus Speicherregionen empfangen. Für jedes Datensegment der Datendatei wird in Reaktion darauf, dass ein Vergleich eines Hashwerts für das Datensegment mit anderen Hashwerten für andere in der Referrer-Speicherregion referenzierte gespeicherte Datensegmente anzeigt, dass das Datensegment in der Referrer-Speicherregion nicht vorhanden ist, in Reaktion darauf, dass das Datensegment in einer anderen Speicherregion in der Menge aus Speicherregionen vorhanden ist, in Reaktion darauf, dass es sich bei der Speicherregion nicht um eine aus der vorab bestimmten Anzahl N an der Referrer-Speicherregion zugehörigen Eigner-Speicherregionen handelt, und in Reaktion darauf, dass die vorab bestimmte Anzahl N an Eigner-Speicherregionen nicht erreicht wurde, ein Verweis auf das Datensegment in der Referrer-Speicherregion gespeichert.