An integrated approach for deduplicating data in a distributed environment that involves a source and a target

    公开(公告)号:GB2484019A

    公开(公告)日:2012-03-28

    申请号:GB201119845

    申请日:2010-07-12

    Applicant: IBM

    Abstract: One aspect of the present invention includes a configuration of a storage management system that enables the performance of deduplication activities at both the client (source) and at the server (target) locations. The location of deduplication operations can then be optimized based on system conditions or predefined policies. In one embodiment, seamless switching of deduplication activities between the client and the server is enabled by utilizing uniform deduplication process algorithms and accessing the same deduplication index (containing information on the hashed data chunks). Additionally, any data transformations on the chunks are performed subsequent to identification of the data chunks. Accordingly, with use of this storage configuration, the storage system can find and utilize matching chunks generated with either client- or server-side deduplication.

    Replication of data objects from a source server to a target server

    公开(公告)号:GB2509023A

    公开(公告)日:2014-06-18

    申请号:GB201405324

    申请日:2012-08-28

    Applicant: IBM

    Abstract: Data objects are replicated from a source storage managed by a source server to a target storage managed by a target server. A source list is built of objects at the source server to replicate to the target server. The target server is queried to obtain a target list of objects at the target server. A replication list is built indicating objects on the source list not included on the target list to transfer to the target server. For each object in the replication list, data for the object not already at the target storage is sent to the target server and metadata on the object is sent to the target server to cause the target server to include the metadata in an entry for the object in a target server replication database. An entry for the object is added to a source server replication database.

    Eine integrierte Herangehensweise zur Deduplizierung von Daten in einer verteiltenUmgebung, die eine Quelle und ein Ziel umfasst

    公开(公告)号:DE112010002938B4

    公开(公告)日:2018-02-01

    申请号:DE112010002938

    申请日:2010-07-12

    Applicant: IBM

    Abstract: Verfahren zur Ermöglichung einer Deduplizierung einer Datei sowohl an einem Quell- als auch an einem Zielort in einem verteilten Speichermanagementsystem, wobei das Speichermanagementsystem ein Quellcomputersystem umfasst, das mit einem Zielcomputersystem und einem Zieldatenspeicher verbunden ist, der sich innerhalb des Zielcomputersystemes befindet, wobei das Verfahren ferner umfasst: Bereitstellen eines Deduplizierungsprozesses zur Deduplizierung von Datenchunks, die in deduplizierter Form innerhalb des Zieldatenspeichers gespeichert werden sollen, wobei ermöglicht wird, Deduplizierungsinstruktionen durch das Zielcomputersystem auszuführen und Deduplizierungsinstruktionen durch das Quellcomputersystem auszuführen; Deduplizierung einer Datei in einen Satz von deduplizierten Datenchunks unter Verwendung des Deduplizierungsprozesses, wobei der Deduplizierungsprozess einen Satz von Deduplizierungsinstruktionen umfasst, die entweder durch das Quellcomputersystem oder das Zielcomputersystem ausgeführt werden; und Speichern des Satzes der deduplizierten Datenchunks innerhalb des Zieldatenspeichers; gekennzeichnet durch Verwalten eines Indexes, der zur Nachverfolgung von deduplizierten Datenchunks dient, die innerhalb des Zieldatenspeichers gespeichert sind, wobei das Quellcomputersystem und das Zielcomputersystem sich den Index teilen, so dass sowohl das Quellcomputersystem als auch das Zielcomputersystem auf den Index zugreifen können; und Aktualisieren der Deduplizierungsinformationen für den Satz der deduplizierten Datenchunks innerhalb des geteilten Indexes.

    Eine integrierte Herangehensweise zur Deduplizierung von Daten in einer verteiltenUmgebung, die eine Quelle und ein Ziel umfasst

    公开(公告)号:DE112010002938T5

    公开(公告)日:2012-09-20

    申请号:DE112010002938

    申请日:2010-07-12

    Applicant: IBM

    Abstract: Ein Aspekt der vorliegenden Erfindung umfasst eine Konfiguration eines Speichermanagementsystems, das die Durchführung von Deduplizierungsaktivitäten sowohl am Client (Quell)- als auch am Server (Ziel) ort ermöglicht. Der Ort der Deduplizierungsfunktion kann dann basierend auf Systembedingungen oder vordefinierten Policies optimiert werden. In einer Ausführungsform wird ein nahtloses Schalten von Deduplizierungsaktivitäten zwischen dem Client und dem Server ermöglicht durch Verwendung einheitlicher Deduplizierungsprozessalgorithmen und Zugriff auf denselben Deduplizierungsindex (umfassend Informationen über die gehashten Datenchunks). Zusätzlich werden jegliche Datentransformationen der Chunks nach Identifizierung der Datenchunks durchgeführt. Demnach kann das Speichersystem unter Verwendung dieser Speicherkonfiguration passende Chunks, die entweder mit der client- oder serverseitigen Deduplizierung erzeugt wurden, finden und verwenden.

Patent Agency Ranking