DATA VALUE OCCURRENCE INFORMATION FOR DATA COMPRESSION
    1.
    发明申请
    DATA VALUE OCCURRENCE INFORMATION FOR DATA COMPRESSION 审中-公开
    数据压缩的数据值事件信息

    公开(公告)号:WO2011080030A2

    公开(公告)日:2011-07-07

    申请号:PCT/EP2010069086

    申请日:2010-12-07

    CPC classification number: H03M7/30

    Abstract: Generation of occurrence data of data values is discussed, for enabling encoding of a data set. Occurrences of data values in a current data batch are determined. Occurrence count information for at most a first number (M) of most frequent data values in the current data batch are determined, the occurrence count information identifying the most frequent data values and their occurrence counts. For rest of the data values in the current data batch, at least a first histogram having a second number (N) of buckets is generated. The occurrence count information and the first histogram of the current data batch are merged to merged occurrence count information and merged histogram of data batches processed earlier. A next data batch is processed as a current data batch until the whole data set has been processed. An encoding scheme is determined based at least on the merged occurrence count information and the merged histogram corresponding to the data set.

    Abstract translation: 讨论了数据值的出现数据的生成,用于使得能够对数据集进行编码。 确定当前数据批次中数据值的出现。 确定当前数据批次中最多数据值(M)的最多数量(M)的出现计数信息,识别最频繁数据值的发生次数信息及其发生次数。 对于当前数据批次中的其余数据值,至少产生具有第二数量(N)的桶的第一直方图。 当前数据批次的发生次数信息和第一个直方图被合并到合并的发生次数信息和较早处理的数据批处理的合并直方图。 下一个数据批处理作为当前数据批处理,直到整个数据集被处理。 至少基于与数据集对应的合并发生次数信息和合并直方图来确定编码方案。

    VERFAHREN ZUM GLEICHZEITIGEN AUSFÜHREN VON DATENBANKOPERATIONEN

    公开(公告)号:DE112020003597B4

    公开(公告)日:2024-11-28

    申请号:DE112020003597

    申请日:2020-08-21

    Applicant: IBM

    Abstract: Verfahren zum Ausführen von gleichzeitigen Datenbankoperationen in einem Datenbanksystem während eines Zeitfensters, wobei die Datenbankoperationen konfiguriert sind, um Speichereinheiten eines Speicherplatzes des Datenbanksystems zu verwenden, wobei das Verfahren folgendes umfasst:Bestimmen einer ersten Nutzungsgeschwindigkeit (201) von freien Speichereinheiten, die von mindestens einer ersten Datenbankoperation verwendet werden sollen, und einer zweiten Nutzungsgeschwindigkeit (203) von freien Speichereinheiten, die von einer zweiten Datenbankoperation verwendet werden sollen;Verwenden der ersten und der zweiten Nutzungsgeschwindigkeit zum Bestimmen einer maximalen Anzahl von freien Speichereinheiten (205), die von der zweiten Datenbankoperation während des Zeitfensters verwendet werden sollen;Ausführen der zweiten Datenbankoperation (207) während des Zeitfensters gemäß der maximalen Anzahl; undAusführen der ersten Datenbankoperation (209), wobei die Ausführung der ersten Datenbankoperation während des Zeitfensters auf die Speichereinheiten des Speicherplatzes begrenzt ist.

    Automatisches Optimieren der Ressourcennutzung in einemZieldatenbankverwaltungssystem zum Erhöhen der Arbeitslastleistung

    公开(公告)号:DE112019001480B4

    公开(公告)日:2022-08-04

    申请号:DE112019001480

    申请日:2019-05-07

    Applicant: IBM

    Abstract: Durch einen Computer implementiertes Verfahren zum Laden eines Datensatzes in ein Ziel-Datenbankverwaltungssystem (DBMS) von einem Quell-DBMS, wobei das durch einen Computer implementierte Verfahren aufweist:Sammeln, durch einen Computer, von Echtzeit-Statistiken von dem Quell-DBMS, die Tabellengrößen- und Tabellenänderungsraten-Informationen beinhalten;Ermitteln, durch den Computer, von Zentraleinheit-Gesamtkosten (CPU-Gesamtkosten) für ein Laden des Datensatzes in das Ziel-DBMS mithilfe von gesammelten Größen- und Änderungsraten-Informationen, die Tabellen auf dem Quell-DBMS entsprechen, die zum Auslagern in das Ziel-DBMS auswählbar sind, und Arbeitslast-Kosteneinsparungen, die durch ein Ausführen einer oder mehrerer Arbeitslasten in dem Ziel-DBMS auf Grundlage einer Gruppe einer oder mehrerer Ladestrategien entstehen, wobei die Gruppe von Ladestrategien aus einer Gruppe ausgewählt wird, die aus einer UNLOAD-gestützte Auffrischungsstrategie und einer inkrementellen Aktualisierungsstrategie besteht;Vergleichen der CPU-Gesamtkosten durch den Computer mit den Arbeitslast-Kosteneinsparungen jeder Ladestrategie aus der Gruppe von Ladestrategien;Auswählen einer optimalen Ladestrategie aus der Gruppe von Ladestrategien durch den Computer auf Grundlage des Vergleichens der CPU-Gesamtkosten mit den Arbeitslast-Kosteneinsparungen jeder Ladestrategie; undautomatisches Laden des Datensatzes in das Ziel-DBMS vom Quell-DBMS durch den Computer gemäß der gewählten optimalen Ladestrategie zum beschleunigten Ausführen der einen oder mehreren Arbeitslasten.

    VERFAHREN ZUM GLEICHZEITIGEN AUSFÜHREN VON DATENBANKOPERATIONEN

    公开(公告)号:DE112020003597T5

    公开(公告)日:2022-05-19

    申请号:DE112020003597

    申请日:2020-08-21

    Applicant: IBM

    Abstract: Die vorliegende Offenbarung betrifft ein Verfahren zum Ausführen von gleichzeitigen Datenbankoperationen in einem Datenbanksystem während eines Zeitfensters. Die Datenbankoperationen sind konfiguriert, um Speichereinheiten eines Speicherplatzes des Datenbanksystems zu verwenden. Das Verfahren weist ein Bestimmen einer ersten Nutzungsgeschwindigkeit von freien Speichereinheiten, die von mindestens einer ersten Datenbankoperation verwendet werden sollen, und einer zweiten Nutzungsgeschwindigkeit von freien Speichereinheiten auf, die von einer zweiten Datenbankoperation verwendet werden sollen. Die erste und die zweite Nutzungsgeschwindigkeit können zum Bestimmen einer maximalen Anzahl von freien Speichereinheiten verwendet werden, die von der zweiten Datenbankoperation während des Zeitfensters verwendet werden sollen. Die zweite Datenbankoperation kann während des Zeitfensters gemäß der maximalen Anzahl ausgeführt werden. Die erste Datenbankoperation kann ausgeführt werden, wobei die Ausführung der ersten Datenbankoperation während des Zeitfensters auf die Speichereinheiten des Speicherplatzes begrenzt ist.

    Datenwert-Vorkommensinformationen für Datenkompression

    公开(公告)号:DE112010004531T5

    公开(公告)日:2012-08-30

    申请号:DE112010004531

    申请日:2010-12-07

    Applicant: IBM

    Abstract: Erörtert wird die Erzeugung von Vorkommensdaten von Datenwerten, um die Codierung einer Datei zu ermöglichen. Die Vorkommen von Datenwerten in einem aktuellen Datenstapel werden ermittelt. Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) von häufigsten Datenwerten im aktuellen Datenstapel werden ermittelt, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben. Für den Rest der Datenwerte im aktuellen Datenstapel wird mindestens ein erstes Histogramm mit einer zweiten Anzahl (N) von Intervallen erzeugt. Die Vorkommenszählungs-Informationen und das erste Histogramm des aktuellen Datenstapels werden mit zusammengeführten Vorkommenszählungs-Informationen und einem zusammengeführten Histogramm früher verarbeiteter Datenstapel zusammengeführt. Ein nächster Datenstapel wird als ein aktueller Datenstapel verarbeitet, bis die ganze Datei verarbeitet wurde. Ein Codierungsschema wird auf Grundlage mindestens der zusammengeführten Vorkommenszählungs-Informationen und des der Datei entsprechenden, zusammengeführten Histogramms ermittelt.

    Automatisches Optimieren der Ressourcennutzung in einemZieldatenbankverwaltungssystem zum Erhöhen der Arbeitslastleistung

    公开(公告)号:DE112019001480T5

    公开(公告)日:2021-01-07

    申请号:DE112019001480

    申请日:2019-05-07

    Applicant: IBM

    Abstract: Laden eines Datensatzes in ein Ziel-Datenbankverwaltungssystem (DBMS) von einem Quell-DBMS wird bereitgestellt, um die Arbeitslastleistung zu erhöhen und die Ressourcennutzung zu verringern. Mithilfe einer Größe und einer Änderungsrate von Tabellen, die für ein Auslagern in das Ziel-DBMS auswählbar sind, werden Zentraleinheit-Gesamtkosten (CPU-Gesamtkosten) für ein Laden des Datensatzes in das Ziel-DBMS und Arbeitslast-Kosteneinsparungen durch ein Ausführen einer oder mehrerer Arbeitslasten in dem Ziel-DBMS auf Grundlage einer Gruppe einer oder mehrerer Ladestrategien ermittelt. Die CPU-Gesamtkosten werden mit den Arbeitslast-Kosteneinsparungen jeder Ladestrategie verglichen. Eine optimale Ladestrategie wird auf Grundlage eines Vergleichens der CPU-Gesamtkosten mit den Arbeitslast-Kosteneinsparungen jeder Ladestrategie ausgewählt. Der Datensatz wird automatisch gemäß der ausgewählten optimalen Ladestrategie vom Quell-DBMS in das Ziel-DBMS geladen.

    Datenwert-Vorkommensinformationen für Datenkompression

    公开(公告)号:DE112010004531B4

    公开(公告)日:2016-11-10

    申请号:DE112010004531

    申请日:2010-12-07

    Applicant: IBM

    Abstract: Computergestütztes Verfahren zum Codieren oder Komprimieren einer Datei, wobei Vorkommensdaten von Datenwerten zum Codieren der Datei erzeugt werden, enthaltend die Schritte: (a) Aufteilen der Datei in mehrere Stapel; (b) Ermitteln der Vorkommen von Datenwerten in einem ersten Datenstapel; (c) Ermitteln von Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) häufigster Datenwerte in dem Datenstapel, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben; (d) Erzeugen mindestens eines ersten Histogramms mit einer zweiten Anzahl (N) von Intervallen für den Rest der Datenwerte in dem Datenstapel; (e) Ermitteln der Vorkommen von Datenwerten in einem weiteren Datenstapel; (f) Ermitteln von Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) häufigster Datenwerte in dem weiteren Datenstapel, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben; (g) Erzeugen mindestens eines weiteren Histogramms mit einer zweiten Anzahl (N) von Intervallen für den Rest der Datenwerte in dem Datenstapel; (h) Zusammenführen der Vorkommenszählungs-Informationen des weiteren Datenstapels mit den Vorkommenszählungs-Informationen des zuerst verarbeiteten Datenstapels durch jeweiliges Zusammenzählen der Vorkommensanzahlen für Elemente mit dem gleichen Wert; (i) Zusammenführen des Histogramms des weiteren Datenstapels mit dem Histogramm des als erstes verarbeiteten Datenstapels durch Zusammenzählen der Vorkommensanzahlen für Histogramm-Intervalle mit den gleichen Werten; ...

Patent Agency Ranking