DATA VALUE OCCURRENCE INFORMATION FOR DATA COMPRESSION
    1.
    发明申请
    DATA VALUE OCCURRENCE INFORMATION FOR DATA COMPRESSION 审中-公开
    数据压缩的数据值事件信息

    公开(公告)号:WO2011080030A2

    公开(公告)日:2011-07-07

    申请号:PCT/EP2010069086

    申请日:2010-12-07

    CPC classification number: H03M7/30

    Abstract: Generation of occurrence data of data values is discussed, for enabling encoding of a data set. Occurrences of data values in a current data batch are determined. Occurrence count information for at most a first number (M) of most frequent data values in the current data batch are determined, the occurrence count information identifying the most frequent data values and their occurrence counts. For rest of the data values in the current data batch, at least a first histogram having a second number (N) of buckets is generated. The occurrence count information and the first histogram of the current data batch are merged to merged occurrence count information and merged histogram of data batches processed earlier. A next data batch is processed as a current data batch until the whole data set has been processed. An encoding scheme is determined based at least on the merged occurrence count information and the merged histogram corresponding to the data set.

    Abstract translation: 讨论了数据值的出现数据的生成,用于使得能够对数据集进行编码。 确定当前数据批次中数据值的出现。 确定当前数据批次中最多数据值(M)的最多数量(M)的出现计数信息,识别最频繁数据值的发生次数信息及其发生次数。 对于当前数据批次中的其余数据值,至少产生具有第二数量(N)的桶的第一直方图。 当前数据批次的发生次数信息和第一个直方图被合并到合并的发生次数信息和较早处理的数据批处理的合并直方图。 下一个数据批处理作为当前数据批处理,直到整个数据集被处理。 至少基于与数据集对应的合并发生次数信息和合并直方图来确定编码方案。

    Datenwert-Vorkommensinformationen für Datenkompression

    公开(公告)号:DE112010004531T5

    公开(公告)日:2012-08-30

    申请号:DE112010004531

    申请日:2010-12-07

    Applicant: IBM

    Abstract: Erörtert wird die Erzeugung von Vorkommensdaten von Datenwerten, um die Codierung einer Datei zu ermöglichen. Die Vorkommen von Datenwerten in einem aktuellen Datenstapel werden ermittelt. Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) von häufigsten Datenwerten im aktuellen Datenstapel werden ermittelt, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben. Für den Rest der Datenwerte im aktuellen Datenstapel wird mindestens ein erstes Histogramm mit einer zweiten Anzahl (N) von Intervallen erzeugt. Die Vorkommenszählungs-Informationen und das erste Histogramm des aktuellen Datenstapels werden mit zusammengeführten Vorkommenszählungs-Informationen und einem zusammengeführten Histogramm früher verarbeiteter Datenstapel zusammengeführt. Ein nächster Datenstapel wird als ein aktueller Datenstapel verarbeitet, bis die ganze Datei verarbeitet wurde. Ein Codierungsschema wird auf Grundlage mindestens der zusammengeführten Vorkommenszählungs-Informationen und des der Datei entsprechenden, zusammengeführten Histogramms ermittelt.

    Datenwert-Vorkommensinformationen für Datenkompression

    公开(公告)号:DE112010004531B4

    公开(公告)日:2016-11-10

    申请号:DE112010004531

    申请日:2010-12-07

    Applicant: IBM

    Abstract: Computergestütztes Verfahren zum Codieren oder Komprimieren einer Datei, wobei Vorkommensdaten von Datenwerten zum Codieren der Datei erzeugt werden, enthaltend die Schritte: (a) Aufteilen der Datei in mehrere Stapel; (b) Ermitteln der Vorkommen von Datenwerten in einem ersten Datenstapel; (c) Ermitteln von Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) häufigster Datenwerte in dem Datenstapel, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben; (d) Erzeugen mindestens eines ersten Histogramms mit einer zweiten Anzahl (N) von Intervallen für den Rest der Datenwerte in dem Datenstapel; (e) Ermitteln der Vorkommen von Datenwerten in einem weiteren Datenstapel; (f) Ermitteln von Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) häufigster Datenwerte in dem weiteren Datenstapel, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben; (g) Erzeugen mindestens eines weiteren Histogramms mit einer zweiten Anzahl (N) von Intervallen für den Rest der Datenwerte in dem Datenstapel; (h) Zusammenführen der Vorkommenszählungs-Informationen des weiteren Datenstapels mit den Vorkommenszählungs-Informationen des zuerst verarbeiteten Datenstapels durch jeweiliges Zusammenzählen der Vorkommensanzahlen für Elemente mit dem gleichen Wert; (i) Zusammenführen des Histogramms des weiteren Datenstapels mit dem Histogramm des als erstes verarbeiteten Datenstapels durch Zusammenzählen der Vorkommensanzahlen für Histogramm-Intervalle mit den gleichen Werten; ...

    Data value occurence information for data compression

    公开(公告)号:GB2490068A

    公开(公告)日:2012-10-17

    申请号:GB201213200

    申请日:2010-12-07

    Applicant: IBM

    Abstract: Generation of occurrence data of data values is discussed, for enabling encoding of a data set. Occurrences of data values in a current data batch are determined. Occurrence count information for at most a first number (M) of most frequent data values in the current data batch are determined, the occurrence count information identifying the most frequent data values and their occurrence counts. For rest of the data values in the current data batch, at least a first histogram having a second number (N) of buckets is generated. The occurrence count information and the first histogram of the current data batch are merged to merged occurrence count information and merged histogram of data batches processed earlier. A next data batch is processed as a current data batch until the whole data set has been processed. An encoding scheme is determined based at least on the merged occurrence count information and the merged histogram corresponding to the data set.

Patent Agency Ranking