-
1.
公开(公告)号:WO2011080030A2
公开(公告)日:2011-07-07
申请号:PCT/EP2010069086
申请日:2010-12-07
Applicant: IBM , LI TIANCHAO , DRAESE OLIVER , BENDEL PETER , HRLE NAMIK
Inventor: LI TIANCHAO , DRAESE OLIVER , BENDEL PETER , HRLE NAMIK
IPC: H03M7/30
CPC classification number: H03M7/30
Abstract: Generation of occurrence data of data values is discussed, for enabling encoding of a data set. Occurrences of data values in a current data batch are determined. Occurrence count information for at most a first number (M) of most frequent data values in the current data batch are determined, the occurrence count information identifying the most frequent data values and their occurrence counts. For rest of the data values in the current data batch, at least a first histogram having a second number (N) of buckets is generated. The occurrence count information and the first histogram of the current data batch are merged to merged occurrence count information and merged histogram of data batches processed earlier. A next data batch is processed as a current data batch until the whole data set has been processed. An encoding scheme is determined based at least on the merged occurrence count information and the merged histogram corresponding to the data set.
Abstract translation: 讨论了数据值的出现数据的生成,用于使得能够对数据集进行编码。 确定当前数据批次中数据值的出现。 确定当前数据批次中最多数据值(M)的最多数量(M)的出现计数信息,识别最频繁数据值的发生次数信息及其发生次数。 对于当前数据批次中的其余数据值,至少产生具有第二数量(N)的桶的第一直方图。 当前数据批次的发生次数信息和第一个直方图被合并到合并的发生次数信息和较早处理的数据批处理的合并直方图。 下一个数据批处理作为当前数据批处理,直到整个数据集被处理。 至少基于与数据集对应的合并发生次数信息和合并直方图来确定编码方案。
-
公开(公告)号:DE112010004531T5
公开(公告)日:2012-08-30
申请号:DE112010004531
申请日:2010-12-07
Applicant: IBM
Inventor: LI TIANCHAO , DRAESE OLIVER , BENDEL PETER , HRLE NAMIK
IPC: H03M7/30
Abstract: Erörtert wird die Erzeugung von Vorkommensdaten von Datenwerten, um die Codierung einer Datei zu ermöglichen. Die Vorkommen von Datenwerten in einem aktuellen Datenstapel werden ermittelt. Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) von häufigsten Datenwerten im aktuellen Datenstapel werden ermittelt, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben. Für den Rest der Datenwerte im aktuellen Datenstapel wird mindestens ein erstes Histogramm mit einer zweiten Anzahl (N) von Intervallen erzeugt. Die Vorkommenszählungs-Informationen und das erste Histogramm des aktuellen Datenstapels werden mit zusammengeführten Vorkommenszählungs-Informationen und einem zusammengeführten Histogramm früher verarbeiteter Datenstapel zusammengeführt. Ein nächster Datenstapel wird als ein aktueller Datenstapel verarbeitet, bis die ganze Datei verarbeitet wurde. Ein Codierungsschema wird auf Grundlage mindestens der zusammengeführten Vorkommenszählungs-Informationen und des der Datei entsprechenden, zusammengeführten Histogramms ermittelt.
-
公开(公告)号:DE112010004531B4
公开(公告)日:2016-11-10
申请号:DE112010004531
申请日:2010-12-07
Applicant: IBM
Inventor: LI TIANCHAO , DRAESE OLIVER , BENDEL PETER , HRLE NAMIK
IPC: H03M7/30
Abstract: Computergestütztes Verfahren zum Codieren oder Komprimieren einer Datei, wobei Vorkommensdaten von Datenwerten zum Codieren der Datei erzeugt werden, enthaltend die Schritte: (a) Aufteilen der Datei in mehrere Stapel; (b) Ermitteln der Vorkommen von Datenwerten in einem ersten Datenstapel; (c) Ermitteln von Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) häufigster Datenwerte in dem Datenstapel, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben; (d) Erzeugen mindestens eines ersten Histogramms mit einer zweiten Anzahl (N) von Intervallen für den Rest der Datenwerte in dem Datenstapel; (e) Ermitteln der Vorkommen von Datenwerten in einem weiteren Datenstapel; (f) Ermitteln von Vorkommenszählungs-Informationen für höchstens eine erste Anzahl (M) häufigster Datenwerte in dem weiteren Datenstapel, wobei die Vorkommenszählungs-Informationen die häufigsten Datenwerte und ihre Vorkommensanzahlen angeben; (g) Erzeugen mindestens eines weiteren Histogramms mit einer zweiten Anzahl (N) von Intervallen für den Rest der Datenwerte in dem Datenstapel; (h) Zusammenführen der Vorkommenszählungs-Informationen des weiteren Datenstapels mit den Vorkommenszählungs-Informationen des zuerst verarbeiteten Datenstapels durch jeweiliges Zusammenzählen der Vorkommensanzahlen für Elemente mit dem gleichen Wert; (i) Zusammenführen des Histogramms des weiteren Datenstapels mit dem Histogramm des als erstes verarbeiteten Datenstapels durch Zusammenzählen der Vorkommensanzahlen für Histogramm-Intervalle mit den gleichen Werten; ...
-
公开(公告)号:GB2490068B
公开(公告)日:2015-07-22
申请号:GB201213200
申请日:2010-12-07
Applicant: IBM
Inventor: LI TIANCHAO , DRAESE OLIVER , BENDEL PETER , HRLE NAMIK
IPC: H03M7/30
-
公开(公告)号:GB2490068A
公开(公告)日:2012-10-17
申请号:GB201213200
申请日:2010-12-07
Applicant: IBM
Inventor: LI TIANCHAO , DRAESE OLIVER , BENDEL PETER , HRLE NAMIK
IPC: H03M7/30
Abstract: Generation of occurrence data of data values is discussed, for enabling encoding of a data set. Occurrences of data values in a current data batch are determined. Occurrence count information for at most a first number (M) of most frequent data values in the current data batch are determined, the occurrence count information identifying the most frequent data values and their occurrence counts. For rest of the data values in the current data batch, at least a first histogram having a second number (N) of buckets is generated. The occurrence count information and the first histogram of the current data batch are merged to merged occurrence count information and merged histogram of data batches processed earlier. A next data batch is processed as a current data batch until the whole data set has been processed. An encoding scheme is determined based at least on the merged occurrence count information and the merged histogram corresponding to the data set.
-
公开(公告)号:GB2524540A
公开(公告)日:2015-09-30
申请号:GB201405398
申请日:2014-03-26
Applicant: IBM
Inventor: MARTIN DANIEL JOSEPH , HRLE NAMIK , STOLZE KNUT , MUELLER JENS
IPC: G06F17/30
Abstract: In response to receiving a request for replicating data of a source database to a relational target database, a first start position (SP1) representing the most recent log position within a transaction log is identified. After a time period, waiting to ensure that each currently executing transaction (T1.1, T2.1 etc.) has terminated, asynchronously creating a copy of the data of the source database excluding any changes by transactions not committed. After completion of copying, identifying a repair start position (RSLP) within the transaction log to identify transactions which started after the first start position and which committed before the repair start position in order to execute those transactions.
-
公开(公告)号:GB2524075A
公开(公告)日:2015-09-16
申请号:GB201404524
申请日:2014-03-14
Applicant: IBM
Inventor: RESE JOACHIM , MAYER GEORG , HRLE NAMIK
IPC: G06F17/30
Abstract: A method for updating a cache comprising identifying in a query instance that has led to a filling of the cache, a parameter whose values are monotonic Âin particular monotonically increasing or decreasing - over time, wherein the query instance has a first execution time. When generating a new query instance, at a second, later execution time - e.g., at ETL time - instead of the previous value of the parameter, a new value may be used that corresponds to the monotonic previous value at the second execution time. Finally, the new query instance is executed whereby the cache is updated with the results of the new query instance.
-
公开(公告)号:GB2524072A
公开(公告)日:2015-09-16
申请号:GB201404521
申请日:2014-03-14
Applicant: IBM
Inventor: RESE JOACHIM , MAYER GEORG , HRLE NAMIK
IPC: G06F17/30
Abstract: A method and builder for automatically generating an aggregate is provided. The method comprises, upon receiving a second query 102 comprising a filter criterion, determining 104 if at least a threshold number of previous first queries comprises a similar filter criterion, and if so generating 106 an aggregate using the similar filter criterion as aggregation criterion, such that future queries comprising the similar filter criterion are satisfied by the aggregate. The queries may be determined to be similar if they are the same or if the first query filter criteria is a subset of the second. The aggregate may be a materialized query table.
-
公开(公告)号:DE60124657T2
公开(公告)日:2007-10-18
申请号:DE60124657
申请日:2001-09-21
Applicant: IBM
Inventor: HRLE NAMIK , MAIER ANDREAS , TENG JAMES , WATTS JULIE
IPC: G06F17/30
-
公开(公告)号:DE60124657D1
公开(公告)日:2007-01-04
申请号:DE60124657
申请日:2001-09-21
Applicant: IBM
Inventor: HRLE NAMIK , MAIER ANDREAS , TENG JAMES , WATTS JULIE
IPC: G06F17/30
-
-
-
-
-
-
-
-
-