-
公开(公告)号:CN105426466A
公开(公告)日:2016-03-23
申请号:CN201510782763.0
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/22 , G06F16/24545
Abstract: 本发明旨在提供一种在列存数据库中使用布隆过滤器快速精确查询数据的方法。包括,在列存数据库的精确查询数据操作中使用数据包级的布隆过滤器对数据包进行筛选。布隆过滤器可以有效减少精确查询数据操作过程中对磁盘和文件系统的I/O访问,加快精确查询数据操作的速度。
-
公开(公告)号:CN105279279B
公开(公告)日:2019-01-25
申请号:CN201510785760.2
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F16/172
Abstract: 本发明提供了一种从低速数据源加载压缩数据文件的方法,所述方法包括:接收客户端发送的控制文件;解析所述控制文件,获取控制文件中的数据来源和数据类型;判断控制文件中是否包括低速数据源的压缩数据文件;在控制文件中包括低速数据源的压缩数据文件时,读取并缓存所述低速数据源的压缩数据文件。实现了在读取压缩格式数据文件时预读数据,并放入缓存,从而在连续的若干次读取数据的操作中,只需在第一次操作中真正从数据源读取文件内容,显著减少了对低速数据源的I/O次数,用高速的内存操作加以替代,极大地提升了性能。
-
公开(公告)号:CN105279279A
公开(公告)日:2016-01-27
申请号:CN201510785760.2
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30132
Abstract: 本发明提供了一种从低速数据源加载压缩数据文件的方法,所述方法包括:接收客户端发送的控制文件;解析所述控制文件,获取控制文件中的数据来源和数据类型;判断控制文件中是否包括低速数据源的压缩数据文件;在控制文件中包括低速数据源的压缩数据文件时,读取并缓存所述低速数据源的压缩数据文件。实现了在读取压缩格式数据文件时预读数据,并放入缓存,从而在连续的若干次读取数据的操作中,只需在第一次操作中真正从数据源读取文件内容,显著减少了对低速数据源的I/O次数,用高速的内存操作加以替代,极大地提升了性能。
-
公开(公告)号:CN105740305A
公开(公告)日:2016-07-06
申请号:CN201510786469.7
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/235
Abstract: 本发明提供了一种集群数据库的数据加载方法,所述方法包括:接收客户端发送的数据文件;解析所述数据文件中的数据,判断所述数据中是否包括表达式;在所述数据中包括表达式时,计算所述表达式的结果;将所述结果代入数据,并加载所述代入的数据。实现了在支持在加载过程中对数据文件中包含的表达式进行求值和代入。用户往往不需要修改或重写数据文件,仅可通过相应的条件就可以加载新的数据,提高了数据文件的使用效率,提高了集群数据库加载工具的灵活性,极大改善了数据加载工具的用户使用体验。
-
公开(公告)号:CN105512168A
公开(公告)日:2016-04-20
申请号:CN201510782765.X
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/254
Abstract: 本发明提供了一种集群数据库复合加载数据的方法及装置,所述方法包括:接收客户端发送的控制文件;解析所述控制文件,获取加载任务;依次向集群数据库加载所述任务。由于采用上述技术方案,能够支持从多种不同的数据源读取数据文件,支持从多种不同格式的数据文件读取数据,支持不同数据源与不同数据格式的任意组合,因此极大增加了集群数据库加载工具的功能多样性,极大增强了集群数据库加载工具功能的可扩充性,极大提高了集群数据库加载工具功能的实用灵活性。
-
公开(公告)号:CN105354323A
公开(公告)日:2016-02-24
申请号:CN201510786399.5
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30442
Abstract: 本发明旨在提供一种在列存数据库中使用布隆过滤器快速精确查询数据的方法。包括,在列存数据库的精确查询数据操作中使用保存单元级的布隆过滤器对数据保存单元进行筛选。布隆过滤器可以有效减少精确查询数据操作过程中对磁盘和文件系统的I/O访问,加快精确查询数据操作的速度。
-
公开(公告)号:CN105354320A
公开(公告)日:2016-02-24
申请号:CN201510782856.3
申请日:2015-11-16
Applicant: 天津南大通用数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/172
Abstract: 本发明提供了一种快速加载多个数据文件的方法,所述方法包括:获取数据文件的基本信息;根据获取的数据文件的基本信息加载所述数据文件。本发明不必等待获取到全部数据文件的基本信息,就开始对已经获取到基本信息的数据文件进行加载,因此可以提高集群数据库加载工具的性能,有效减少用户的等待时间,极大改善用户的使用体验。
-
-
-
-
-
-