-
公开(公告)号:KR101631032B1
公开(公告)日:2016-06-16
申请号:KR1020150102899
申请日:2015-07-21
Applicant: 한국과학기술원
IPC: G06F17/30
Abstract: 일실시예에따른비정형데이터수집, 필터링및 공통형태변환을통한저장시스템및 방법이개시된다. 비정형데이터수집, 필터링및 공통형태변환을통한저장시스템은, 가상공간의비정형데이터를일괄적으로수집하고, 상기수집된비정형데이터에대하여목표키워드를포함하는지여부를판단하는데이터수집부; 상기목표키워드를포함하고있는비정형데이터를비정상적단어빈도와비정상적사용자패턴을기반으로정상상태또는비정상상태로분류하는데이터필터링부; 및상기정상상태로분류된데이터로부터표준형태정보를추출하여변환하고, 상기정상상태로분류된데이터로부터부가정보를변환하여, 상기표준형태정보와상기부가정보를결합하여공통형태로저장하는데이터공통형태저장부를포함할수 있다.
Abstract translation: 公开了根据本发明的实施例的使用不规则数据过滤和公共格式转换的存储系统和存储方法。 使用不规则数据收集,过滤和公共格式转换的存储系统可以包括:数据收集单元,其在批量中收集虚拟空间中的不规则数据,并且确定收集的不规则数据是否包括目标关键字; 数据过滤单元,其基于异常字频率和异常用户模式将包括目标关键字的不规则数据分类为正常状态或异常状态; 以及从被分类为正常状态的数据中提取标准格式信息以将数据转换为公共格式的数据公共格式存储单元,从被分类为正常状态的数据中提取附加信息以进行转换 数据到通用格式,并组合标准格式信息和附加信息,以将结果存储为通用格式。 根据本发明,由于消除诸如广告等无意义的数据,可以将各种不规则数据格式转换成通用格式和附加信息格式,然后存储。