-
公开(公告)号:KR1020110067647A
公开(公告)日:2011-06-22
申请号:KR1020090124331
申请日:2009-12-15
Applicant: 한국과학기술원
Abstract: PURPOSE: A pattern-based method and an apparatus of identifying data with abnormal attributes are provided to identify data with abnormal attributes having a plurality of attributes with high reliability by detecting the data having abnormal attributes from the data attribute set. CONSTITUTION: A data pre-processor(1030) converts data into a transaction. A data association pattern(DAP) determines the DAP representing the normal relationship between the related attributes from the transaction set. A priority determination part(1070) determines the priority of the DAP. An abnormal value determiner(1090) determines the data which includes the DAP as a subset and the inclusion of the abnormal attribute of the data on the basis of the priority of the DAP.
Abstract translation: 目的:提供一种基于模式的方法和识别具有异常属性的数据的装置,通过从数据属性集中检测具有异常属性的数据来识别具有具有高可靠性的多个属性的异常属性的数据。 构成:数据预处理器(1030)将数据转换为事务。 数据关联模式(DAP)确定表示来自事务集的相关属性之间的正常关系的DAP。 优先级确定部分(1070)确定DAP的优先级。 异常值确定器(1090)根据DAP的优先级确定包含DAP作为子集的数据以及包含数据的异常属性。
-
公开(公告)号:KR101172579B1
公开(公告)日:2012-08-09
申请号:KR1020090124331
申请日:2009-12-15
Applicant: 한국과학기술원
Abstract: 하나 이상의 속성을 포함하는 데이터 집합에서 이상 속성을 포함하는 데이터를 검출하기 위한 방법 및 장치가 개시된다. 이 방법은 데이터에 포함되는 속성들의 수치 범위를 각각 적어도 하나의 구간(interval)으로 분할하고, 속성들의 값을 해당 값을 포함하는 구간으로 각각 대체함으로써 데이터를 트랜잭션으로 변환하는 데이터 전처리 단계, 트랜잭션들의 집합으로부터 속성들 중 관련성 있는 속성들 간의 정상적 관계를 나타내는 데이터 연관 패턴(data association pattern, DAP)을 결정하는 데이터 연관 패턴 결정 단계, 결정된 데이터 연관 패턴들 각각의 중요도(significance)를 결정하는 중요도 결정 단계, 및 데이터 연관 패턴을 부분 집합으로서 포함하는 데이터를 결정하고, 결정된 데이터의 속성들에 대해 데이터 연관 패턴의 중요도를 이용하여 데이터가 이상 속성을 포함하는지 여부를 결정하는 이상치 판정 단계를 포함한다. 본 발명에 의하여, 여러 개의 이상 속성을 가지는 이상치 데이터도 높은 신뢰도로 식별할 수 있다 .
소프트웨어 프로젝트 데이터, 소프트웨어 데이터, 데이터 품질, 이상치, 데이터 패턴, 오류 데이터
-