-
公开(公告)号:KR1020070058936A
公开(公告)日:2007-06-11
申请号:KR1020060024327
申请日:2006-03-16
Applicant: 성균관대학교산학협력단
IPC: G06F17/30
CPC classification number: G06F17/30327 , G06F17/30539 , G06F2216/03
Abstract: A method for generating a decision tree using time-weighted entropy and a recording medium thereof are provided to express a tendency of recent data by considering time, and predict action or a tendency of a user by analyzing preference data of the user in a ubiquitous environment. A test for selecting an attribute to be a node of a current level among the attributes of a plurality of instance data by using the time-weighted entropy is performed(ST2010). The attribute having the biggest information quantity obtained from the test is selected as the node(ST2033). Previous two steps are repeatedly performed until all nodes of the current level are selected(ST2034). If all nodes of the current level are selected, all previous steps are repeatedly performed for the lower level just below the current level(ST2034). The decision tree generated by the previous two steps is generated until all sub instance data groups are unified to one class and system entropy gets to be zero(ST2050). The time-weighted entropy of the later tendency has bigger weight.
Abstract translation: 提供了使用时间加权熵及其记录介质来生成决策树的方法,以通过考虑时间来表示最近数据的趋势,并且通过在无所不在的环境中分析用户的偏好数据来预测用户的动作或倾向 。 执行通过使用时间加权熵来选择属于多个实例数据的属性中的当前级别的节点的属性的测试(ST2010)。 选择从测试获得的具有最大信息量的属性作为节点(ST2033)。 重复执行上述两个步骤,直到当前级别的所有节点被选择(ST2034)。 如果选择了当前级别的所有节点,则对于刚刚低于当前级别的较低级别重复执行所有先前步骤(ST2034)。 生成前两个步骤生成的决策树,直到所有子实例数据组统一到一个类,并且系统熵变为零(ST2050)。 后来趋势的时间加权熵较大。
-
公开(公告)号:KR100727555B1
公开(公告)日:2007-06-14
申请号:KR1020060024327
申请日:2006-03-16
Applicant: 성균관대학교산학협력단
IPC: G06F17/30
Abstract: 시간을 고려하여 최근 데이터들의 경향을 더 잘 표현할 수 있는 시간 가중치 엔트로피를 이용한 결정 트리 생성 방법 및 이를 기록한 기록매체에 관한 것으로, 컴퓨터가 외부에서 입력된 다수의 사례 데이터의 패턴을 인식하고 새롭게 분류된 데이터를 창출하기 위한 데이터 마이닝의 분류 기법 중 결정 트리 생성 방법에 있어서, (a) 시간 가중치 엔트로피를 이용하여 다수의 사례 데이터가 갖는 속성들 중에서 현재 레벨의 노드가 될 속성을 선택하기 위한 테스트를 하는 단계, (b) 상기 테스트에서 얻은 정보 획득량이 가장 큰 속성을 노드로 선택하는 단계, (c) 현재 레벨의 모든 노드가 선택될 때까지 상기 단계 (a) 내지 상기 단계 (b)를 반복하는 단계, (d) 현재 레벨의 모든 노드가 선택되면 한 단계 하위 레벨에 대해 상기 단계 (a) 내지 상기 단계 (c)를 반복하는 단계로 이루어진다.
상기와 같은 시간 가중치 엔트로피를 이용한 결정 트리 생성 방법 및 이를 기록한 기록매체를 이용하는 것에 의해, 최근 데이터에 더 중점을 두고 있기 때문에 전체 데이터를 고려해도 최근 데이터의 영향을 볼 수 있다.
데이터마이닝, 결정 트리, ID3, 엔트로피-
公开(公告)号:KR1020070059015A
公开(公告)日:2007-06-11
申请号:KR1020070020537
申请日:2007-02-28
Applicant: 성균관대학교산학협력단
IPC: G06F17/30
CPC classification number: G06F17/30539 , G05B2219/32185 , G06F17/11
Abstract: A method for generating a decision tree using time-weighted entropy and a recording medium thereof are provided to predict activity of a user or recognize a tendency of the user by analyzing preference data of the user in a ubiquitous environment. A test for selecting an attribute to be a node of a current level among the attributes of a plurality of instance data by using the time-weighted entropy is performed(ST2010). The attribute having the highest information quantity obtained from the test is selected as the node(ST2033). Previous two steps are repeatedly performed until all nodes of the current level are selected(ST2034). If all nodes of the current level are selected, all previous steps are repeatedly performed for the level just below the current level(ST2034). The decision tree generated by the previous two steps is generated until all low instance data groups are unified into one class and system entropy gets to be zero(ST2050). The time-weighted entropy of the recent tendency has bigger weight.
Abstract translation: 提供了一种使用时间加权熵及其记录介质生成决策树的方法,用于通过在无所不在的环境中分析用户的偏好数据来预测用户的活动或识别用户的倾向。 执行通过使用时间加权熵来选择属于多个实例数据的属性中的当前级别的节点的属性的测试(ST2010)。 选择从测试获得的具有最高信息量的属性作为节点(ST2033)。 重复执行上述两个步骤,直到当前级别的所有节点被选择(ST2034)。 如果选择了当前级别的所有节点,则对于刚刚低于当前级别的级别(ST2034),重复执行所有先前的步骤。 生成前两个步骤生成的决策树,直到所有的低实例数据组统一成一个类,系统熵变为零(ST2050)。 近期趋势的时间加权熵较大。
-
-