-
1.
公开(公告)号:WO2011068315A2
公开(公告)日:2011-06-09
申请号:PCT/KR2010/008115
申请日:2010-11-16
Applicant: 한국과학기술정보연구원 , 정도헌 , 성원경
CPC classification number: G06F17/30737 , G06F17/30705
Abstract: 본 발명은 문서의 분류체계와 용어 속성을 포함하는 문서의 특성에 따라 다수의 문서가 분류되어 저장되는 분산형 데이터베이스, 분류대상 문서가 입력되면 상기 분류대상 문서로부터 자질을 추출하고 상기 추출된 자질과 범주의 유사도를 이용하여 자질별 가중치값을 연산하여 상기 분류대상 문서의 범주를 결정한 후 상기 문서 범주에 대한 자질별 가중치값을 연산한 최대값을 최대 개념강도로 결정하는 최대 개념강도 결정부, 및 상기 최대 개념강도 결정부에서 결정된 상기 분류대상 문서의 최대 개념강도를 상기 분산형 데이터베이스에 대하여 각각 적용하여 상기 분류대상 문서의 특성과 유사한 분산형 데이터베이스를 선택하는 데이터베이스 선택부를 포함한다.
Abstract translation:
从当文件的数量是一个分布式数据库,分选要被分类是根据文档的特性包括分类系统和分类的目的地文件的文件中的术语的属性存储在输入所述目标文档,本发明的品质 提取和判定为使用所提取的质量的相似性和类别的程度来确定所述目标文件中,用于为文档类的品质的加权值的最大值操作的分类类别的质量加权值的操作之后,最大概念强度 向上概念强度判定单元,并分别施加到分类对象文档的最大概念强度由所述强度确定单元通过选择一个分布式数据库的分布式数据库确定的最大概念的数据库选择与分类对象文档的特征 部分。 P>
-
公开(公告)号:WO2012050252A1
公开(公告)日:2012-04-19
申请号:PCT/KR2010/007243
申请日:2010-10-21
CPC classification number: G06F17/30705 , G06K9/00288
Abstract: 본 발명은 분류기의 동적 결합에 의한 대용량 분류기 자동 생성 시스템 및 방법에 관한 것으로서, 문서의 특성에 따라 다수의 문서가 분류되어 저장되는 데이터베이스, 각 데이터베이스의 학습 대상 문서로부터 자질을 추출하고, 상기 추출된 자질과 범주의 유사도를 구하여 자질별 가중치를 연산한 후, 각 자질에 대해 가중치를 포함하는 자질 특성 매트릭스 및 용어 벡터를 생성하여 신규로 수집되는 분류대상 문서의 범주를 결정하는 개별 분류기를 생성하는 분류기 생성 장치, 복수개의 결합 대상 자질 특성 매트릭스에 출현한 자질들의 코드정보를 리스트화하고, 각 자질에 대한 범주 특성값을 합산하여 통합 매트릭스를 생성한 후 상기 통합 매트릭스를 이용하여 결합 대상 데이터베이스의 모든 자질 정보를 학습한 통합 분류기를 생성하는 분류기 동적 결합 장치를 포함한다. 따라서, 본 발명에 따르면, 대용량의 문서를 학습시킬 수 있는 대용량 분류기 생성을 위해 복수의 결합대상 데이터베이스를 동적으로 결합하여 어떤 데이터베이스에 대해서도 범용적으로 적용할 수 있다.
Abstract translation: 本发明涉及一种使用分类器的动态组合自动生成质量分类器的系统和方法,包括:存储根据文档特征分类的多个文档的数据库; 从数据库的每个学习对象文档中提取质量的分类器生成装置计算提取的质量和类别之间的相似度,从而计算每个质量的加权,然后生成包括每个质量的加权的项向量和质量特征矩阵 以生成确定新分类对象文档的类别的单个分类器; 以及用于列出关于要组合的多个质量特征矩阵的质量的代码信息的分类器的动态组合的装置,将用于质量的类别特征值相加,并且生成积分矩阵以生成积分分类器,其具有 了解要组合的数据库的所有质量信息。 因此,根据本发明,动态地组合多个数据库以产生允许大量文档被学习的大容量分类器,并且其可以通常应用于任何数据库。
-