토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버
    1.
    发明申请
    토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버 审中-公开
    提取主题的评估方法和服务器,评估题目的适用性

    公开(公告)号:WO2015167074A1

    公开(公告)日:2015-11-05

    申请号:PCT/KR2014/006955

    申请日:2014-07-29

    Inventor: 이수원 노준호

    Abstract: 토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버가 제공된다. 본 발명의 토픽을 추출하는 서버는, 분류 정보에 따라 구성된 분류별 문서 집합으로부터 명사를 추출한 후 불용어를 제거하는 텍스트 전처리부, 상기 불용어가 제거된 명사에 대해 가중치를 계산하여 상기 분류별 문서 집합을 대표하는 단어인 핵심어를 추출하는 핵심어 추출부, 상기 추출된 핵심어에 대해 가중치를 계산하여 상기 핵심어들을 관련 단어들로 군집화한 군집의 중심 단어인 시드를 선정하는 시드 선정부, 상기 선정된 시드를 중심으로 상기 시드와 동일한 문장에서 다수 출현한 핵심어를 하나의 군집으로 구성하는 초기 군집화부 및 상기 구성된 군집들 중 유사한 군집들을 병합하여 분류별 토픽 집합을 추출하는 군집 병합부를 포함하는 것을 특징으로 한다.

    Abstract translation: 提供了一种用于提取主题并评估所提取的主题的适合性的方法和服务器。 根据本发明的用于提取主题的服务器包括:文本预处理单元,用于基于分类信息从类别特定文档集合中提取名词,然后去除停止词; 关键词提取单元,用于计算停止词被移除的名词的权重,并提取表示特定类别的文档集合的关键字; 种子选择单元,用于计算所提取的关键字的权重,并且选择作为群集的主要词的种子,其中关键字与相关联的词聚类; 用于形成所选种子中心于所选种子的单个簇的初始聚类单元和在同一句中出现多次的关键字; 以及用于在形成的集群中合并类似集群并提取类别特定主题集合的集群合并单元。

    토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버
    2.
    发明授权
    토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버 有权
    提取主题的评估方法和服务器和评估主题的兼容性

    公开(公告)号:KR101536520B1

    公开(公告)日:2015-07-14

    申请号:KR1020140050883

    申请日:2014-04-28

    Inventor: 이수원 노준호

    Abstract: 토픽을추출하고, 추출된토픽의적합성을평가하는방법및 서버가제공된다. 본발명의토픽을추출하는서버는, 분류정보에따라구성된분류별문서집합으로부터명사를추출한후 불용어를제거하는텍스트전처리부, 상기불용어가제거된명사에대해가중치를계산하여상기분류별문서집합을대표하는단어인핵심어를추출하는핵심어추출부, 상기추출된핵심어에대해가중치를계산하여상기핵심어들을관련단어들로군집화한군집의중심단어인시드를선정하는시드선정부, 상기선정된시드를중심으로상기시드와동일한문장에서다수출현한핵심어를하나의군집으로구성하는초기군집화부및 상기구성된군집들중 유사한군집들을병합하여분류별토픽집합을추출하는군집병합부를포함하는것을특징으로한다.

    Abstract translation: 提供了一种用于提取主题并评估所提取的主题的适合性的方法和服务器。 用于提取本发明的主题的服务器包括:文本预处理单元,用于从根据分类信息形成的分类文档集中提取名词,以及去除停止词; 关键词提取单元,用于通过计算从其中移除了停止词的单词的加权值来提取表示分类文档集合的单词; 种子选择单元,用于通过计算所提取的关键字的加权值来选择作为通过用关联词聚类关键词获得的群集的主要词语的种子; 初始聚类单元,用于基于所选择的种子构成与作为一个群集的种子相同的句子中表达的关键字; 以及聚类组合单元,用于通过组合所构成的簇中的相似簇来提取分类的主题集。

Patent Agency Ranking