형태소 합성 장치 및 방법

    公开(公告)号:KR101929509B1

    公开(公告)日:2018-12-14

    申请号:KR1020180111140

    申请日:2018-09-17

    Abstract: 형태소 합성 장치로서, 입력 문장을 구성하는 제1 형태소 및 제2 형태소를 추출하고, 상기 제1 형태소에 대한 제1 품사 정보 및 상기 제2 형태소에 대한 제2 품사 정보를 결정하고, 상기 제1 형태소, 상기 제2 형태소, 상기 제1 품사 정보 및 상기 제2 품사 정보에 벡터화 알고리즘을 적용하여 제1 형태소 임베딩 벡터, 제2 형태소 임베딩 벡터, 제1 품사 정보 임베딩 벡터 및 제2 품사 정보 임베딩 벡터를 각각 생성하는 전처리부, 상기 제1 형태소 임베딩 벡터, 상기 제1 품사 정보 임베딩 벡터, 상기 제2 형태소 임베딩 벡터, 상기 제2 품사 정보 임베딩 벡터 순으로 제1 GRU(Gated Recurrent Unit)에 입력하여 상기 입력 문장에 대한 컨텍스트 벡터를 생성하는 인코딩부, 상기 컨텍스트 벡터 및 문장의 시작을 알리는 개시 임베딩 벡터를 제2 GRU에 입력하여 제1 음절을 출력하 고, 상기 제1 음절의 임베딩 벡터를 상기 제2 GRU에 입력하여 제2 음절을 출력하는 디코딩부, 그리고 상기 제1 음절 및 상기 제2 음절을 이용하여 상기 제1 형태소 및 상기 제2 형태소가 합성된 문장을 생성하는 문장 생성부를 포함한다.

    지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템 및 방법

    公开(公告)号:KR101724398B1

    公开(公告)日:2017-04-18

    申请号:KR1020160002116

    申请日:2016-01-07

    Abstract: 본발명은지식베이스를이용하여개체명인식을위한코퍼스생성시스템및 방법에관한것으로, 위키피디아(Wikipedia)를이용하여개체명컨셉사전을구축하는단계와, 상기위키피디아의문장을추출하고, 상기추출된문장을상기개체명컨셉사전의개체타입과비교하여일치하는문장에대해서태깅하는단계와, 프리베이스(Freebase) 관계들중 상기개체타입별인스턴스보유량순서에따라기설정된순위까지관계만을추출하는단계와, 상기추출된관계내 인스턴스를포함하는문장을웹으로부터수집하고, 상기수집된문장을상기프리베이스에서정의한상기개체타입으로태깅하는단계및 상기위키피디아를이용하여태깅한문장과상기프리베이스를이용하여태깅한문장을통합하여개체명인식코퍼스를생성하는단계를포함하고, 상기일치하는문장에대해서태깅하는단계는, 상기위키피디아의모든문장을추출시 상기위키피디아에대한 XML 형태의파일에서텍스트이외의정보를제거하고, 상기텍스트만남은 XML 형태의파일을문장단위로분할하여추출한다.

Patent Agency Ranking