-
公开(公告)号:KR101500598B1
公开(公告)日:2015-03-10
申请号:KR1020140134458
申请日:2014-10-06
Applicant: 한국과학기술정보연구원
IPC: G06F17/21
CPC classification number: G06F17/218 , G06F17/24
Abstract: 본 발명은 저널이나 논문과 같은 문서로부터 효과적으로 XML 생성하여 생산성을 높이며 각 논문이나 각 저널의 구성 상이로 인해 자동화하기 어려운 부분에 대해 사용자가 원하는 XML의 생산이 용이하게 하기 위함이다.
이를 위해 본 발명은, 적어도 하나 이상의 시각적 콘텐트를 포함하는 파일을 입력 받는 단계, 시각적 콘텐트를 좌표화하여 HTML 형태의 텍스트 데이터를 추출하는 단계; 파일의 각 페이지를 이미지로 변환하여 저장하는 단계; 저장된 이미지에 포함된 적어도 하나 이상의 시각적 콘텐트로부터 적어도 하나 이상의 콘텐트 블록 영역을 추출하고 가시화하는 단계; 사용자의 입력 신호에 따라 가시화된 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 레이아웃을 수정하는 단계; 수정된 레이아웃에 대응하는 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계를 포함한다.Abstract translation: 本发明涉及可扩展化妆语言(XML)生成系统和XML生成方法。 本发明是从诸如日志或纸张的文档中有效地生成XML,以提高生产率,并且促进用户对自动化难度部分所需的XML的生成,这是由于 论文与期刊之间的结构差异。 为此,本发明提供了XML生成方法,包括以下步骤:输入包含至少一个视觉内容的文件; 通过使可视内容作为坐标,以超文本标记语言(HTML)的形式提取文本数据; 以图像的形式转换和存储文件的每个页面; 从包含在所存储的图像中的至少一个视觉内容提取和可视化至少一个内容块; 修改与根据用户的输入信号可视化的至少一个内容块区域对应的布局; 以及提取包含在与修改的布局相对应的内容块区域中的数据以生成XML。
-
公开(公告)号:KR101828995B1
公开(公告)日:2018-02-14
申请号:KR1020170057280
申请日:2017-05-08
Applicant: 한국과학기술정보연구원
IPC: G06F17/30
CPC classification number: G06F17/30613 , G06F17/30011 , G06F17/3069
Abstract: 키워드클러스터링방법이제공된다. 본발명의일 실시예에따른키워드클러스터링방법은, 키워드클러스터링장치에의해수행되는복수의키워드상에대한키워드클러스터링방법에있어서, 상기복수의키워드를이용하여복수의클러스터가포함된초기클러스터셋을구성하는단계, 상기초기클러스터셋에서, 단일키워드에서추출된특징에기반한특징벡터(feature vector) 간유사도가임계값 이상인클러스터를병합하는과정을반복하여, 중간클러스터셋을구성하는단계및 상기중간클러스터셋에서, 동일문서에포함된복수의키워드에서추출된특징에기반한특징벡터간 유사도가임계값 이상인클러스터를병합하는과정을반복하여, 최종클러스터셋을구성하는단계를포함할수 있다.
Abstract translation: 提供关键词聚类方法。 按照根据用于多个关键字由关键字聚类装置执行的关键字聚类方法本发明的一个实施例中的关键字聚类方法中,配置含有使用的关键字的数量的多个簇的起始簇集 步骤,从最初的簇集,其特征在于基于来自相似度之间的单个关键字矢量(特征矢量)抽取的特征是阈值或通过重复合并簇,中间群集步骤组成组和中间簇设置为过程较大 所示,通过重复该过程,其中多个基于从关键字在同一文件中提取的特征,合并比阈值大的簇的特征向量之间的相似性,可以是构成最终集的簇的步骤。
-
公开(公告)号:KR101713831B1
公开(公告)日:2017-03-09
申请号:KR1020160094921
申请日:2016-07-26
Applicant: 한국과학기술정보연구원
IPC: G06F17/30
CPC classification number: G06F17/30421
Abstract: 본발명은문서추천장치및 방법에관한것이다. 이를위해, 본발명은 DB로부터텍스트데이터를수집하는단계; 상기수집된텍스트데이터를토픽별로클러스터링하는단계; 상기토픽별로클러스터링된텍스트데이터에서이벤트를포함하는토픽문장을탐지하는단계; 상기탐지한토픽문장과연관된지식을추출하는단계; 개별텍스트컬렉션으로부터워드벡터들을생성하는단계; 상기추출된연관된지식과상기생성된워드벡터들을결합하여이기종정보네트워크를생성하는단계; 입력단어에대응하여상기생성된네트워크내의타겟텍스트컬렉션으로부터상기워드벡터를활용하여확장단어를생성하는단계; 및상기확장단어를기반으로상기타겟컬렉션으로부터문서를추천하는단계;를포함한다.
-
-