-
公开(公告)号:KR101393642B1
公开(公告)日:2014-05-13
申请号:KR1020120083542
申请日:2012-07-30
Applicant: 숭실대학교산학협력단
Abstract: 문서 인식 장치 및 방법과 이에 관한 기록매체가 개시된다. 개시된 문서 인식 장치는 계층 구조를 갖는 문장들을 표시하기 위한 다수의 셀로 구성된 표를 포함하는 문서를 인식하는 장치에 있어서, 상기 다수의 셀 중 어느 하나의 셀을 기준 셀로 설정하는 기준 셀 설정부; 및 상기 기준 셀의 가로 방향에 위치하는 셀 내에 상기 계층 구조를 나타내는 식별자가 포함되어 있는지를 판단하고, 상기 판단 결과에 기초하여 상기 기준 셀의 가로 방향 및 세로 방향 중 어느 하나의 방향을 셀 분석 방향으로 설정하고, 상기 설정된 셀 분석 방향으로 셀을 분석하여 상기 다수의 셀간 계층 구조를 판단하는 판단부;를 포함한다.
-
公开(公告)号:KR1020140016666A
公开(公告)日:2014-02-10
申请号:KR1020120083542
申请日:2012-07-30
Applicant: 숭실대학교산학협력단
CPC classification number: G06K9/00463 , G06F17/21 , G06F17/27
Abstract: A document recognizing device, a method, and a recording medium relating to the same are disclosed. A device recognizing a document including tables composed of a plurality of cells for displaying sentences having a layered structure includes a reference cell setting part setting one of the cells as a reference cell and a determining part determining whether a cell placed in a width direction of the reference cell includes an identifier indicating the layered structure, setting the width direction or height direction of the reference cell as a cell analysis direction based on the determination result, and determining the layered structure between the cells by analyzing the cells in the cell analysis direction. [Reference numerals] (AA) START; (BB) Table; (CC,EE,GG,II,KK,NN) NO; (DD,FF,HH,JJ,LL,MM) YES; (OO) 1-3 type; (PP) 1-1 type; (QQ) 1-2 type; (RR) 2-2 type; (S510) Set a reference cell; (S512) Include an identifier in a cell of a first raw and a first column?; (S514) Include the identifier in a cell of a second raw and the first column?; (S521) Include the identifier in a right cell of the reference cell; (S522) Set a cell analysis direction as a horizontal direction; (S523) Set the cell analysis direction as a vertical direction; (S524) Cell exists under the reference cell?; (S525) Number of reference cells is the same as the number of right cells of the reference cell?; (S526) Layer of an under cell is the same as a layer of the reference cell?; (SS) 2-1 type; (TT) Basic table; (UU) END
Abstract translation: 公开了一种与其相关的文件识别装置,方法和记录介质。 识别包括由用于显示具有分层结构的句子的多个单元组成的表格的文档的设备包括:设置单元之一作为参考单元的参考单元设置部分,以及确定单元是否设置在宽度方向上的单元 参考单元包括指示分层结构的标识符,基于确定结果将参考单元的宽度方向或高度方向设置为单元分析方向,并且通过分析单元分析方向上的单元来确定单元之间的分层结构。 (附图标记)(AA)START; (BB)表; (CC,EE,GG,II,KK,NN)NO; (DD,FF,HH,JJ,LL,MM)是; (OO)1-3型; (PP)1-1型; (QQ)1-2型; (RR)2-2型; (S510)设置参考单元; (S512)在第一个原始和第一个列的单元格中包含标识符? (S514)将标识符包含在第二个raw和第一列的单元格中; (S521)将标识符包含在参考单元的右侧单元格中; (S522)将单元分析方向设为水平方向; (S523)将单元分析方向设为垂直方向; (S524)细胞存在于参考细胞下? (S525)参考单元的数量与参考单元格的右侧单元格的数量相同; (S526)下电池的层与参考电池的层相同; (SS)2-1型; (TT)基本表; (UU)END
-