-
公开(公告)号:KR100569194B1
公开(公告)日:2006-04-10
申请号:KR1020040057197
申请日:2004-07-22
Applicant: 한국전자통신연구원
IPC: H04N5/243
Abstract: 본 발명은 휴대형 카메라를 이용하여 획득한 문서영상의 기하학적 왜곡에 대한 자동 보정방법에 관한 것으로, 카메라를 통해 입력된 문서영상을 영상처리하고, 문서영상의 문자영역 형태를 분석한 후에, 특징이 되는 점들의 좌표를 찾고, 이들을 이용하여 원래의 형태로 복원할 수 있는 변형함수를 찾아내고, 역 매핑을 이용하여 원래의 형상으로 보정하는 것이다.
카메라 문서영상, 문자인식, 기하학적 왜곡보정, 왜곡영상, 보정영상-
公开(公告)号:KR1020010083265A
公开(公告)日:2001-09-01
申请号:KR1019990061946
申请日:1999-12-24
Applicant: 한국전자통신연구원
IPC: G06K9/00
CPC classification number: G06K9/4604 , G06K9/6828 , G06K2209/01
Abstract: PURPOSE: A device and method for extracting a character characteristic for recognizing a many languages printed letter document is provided to enhance a character recognizing rate in many languages printed letter document by extracting a character portion of an input character image and a geometric property from a fixed sized mesh. CONSTITUTION: An input device(101) inputs a character necessary for extracting a character property. A standard character set constructing device(102) constructs a standard input character set by printing many languages characters of inputted all sorts of fonts as various character sizes in a fixed form. A database constructing device(103) constructs a standard character image database by receiving a character image by differing a resolution and a concentration of the standard input character set using a scanner. A size normalizing device(104) normalizes the inputted character image as a fixed size. A converting device(105) converts the size-normalized character image into a property of mesh shape of 16X16 size through 3X3 mask operation. A stroke property extracting device(106) extracts a property of a character portion out of geographic information of each character in a mesh. A non-stroke property extracting device(107) extracts a property of a background portion out of geographic information of each character in a mesh. A character property extracting device(108) extracts a property of a character from the stroke property and the non-stroke property. A storing device(109) stores the extracted information.
Abstract translation: 目的:提供一种用于提取用于识别多种语言的印刷字母文件的字符特征的装置和方法,以通过从固定的方式提取输入字符图像的字符部分和几何属性来增强许多语言的印刷字母文档中的字符识别率 尺寸网格。 构成:输入装置(101)输入提取字符属性所需的字符。 标准字符集构成装置(102)通过以固定形式将各种字体的输入各种字体的多种语言字符打印出来,构成标准输入字符集。 数据库构成装置(103)通过使用扫描仪不同分辨率和标准输入字符集的浓度来接收字符图像来构建标准字符图像数据库。 尺寸归一化装置(104)将输入的字符图像归一化为固定尺寸。 转换装置(105)通过3X3掩码操作将大小归一化的字符图像转换成16×16大小的网格形状的属性。 笔画特征提取装置(106)从网格中的每个字符的地理信息中提取字符部分的属性。 非笔画特征提取装置(107)从网格中的每个字符的地理信息中提取背景部分的属性。 字符特征提取装置(108)从笔划特性和非笔划特性提取字符的属性。 存储装置(109)存储所提取的信息。
-
公开(公告)号:KR100248381B1
公开(公告)日:2000-03-15
申请号:KR1019970067557
申请日:1997-12-10
Applicant: 한국전자통신연구원
Abstract: 본 발명은 다중폰트 문자 인식기에서 폰트들을 효과적으로 분류(clustering)함으로써 인식대상 폰트수가 늘어날수록 학습 데이타량이 많아지고 문자 인식률도 낮아지는 것을 개선하기 위하여 발명된 것이다.
본 발명의 수행 과정은 첫째로, 대상이 되는 많은 폰트들을 우선 제조회사별로 나누고 다시 명조, 고딕, 궁서등의 계열별로 나누어, 각 계열마다 폰트 면적중 글자부분이 차지하는 면적이 가장 큰 폰트를 기준 폰트로 선정한다. 둘째로, 기준으로 선정된 폰트들을 인접 관계점 탐색 알고리즘을 이용하여 자모의 형태가 유지되는 범위내에서 최대한 확장한다. 셋째로, 각 계열별로 폰트들을 논리합(OR) 연산한 결과와 확장된 기준 폰트들을 이용하여 평균 ORCR(out ranged character ratio)을 구하고 그 값이 기준 ORCR을 초과하는 경우에는 해당 계열 폰트들을 2개의 그룹으로 재분류한다. 넷째로, 앞의 과정들로 분류된 폰트들을 그룹별로 논리곱(AND) 연산하여 그 결과의 글자형태가 타글자와 구분가능할 정도로 유지되지 않을때만 재분류하여 두 개 이상의 그룹으로 분류하고 각 그룹별로 학습 데이타를 얻음으로써 각각 폰트마다 학습 데이타를 구하는 것보다 획기적으로 학습 데이타량을 줄이는 효과를 얻는다.-
公开(公告)号:KR1020060033973A
公开(公告)日:2006-04-21
申请号:KR1020040083074
申请日:2004-10-18
Applicant: 한국전자통신연구원
CPC classification number: G06T5/006 , G06K9/32 , G06K2209/01
Abstract: 1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정 장치 및 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 문서 영상을 획득하여 문자 인식을 수행하는 과정에서, 문서 영상 자체만으로 이진화 및 영역 분할를 수행하고 어파인 변환을 수행함으로써, 왜곡없는 문자 인식을 수행하기 위한, 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
문서 영상의 기하학적 왜곡 보정 방법에 있어서, 상기 문서 영상을 이진화하는 이진화 단계; 이진화된 문서 영상으로부터 문자열을 생성하는 문자열 생성 단계; 생성된 문자열을 이용하여 문서 영상에 외접하는 수평/수직 방향의 직선을 추출하는 직선 추출 단계; 및 추출된 수평/수직 방향의 직선이 형성하는 사변형 영역을 어파인변환을 이용하여 직사각형 영역으로 변환하는 어파인변환 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 문자 인식 기술에 이용됨.
문자 인식, 문서 영상, 어파인변환, 왜곡 보정-
5.
公开(公告)号:KR1020050055509A
公开(公告)日:2005-06-13
申请号:KR1020030088731
申请日:2003-12-08
Applicant: 한국전자통신연구원
CPC classification number: G06T5/005 , H04N5/455 , H04N2005/4453
Abstract: 본 발명의 목적은 장면 전환이 2회 이상 발생한 경우 배경과 물체의 움직임이 있을 때 모자이크 기법을 이용하여 문자 영역의 원영상을 정확하게 복원하는 것으로, 이와 같은 본 발명의 목적을 달성하기 위한 모자이크 기법을 이용한 동영상 문자 영역의 원 영상 복원 장치는, 입력되는 동영상(비디오영상)으로부터 영상 장면 전환 정보를 추출하는 동영상 장면 전환 정보 추출수단과, 상기 입력되는 동영상(비디오영상)으로부터 복원될 자막영역 정보를 추출하는 자막 영역 정보 추출수단을 포함하는 동영상 문자영역의 원영상 복원장치에 있어서, 상기 동영상 장면 전환 정보 추출수단에서 추출된 동영상 장면 전환 정보와 입력되는 모션정보에 의해서 자막영역에서 장면 전환이 2회 이상 발생한 경우에 자막영역의 원영상 복원을 제어하는 제어수단과, 상기 제어수단의 제어에 따라, 상기 동영상 장면 전환 정보 추출수단에서 추출된 동영상 장면 전환 정보와 상기 자막 영역 정보 추출수단에서 추출된 자막영역의 2배 영역 위치 정보를 이용하여, 그 자막영역에서의 배경 및 물체의 모션 정보를 추출하는 모션 정보 추출수단과, 상기 모션정보 추출수단에서 추출된 모션 정보에 대응하는 모션 발생값이 기 설정된 임계값 이상일 때, 상기 제어수단의 제어에 따라 모자이크 기법을 이용한 원영상 복원 방법을 수행하는 제1 원영상 복원수단을 포함하여 구성되는 것을 특징으로 한다.
-
公开(公告)号:KR100411894B1
公开(公告)日:2003-12-24
申请号:KR1020000083420
申请日:2000-12-28
Applicant: 한국전자통신연구원
IPC: G06T7/40
CPC classification number: G06K9/00456
Abstract: A method for region analysis of a document image applied to region analysis system of a document image, the method includes the steps of: a) analyzing a connected component though a reduced documentimage; b) classifying the connected component by generating a tree according to analysis result of the connected component; c) grouping text components from the classified connected component according to a spatial connection; and d) refining a text block by repeating segmentation and merge of the connected component after the grouping.
Abstract translation: 一种用于对文档图像的区域分析系统应用的文档图像进行区域分析的方法,该方法包括以下步骤:a)通过减少的文档图像分析连接的组件; b)根据所连接的组件的分析结果通过生成树来对连接的组件进行分类; c)根据空间连接对来自分类的连接组件的文本组件进行分组; 以及d)通过在分组之后重复连接组件的分段和合并来改进文本块。
-
公开(公告)号:KR100319756B1
公开(公告)日:2002-01-09
申请号:KR1020000002772
申请日:2000-01-21
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 논문 문서영상 구조 분석 방법 및 그 기록매체에 관한 것으로, 인간의 지각에 의존해오던 논문 문서영상으로부터 제목, 저자, 요약 부분의 위치검출과 그 내용인식을 자동으로 수행하기 위한 논문 문서영상 구조 분석 방법 및 그 기록매체를 제공하기 위하여, 데이터베이스 검색시스템에서 논문 문서영상의 구조를 분석하는 방법에 있어서, 논문 문서영상의 영역을 분할하고, 분할된 각 영역의 속성을 분류하는 제 1 단계; 속성이 텍스트인 영역들중 요약과 서론을 나타내는 소정의 단어영역이 될 수 있는 후보영역을 설정하고, 후보영역으로부터 소정의 단어영역을 찾아 요약의 내용부분의 위치를 파악하는 제 2 단계; 기본 형식과 유형 정의(TD)를 이용하여 속성이 텍스트인 제목과 저자 부분을 분리하는 제 3 단계; 및 추출된 제목, 저자, 요약 내용을 문자인식하여 논문 문서영상의 목차를 자동으로 생성하는 제 4 단계를 포함하며, 논문의 검색 및 제공을 목적으로 하는 데이터베이스를 구축함에 있어 방대한 양의 논문관련 데이터베이스의 검색 등에 이용됨.
-
公开(公告)号:KR100277831B1
公开(公告)日:2001-01-15
申请号:KR1019980043240
申请日:1998-10-15
Applicant: 한국전자통신연구원
IPC: G06T9/00
Abstract: 본 발명은 스캐너로 입력 받은 문서 영상에서 표(table) 영역을 찾아내고 표의 테두리선들을 내용과 분리하는 방법에 관한 것이다. 먼저, 스캐너로 입력한 문서 영상을 영역 해석하여 텍스트 영역과, 그림 영역으로 분할하고, 그림 영역으로 분할된 영역들을 흑점밀도 및 테두리선을 추출함으로써 그림 영역에서 표 영역을 분리한다.
본 발명에 따라 표를 분석하는 방법은, 문서 영상을 텍스트 후보 영역과 그림 후보 영역으로 분리한 후, 분리된 그림 후보 영역을 분석하여 표의 테두리선들을 추출하는 문서 영상에서의 표 분석방법에 있어서, 상기 그림 후보 영역의 흑점밀도를 측정하여 표 후보 영역을 추출하는 제1단계와; 상기 표 후보 영역의 수평, 수직 테두리선을 추출하는 제2단계; 상기 표 후보 영역의 수평, 수직 테두리선 중 최외각 수평, 수직 테두리선들을 추출하고, 이를 기준으로 표 영역을 추출하는 제3단계; 및 상기 표 영역에서 제외된 표 후보 영역을 그림 영역으로 등록하는 제4단계를 포함한 것을 특징으로 한다.-
公开(公告)号:KR100607558B1
公开(公告)日:2006-08-01
申请号:KR1020040064357
申请日:2004-08-16
Applicant: 한국전자통신연구원
IPC: G06T7/60
Abstract: 본 발명은 수정된 centorid linkage 방법을 사용하여 대용량 위성 영상에 대해 영역을 분할하기 위한 방법에 관한 것으로, a) 입력된 영상에 대해 일정한 크기로 영역을 생성하고, 생성된 영역들 각각에 대해 화소의 가로 및 세로방향 좌표를 초기화하는 단계; b) 상기 단계에서 초기화된 화소 중 현재 화소(I(x,y))에 대해 현재 화소(I(x,y))와 이전 행의 같은 위치에 있는 화소 값의 평균 값(m(r(x-1,y))의 차(D1)를 구하고, 현재 화소(I(x,y))와 같은 행 이전 화소의 평균값(m(r(x,y-1))의 차(D2)를 각각 구하는 단계; c) 상기 단계에서 구해진 D1과 D2 값 중 최소 값과 기준값인 경계치(T)와의 크기를 비교하여 D1과 D2 값 중 최소 값이 경계치(T)보다 클 경우 현재 화소(I(x,y))를 새로운 영역으로 등록하는 단계; 및 d) 상기 c)단계에서 D1과 D2 값 중 최소 값이 경계치(T)보다 작은 경우 x좌표와 y좌표를 증가시켜 다음 행 또는 열에 위치하는 화소들에 대해 상기 a)단계부터 c)단계를 y좌표가 기준값과 동일할 때까지 반복적으로 수행하는 것에 의해 새로운 영역을 생성하는 단계;를 수행하는 것에 의해 위성영상으로부터 영역을 분할한다.
위성영상, 영역분할, 영역생성, 영역병합Abstract translation: 本发明涉及一种使用改进的半环形连接方法来分割大尺寸卫星图像的方法,该方法包括以下步骤:a)相对于输入图像产生预定尺寸的区域, 初始化水平和垂直坐标; b)计算当前像素I(x,y)和前一行相对于当前像素I(x,y)的相同位置处的像素值的平均值m(r(x,y) (I(x,y))的相同行之前的像素(I(x,y-1))通过从平均值m减去差D2而获得 C)将在上述步骤中获得的D1和D2的值中的最小值与作为参考值的阈值T进行比较,并且如果值D1和D2的最小值大于阈值T, d)如果步骤c)中D1和D2的值的最小值小于阈值(T),则增加x坐标和y坐标, (a)至(c)重复执行,直到y坐标等于参考值,从而将该区域与卫星图像分开。
-
公开(公告)号:KR1020020055454A
公开(公告)日:2002-07-09
申请号:KR1020000083420
申请日:2000-12-28
Applicant: 한국전자통신연구원
IPC: G06T7/40
CPC classification number: G06K9/00456
Abstract: PURPOSE: A method of interpreting a document image area is provided to extract connected components to group the connected components as tree structures according to spacial relations, and to readjust the components in a text area via separating/combining procedures, thereby efficiently interpreting a document structure. CONSTITUTION: Connected components are analyzed through a reduced document image(61, 62). A tree is generated by an analyzed result of the connected components, to classify the connected components(63, 64). Text factors are grouped according to spacial relations from the classified connected components. A text block is readjusted through separation/combination procedures of the connected components. The step of generating the tree and classifying the connected components comprises the steps as follows. The tree is constructed from types of the connected components. Connected components including tables, frames, and pictures are grouped as independent nodes with text. Connected components within a text block surrounded by margins are grouped. Nodes which are not grouped are classified by areas of the connected components.
Abstract translation: 目的:提供一种解释文档图像区域的方法,以提取连接的组件,以根据空间关系将连接的组件分组为树结构,并通过分离/组合过程重新调整文本区域中的组件,从而有效地解释文档结构 。 构成:通过缩小的文档图像分析连接的组件(61,62)。 通过连接的组件的分析结果生成树,以对连接的组件进行分类(63,64)。 文本因素根据与分类的连通组件的空间关系进行分组。 通过连接组件的分离/组合程序重新调整文本块。 生成树并对连接的组件进行分类的步骤包括以下步骤。 树是由连接的组件的类型构成的。 连接的组件,包括表,框架和图片被分组为具有文本的独立节点。 通过边距包围的文本块中的已连接组件进行分组。 未分组的节点按照连接组件的区域进行分类。
-
-
-
-
-
-
-
-
-