-
公开(公告)号:KR101413229B1
公开(公告)日:2014-08-06
申请号:KR1020130053828
申请日:2013-05-13
Applicant: 한국과학기술원
CPC classification number: G01S3/8006
Abstract: A direction of arrival (DOA) estimation device and method is disclosed. The present invention may comprise a sensor unit for sensing a signal and including at least two sensors to output a sensor signal which is a sensing signal for the sensed signal; and a control unit for calculating statistical distribution data for describing the statistical distribution of the sensor signal per sensor signal which is output by the two sensors respectively, extracting the statistical distribution data for describing the statistical distribution of a sound source signal which is a non-stationary signal contained in the signal on the calculated statistical distribution data, and estimating the direction of the sound source which outputs the sound source signal on the basis of the extracted statistical distribution data.
Abstract translation: 公开了到达方向(DOA)估计装置和方法。 本发明可以包括用于感测信号并且包括至少两个传感器以输出作为感测信号的感测信号的传感器信号的传感器单元; 以及控制单元,用于计算用于描述由两个传感器输出的每个传感器信号的传感器信号的统计分布的统计分布数据,提取用于描述作为非传感器的声源信号的统计分布的统计分布数据, 在所计算的统计分布数据中包含在信号中的固定信号,以及基于所提取的统计分布数据来估计输出声源信号的声源的方向。
-
公开(公告)号:KR101359660B1
公开(公告)日:2014-02-07
申请号:KR1020110073883
申请日:2011-07-26
Applicant: 한국과학기술원
Abstract: 본 발명은 헤드업 디스플레이를 위한 증강현실 시스템에 관한 것으로서, 기존의 Display 방식과 달리 운전자의 머리와 눈 위치를 추적하여 운전자에 최적화된 시선 내에 외부 시야와 더불어 주행에 필요한 정보를 증강 현실로 구현하는 시스템을 제공함에 그 목적이 있다.
이러한 목적을 달성하기 위한 본 발명은, 다중 비전 센서 및 두 개 이상의 스테레오 카메라를 이용하여, 차량의 내외부의 영상정보를 수집하는 센서장치; 차량 외부 객체에 관한 3차원 위치정보를 추출하고, 운전자 눈의 위치정보를 검출하는 상황 인식장치; 및 상기 상황 인식장치를 통해 추출한 객체의 위치정보와 운전자의 눈의 위치정보를 이용하여 운전자 시점에서의 2차원 이미지를 생성하고, 운전자의 위치정보 및 각종 주변상황정보를 2차원 이미지에 투영하여 증강현실을 구현하는 증강현실 구현장치; 를 포함한다.-
23.
公开(公告)号:KR1020130085697A
公开(公告)日:2013-07-30
申请号:KR1020120006668
申请日:2012-01-20
Applicant: 한국과학기술원
IPC: G06T7/00
CPC classification number: G06T7/0081 , G06T7/11 , G06T7/162
Abstract: PURPOSE: An image partitioning method using high-order correlation clustering, a system processing the same, and a recording medium are provided to implement image partitioning quickly by processing a wider region at once. CONSTITUTION: A system divides an input image into super pixels (S210). The system constructs a hyper graph from two or more neighboring super pixels among the obtained super pixels through a connection in consideration of a specific condition (S220). The system extracts a feature vector of each edge of the hyper graph, forms a joint feature map, and partitions the constructed hyper graph through high-order correlation clustering (S230). [Reference numerals] (AA) Start; (BB) End; (S210) System divides an input image into super pixels; (S220) System constructs a hyper graph from two or more neighboring super pixels among the obtained super pixels through a connection in consideration of a specific condition; (S230) System extracts a feature vector of each edge of the hyper graph, forms a joint feature map, and partitions the constructed hyper graph through high-order correlation clustering
Abstract translation: 目的:提供使用高阶相关聚类,系统处理相同的图像分割方法和记录介质,以通过一次处理更宽的区域来快速实现图像分割。 构成:系统将输入图像划分为超像素(S210)。 考虑到特定条件,系统通过连接从所获得的超像素中的两个或更多个相邻超像素构造超图(S220)。 系统提取超图的每个边缘的特征向量,形成联合特征图,并通过高阶相关聚类分割构造的超图(S230)。 (附图标记)(AA)开始; (BB)结束; (S210)系统将输入图像划分为超像素; (S220)系统通过考虑到特定条件的连接来构造所获得的超像素中的两个或更多个相邻超像素的超图; (S230)系统提取超图的每个边缘的特征向量,形成联合特征图,并通过高阶相关聚类分割构造的超图
-
公开(公告)号:KR1020130012629A
公开(公告)日:2013-02-05
申请号:KR1020110073883
申请日:2011-07-26
Applicant: 한국과학기술원
CPC classification number: G06T19/006 , G02B27/0179 , G02B2027/0187 , G06K9/3233 , G06K9/4633 , G06T7/143 , H04N13/204 , H04N13/271
Abstract: PURPOSE: An augmented reality system for a head-up display device is provided to implement intuitive information recognition of a driver by matching a virtual image synthesized from various information with a real view of a front glass part. CONSTITUTION: A sensor unit(100) collects image information of the inside and outside of a vehicle. A situation recognition unit(200) extracts location information of an external object from the image information. The situation recognition unit extracts the location information of an eye of a driver. An AR(Augmented Reality) realization unit(300) generates a two-dimensional image at a driver view point by using the extracted location information and the extracted eye location information. The AR realization unit projects the location information of the driver and various surrounding situation information onto the two-dimensional image. [Reference numerals] (100) Sensor unit; (200) Situation recognition unit; (300) Augmented reality realization unit
Abstract translation: 目的:提供一种用于平视显示装置的增强现实系统,以通过将从各种信息合成的虚拟图像与前玻璃部件的实际视图相匹配来实现对驱动器的直观信息识别。 构成:传感器单元(100)收集车辆内部和外部的图像信息。 情境识别单元(200)从图像信息中提取外部对象的位置信息。 情境识别单元提取驾驶员的眼睛的位置信息。 AR(增强现实))实现单元(300)通过使用提取的位置信息和所提取的眼睛位置信息在驾驶员视点产生二维图像。 AR实现单元将驾驶员的位置信息和各种周围情况信息投影到二维图像上。 (附图标记)(100)传感器单元; (200)状况识别单位; (300)增强现实实现单位
-
25.
公开(公告)号:KR101134597B1
公开(公告)日:2012-04-09
申请号:KR1020090082959
申请日:2009-09-03
Abstract: 본 발명은 사용자가 자신의 멀티미디어 컨텐츠를 네트워크 상의 저장 장소에 저장하고 관리할 수 있도록 하는 웹스토리지 서비스 제공방법 및 장치에 관한 것으로서, 더 구체적으로는, 사용자로부터 제공된 사진, 동영상 등과 같은 멀티미디어 컨텐츠 및 이에 대응되는 메타데이터를 분리하여 저장함으로써, 사용자가 다량의 컨텐츠 중에서 자신이 원하는 컨텐츠를 메타데이터를 이용하여 쉽게 검색할 수 있도록 하고, 사용자에게는 메타데이터는 제공하지 않고 검색된 컨텐츠만을 제공함으로써 사용자의 서비스 충성도를 높이기 위한 웹스토리지 서비스 제공방법 및 장치에 관한 것이다.
본 발명에 의하면, 네트워크 상에 저장 장소를 마련하여 사용자가 자신의 멀티미디어 컨텐츠를 저장할 수 있도록 하며, 각 컨텐츠에 대응하는 메타데이터를 활용함으로써 대량의 저장된 컨텐츠로부터 자신이 원하는 컨텐츠를 쉽게 검색할 수 있도록 한다.
또한 본 발명에 의하면, 컨텐츠와 대응되는 메타데이터를 분리하여 저장한 후 서비스 제공시 및 서비스 해지시에 사용자에게는 컨텐츠만을 전송하고 메타데이터는 전송하지 않아, 사용자는 서비스를 해지하는 경우 메타데이터가 없는 대량의 컨텐츠만을 다운로드 받게 되어 이러한 대량의 데이터를 재분류하는 것이 매우 어렵게 됨으로써, 서비스에서 이탈하는 것을 방지할 수 있게 한다.
멀티미디어 컨텐츠, 메타데이터, 웹스토리지, 분리저장-
公开(公告)号:KR101068016B1
公开(公告)日:2011-09-26
申请号:KR1020110042445
申请日:2011-05-04
Applicant: 한국과학기술원
IPC: G06F17/30
Abstract: 본 발명은 영상 자료를 데이터베이스에 입력할 때 영상자료를 분석하여 그 특징을 추출하고, 이를 이용하여 데이터베이스에 인덱스로 사용함으로써 영상 자료 자체를 검색어로 사용할 수 있도록 한 내용기반 영상 검색 방법 장치에 관한 것이다.
이러한 본 발명에 따른 영상 검색은 영역별로 핑거프린트를 추출하여 데이터베이스에 인덱스로 사용함으로써 각 영상의 내용을 기반으로 한 이미지 검색이 가능하고, 특히, 영역 탐색을 통해 추출되는 특정 영역이 영상의 크기 변화나 회전, 절삭에도 왜곡되지 않으므로 검색의 정확도가 높다.Abstract translation: 本发明涉及一种基于内容的图像检索方法装置,当图像数据被输入到数据库时,通过分析图像数据允许图像数据本身被用作检索词, 。
-
公开(公告)号:KR1020110094487A
公开(公告)日:2011-08-24
申请号:KR1020100013886
申请日:2010-02-16
Applicant: 한국과학기술원
CPC classification number: G06K9/4638 , G06F17/30858 , G06K9/6211 , G06T7/143 , G06T7/46 , G06T2207/20076
Abstract: PURPOSE: An apparatus and method for realizing multimedia content is provided to recognize a multimedia content with a video quality deterioration, a compression loss, a speed variation, or an editing added. CONSTITUTION: An image segment unit(300) extracts a finger print in each frame of an input image. The image segments unit divides the image into the segment unit using the extracted fingerprint. A Markov random field constructing unit(310) establishes the divided each segment as a node. The Markov random field constructing unit constructs an MRF(Markov Random Field) by establishing the observation variable and the hidden variable of each node. A variable value estimation unit(320) assumes the hidden variable for maximizing the probability value of the constructed Markov random field.
Abstract translation: 目的:提供一种用于实现多媒体内容的装置和方法,用于识别具有视频质量恶化,压缩丢失,速度变化或添加的编辑的多媒体内容。 构成:图像段单元(300)在输入图像的每一帧中提取指纹。 图像段单元使用提取的指纹将图像分割成段单元。 马尔可夫随机场构造单元(310)将划分的每个段建立为节点。 马尔可夫随机场构造单元通过建立观测变量和每个节点的隐藏变量构建MRF(马尔可夫随机场)。 可变值估计单元(320)假设用于使构造的马尔科夫随机场的概率值最大化的隐藏变量。
-
公开(公告)号:KR1020080047837A
公开(公告)日:2008-05-30
申请号:KR1020060117773
申请日:2006-11-27
Applicant: 한국과학기술원
Abstract: A BSAC arithmetic decoding method based on plural probability models is provided to add only a twentieth part of memory requirements to the memory requirements necessary to store probability models, thereby performing arithmetic decoding operation based on the plural probability models and managing the memory efficiently. A BSAC(Bit Sliced Arithmetic Coding) arithmetic decoding method comprises the following steps of: performing decoding using a probability value corresponding to a predetermined index and storing probability values corresponding the predetermined number of indexes around the predetermined index in a small table of which the number of elements is less than a predetermined number; determining whether a calculated new index is identical with a former index, index used immediately, when the new index different from the predetermined index is calculated; reusing a former probability value if the currently calculated index is identical with the former index; extracting and using a corresponding probability value from the small table if the calculated index corresponds to one of the predetermined number of indexes around the former index; comparing the currently calculated index with index used just before the former index if the currently calculated index has difference more than the element number of the small table; storing probability values corresponding to the predetermined number of indexes around the currently calculated index in the other small table with a size similar to that of the small table when the index used just before the former index and the currently calculated index are compared with each other; and performing the first process using the calculated index when the calculated index is different from the former index and the index used just before the former index. The number of elements on the small table is less than 128.
Abstract translation: 提供了一种基于多个概率模型的BSAC算术解码方法,仅将第二十部分的存储器要求添加到存储概率模型所需的存储器要求中,从而基于多个概率模型进行算术解码操作并有效地管理存储器。 BSAC(比特切换算术编码)算术解码方法包括以下步骤:使用与预定索引相对应的概率值来执行解码,并将与预定索引周围的预定索引数相对应的概率值存储在小型表中 的元素小于预定数量; 当计算出与所述预定索引不同的新索引时,确定所计算的新索引是否与立即使用的前索引相一致; 如果当前计算的索引与前一个索引相同,则重新使用前一概率值; 如果所计算的索引对应于围绕前一索引的预定数量的索引之一,则从小表提取并使用相应的概率值; 将当前计算出的指数与前一个指数之前使用的指数进行比较,如果当前计算的指数与小表的元素数目有差异; 将与前一个索引之前使用的索引和当前计算出的索引进行比较,将与当前计算出的索引周围的预定数量的索引相对应的概率值存储在另一个小表格中,其大小与小表格的尺寸相似; 并且当所计算的指数与前一个索引不同且在前一个索引之前使用的索引不同时,使用计算的索引执行第一处理。 小桌子上的元素数量小于128。
-
29.
公开(公告)号:KR100733145B1
公开(公告)日:2007-06-27
申请号:KR1020050086557
申请日:2005-09-15
Applicant: 한국과학기술원
Abstract: 본 발명은 정규화된 스펙트럼 부밴드 중심점(Normalized Spectral Subband Centroid; NSSC)을 기반으로 핑거프린트를 생성하는 방법과, 미지의 오디오 신호가 입력으로 주어졌을 때, 이를 이미 구축되어 있는 대용량 오디오 데이터베이스에서 검색하여 입력 오디오 신호에 대한 정보를 출력해 주기 위한 오디오 핑거프린팅 시스템에 대한 것이다. 오디오 핑거프린팅 시스템은 사용된 핑거프린트에 의해 그 성능이 크게 좌우된다. 본 발명의 NSSC 핑거프린트는 오디오 신호의 특징을 잘 나타내어 인식에 사용하기 적합하면서도 오디오 신호에 가해질 수 있는 여러 가지 왜곡들, 예를 들어 MP3 압축, 이퀄라이제이션(equalization) 등에 매우 강인하며, 대용량 데이터베이스 구축과 실시간 검색에도 유리한 장점을 가지고 있다. 실험 결과에 따르면, 본 발명에 의한 시스템은 기존의 오디오 핑거프린팅 시스템에 비해 향상된 성능을 보인다. 본 발명은 인터넷 상의 오디오 불법 유통을 막기 위한 실시간 필터링 서비스, 대용량 오디오 데이터베이스의 자동 인덱싱(indexing), 그리고 방송 모니터링 등에 응용될 수 있다.
핑거프린트, 정규화된 스펙트럼 부밴드 중심점, 오디오, MP3-
公开(公告)号:KR102235568B1
公开(公告)日:2021-04-05
申请号:KR1020190032038
申请日:2019-03-20
Applicant: 한국과학기술원
Abstract: 본발명은외부로부터오디오신호를입력받아분석하고합성곱신경망을통해학습하여주변환경에적합한환경음으로출력할수 있도록하는합성곱신경망기반환경음인식방법및 시스템에관한것이다. 본발명에따른합성곱신경망기반환경음인식시스템은, 오디오신호를입력받아멀티레졸루션단시간푸리에변환(Multi-resolution STFT)과멜프리퀀시필터뱅크변환및 로그변환을통해멀티레졸루션로그멜스펙트로그램을획득하는멀티레졸루션분석부; 상기멀티레졸루션로그멜스펙트로그램을입력받아합성곱연산및 풀링연산을실행하여환경음라벨데이터를출력하는합성곱신경망모듈부를포함할수 있다.
-
-
-
-
-
-
-
-
-