Patent search ap:("한국전자통신연구원" OR "재단법인서울대학교산학협력재단") AND inv:"장인선" Page 7

61.

发明公开
파일 내 트랙 그룹핑 방식 및 그 시스템 无效
Title translation: 在文件中分组轨迹的系统和方法

公开(公告)号：KR1020100000846A

公开(公告)日：2010-01-06

申请号：KR1020080060494

申请日：2008-06-25

Applicant: 한국전자통신연구원 , (주)오디즌

Inventor： 장인선 , 서정일 , 김휘용 , 이태진 , 강경옥 , 홍진우 , 김진웅 , 안치득 , 함승철

IPC: G11B20/10 , G10L19/00

CPC classification number: G10L19/0019 , G10L19/008 , G11B27/102 , G11B27/322

Abstract: PURPOSE: A system and a method of grouping tracks inside a file are provided to group presentation metadata when multimedia tracks include overlapped presentation metadata, thereby storing the grouped metadata in a file. CONSTITUTION: A plurality of multimedia tracks is saved according to a file format like the ISO file format. The multimedia tracks are compressed in the same encoding method. If parts of presentation metadata information about an included audio track are the same, the metadata information is displayed using a group box not to overlappingly save the metadata information.

Abstract translation: 目的：当多媒体轨道包括重叠的呈现元数据时，提供将文件内的轨道分组的系统和方法来组合表示元数据，由此将分组的元数据存储在文件中。构成：根据ISO文件格式的文件格式保存多个多媒体轨道。多媒体轨道以相同的编码方式进行压缩。如果关于所包括的音轨的演示元数据信息的部分相同，则使用不重叠保存元数据信息的组框来显示元数据信息。

62.

发明授权
음상 외재화를 위한 머리전달함수 생성 방법과, 그를이용한 3차원 오디오 신호 처리 장치 및 그 방법 有权
Title translation: 음상외재화를위한머리전달함수생성방법법，그를이용한3차원오디오신호처리장치및그방

公开(公告)号：KR100932791B1

公开(公告)日：2009-12-21

申请号：KR1020080040073

申请日：2008-04-29

Applicant: 한국전자통신연구원

Inventor： 장인선 , 이용주 , 장대영 , 이태진 , 서정일 , 강경옥 , 홍진우 , 김진웅 , 안치득

IPC: H04S3/00 , H04S5/00

Abstract: 본 발명은 음상 외재화를 위한 머리전달함수 생성 방법과, 그를 이용한 3차원 오디오 신호 처리 장치 및 그 방법에 관한 것으로서, 구체(球體) 마이크로폰으로 측정된 멀티채널 룸 임펄스 응답을 통해 모델링된 머리 전달 함수(HRTF)를 이용하여 3차원 오디오 신호를 생성함으로써, 음상 내재화를 제거하여 3차원 오디오 신호의 현장감(현실감)을 증대시키고자 한다.
이를 위하여, 본 발명은, 멀티채널 임펄스 응답을 이용한 3차원 오디오 신호 처리 장치에 있어서, 오디오 데이터를 디코딩하여 원래의 오디오 신호를 복원하기 위한 오디오 디코딩 수단; 및 구체(球體) 마이크로폰으로 측정된 멀티채널 룸 임펄스 응답을 통하여 모델링된 머리 전달 함수(HRTF)를 이용하여, 상기 복원된 오디오 신호에 대한 3차원 오디오 신호를 생성하기 위한 3차원 오디오 생성 수단을 포함한다.
3차원 오디오, 입체 음향, 고현장감, 머리 전달 함수, HRTF, 멀티채널 임펄스 응답, 구체 마이크로폰, 음상 외재화

Abstract translation: 提供了一种用于生成用于声音外部化的头部相关传递函数的方法，使用该方法处理3D音频信号的设备和方法，以通过执行3D音频信号处理来增强3D音频信号的存在，所述3D音频信号处理是通过通过由球形麦克风从空间测量的室内脉冲响应。高现场多媒体再现系统（30）包括解复用部分（31），视频解码器（32），音频解码器（33）和3D音频生成部分（34）。解复用部分将多媒体数据分离为视频数据和音频数据。视频解码器将分离的视频数据解码为原始视频信号。音频解码器通过解码音频数据来解码原始音频信号。 3D音频生成部分通过由球形麦克风测量的多声道房间脉冲响应建模的头部相关传递函数生成关于解码的音频信号的3D音频信号。

63.

发明授权
다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법 有权
Title translation: 用于编码和解码多个通道的多目标音频信号的装置和方法

公开(公告)号：KR100917843B1

公开(公告)日：2009-09-18

申请号：KR1020070098663

申请日：2007-10-01

Applicant: 한국전자통신연구원

Inventor： 백승권 , 서정일 , 이태진 , 이용주 , 장인선 , 유재현 , 장대영 , 홍진우 , 김진웅 , 강경옥

IPC: G10L19/008 , G10L19/20 , H04N21/233

CPC classification number: G10L19/00 , G10L19/008 , G10L19/20

Abstract: 1. 청구범위에 기재된 발명이 속한 기술분야
다양한 채널의 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법에 관한 것임.
2. 발명이 해결하고자 하는 기술적 과제
다양한 채널로 구성된 다객체 오디오 신호 부호화 및 복호화 장치 및 방법을 제공함.
3. 발명의 해결방법의 요지
상기 서로 상이한 채널로 구성된 다객체 오디오 신호를 하나의 다운믹스된 오디오 신호로 다운믹싱하며, 상기 서로 상이한 채널로 구성된 다객체 오디오 신호 각각에 대한 헤더 정보 및 공간큐 정보를 포함하는 부가정보를 추출하는 다운믹싱수단; 상기 다운믹싱된 오디오 신호를 부호화하는 부호화수단; 및 상기 부가정보를 비트스트림으로 생성하는 부가정보 부호화수단을 포함하되, 상기 헤더 정보는 상기 서로 상이한 채널로 구성된 다객체 오디오 신호 각각에 대한 식별자 정보; 및 상기 서로 상이한 채널로 구성된 다객체 오디오 신호에 대한 채널 정보를 포함함.
4. 발명의 중요한 용도
오디오 부호화 및 복호화에 이용됨.
오디오 객체, 다채널, 다객체

64.

发明授权
ＨＨＴ를 이용한 음성 및 오디오 신호의 부호화/복호화장치 및 방법 失效
Title translation: 使用HILBERT-HUANG变换编码/解码具有强非固定属性的信号的方法和装置

公开(公告)号：KR100911994B1

公开(公告)日：2009-08-13

申请号：KR1020070080901

申请日：2007-08-10

Applicant: 한국전자통신연구원

Inventor： 장인선 , 백승권 , 장대영 , 강경옥 , 유정주 , 강홍구 , 이창헌 , 이동금

IPC: G10L19/02 , H03M7/30 , H04N21/233

Abstract: 본 발명은 음성 및 오디오 신호의 코딩 및 디코딩에 관한 것으로서, 더욱 구체적으로는 HHT(Hilbert-Huang Transform)을 이용하여 음성 및 오디오신호와 같이 비정규적(non-stationary) 특성이 강한 입력신호를 동시에 부호화 및 복호화 할 수 있는 장치 및 방법에 관한 것이다.
본 발명은 입력신호에 대하여 HHT를 적용하여 각기 다른 주파수 대역을 갖는 신호들로 분리하는 단계와, 상기 분리된 신호 각각을 독립적으로 부호화하는 단계 및 상기 독립적으로 부호화된 각각의 신호를 다중화하는 단계를 포함하는 부호화 방법을 제공한다.
힐버트 변환, EMD, HHT, intrinsic mode function,

65.

发明公开
가변 서브밴드 분석을 이용한 부호화와 복호화 방법 및 그 장치 无效
Title translation: 使用可变子带分析的编码和解码方法及其设备

公开(公告)号：KR1020090037806A

公开(公告)日：2009-04-16

申请号：KR1020080095541

申请日：2008-09-29

Applicant: 한국전자통신연구원

Inventor： 서정일 , 백승권 , 장인선 , 강경옥 , 홍진우 , 김진웅 , 안치득

IPC: G10L19/02 , G10L19/20 , G10L19/008

CPC classification number: G10L19/008 , G10L19/0204 , G10L19/20 , G10L25/18

Abstract: An encoding and decoding method using variable subband analysis and an apparatus thereof are provided to increase the number of subbands while minimizing the increase of bit races, thereby outputting more superior sound. Audio objects(1~M) are inputted to an audio encoding unit and a frequency conversion unit. The audio encoding unit down-mixes the audio object. The frequency conversion unit(202) converts an audio object into a frequency domain. A subband configuration unit(203) subdivides a subband of a frequency-converted signal to variable subbands. A parameter generation unit(205) extracts parameters necessary for restoring the audio objects from the down mix signal. An encoding unit(206) encodes parameter information including a parameter generated from a parameter generating unit.

Abstract translation: 提供了使用可变子带分析的编码和解码方法及其装置，以增加子带的数量，同时最小化比特率的增加，从而输出更优异的声音。音频对象（1〜M）被输入到音频编码单元和频率转换单元。音频编码单元将音频对象降混。频率转换单元（202）将音频对象转换成频域。子带配置单元（203）将频率转换信号的子带细分到可变子带。参数生成单元（205）从下混合信号中提取恢复音频对象所需的参数。编码单元（206）编码包括从参数生成单元生成的参数的参数信息。

66.

发明授权
다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법 失效
Title translation: 基于多个单元块的多阶段，多维变换的装置和方法

公开(公告)号：KR100846870B1

公开(公告)日：2008-07-16

申请号：KR1020060095786

申请日：2006-09-29

Applicant: 한국전자통신연구원 , 광운대학교 산학협력단 , 세종대학교산학협력단

Inventor： 정세윤 , 최해철 , 서정일 , 백승권 , 장인선 , 김재곤 , 문경애 , 장대영 , 홍진우 , 김진웅 , 안창범 , 오승준 , 심동규 , 박호종 , 이영렬 , 전수열

IPC: H04N19/60

CPC classification number: H04N19/61 , H04N19/51

Abstract: 본 발명은 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법에 관한 것이다. 본 발명은 블록 단위의 원영상 또는 차영상의 DCT 변환계수를 사용하는 비디오 데이터 압축의 성능을 향상시키기 위하여 인접한 블록들의 변환 계수들을 모아서 추가적인 변환을 수행함으로써, 압축 효율을 향상시키기 위한, 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환 장치 및 그 방법을 제공하는데 그 목적이 있다.
본 발명은 입력되는 영상데이터를 DCT 변환하고, 상기 DCT 변환된 소정크기의 블록 R개(R은 2이상의 자연수)를 선택하는 단계; 상기 선택된 R개의 각 블록에서 동일한 주파수의 변환계수들을 1차원으로 배열하는 단계; 및 상기 1차원으로 배열된 변환계수들을 다시 일차원 변환하는 단계;를 포함하는 다수의 기본블록들의 다차원 구성을 통한 다단계 변환 방법을 개시한다.
다차원 변환, 다단계 변환, 다차원 구성, 이차원 변환

67.

发明公开
변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법 失效
Title translation: 音频编码和解码设备和使用线性预测编码的方法

公开(公告)号：KR1020080023618A

公开(公告)日：2008-03-14

申请号：KR1020070026820

申请日：2007-03-19

Applicant: 한국전자통신연구원 , 한양대학교 산학협력단 , 연세대학교 산학협력단 , 광운대학교 산학협력단

Inventor： 서정일 , 백승권 , 장인선 , 정세윤 , 최해철 , 장대영 , 김재곤 , 문경애 , 홍진우 , 김진웅 , 박호종 , 박영철 , 이재성 , 강상원

IPC: G10L19/04 , H03M7/30

Abstract: An apparatus for audio encoding and decoding using warped linear prediction coding, and a method thereof are provided to remove the redundancy of an original signal by using the warped linear prediction coding in an audio encoding process, provide an error signal to an audio encoder as an input signal, and transform a psychological sound model to be suitable for the error signal, thereby increasing the efficiency of audio signal compression and performing audio signal encoding. An error signal calculating unit(110) performs the warped linear prediction coding of an audio signal inputted from the outside in a temporal area to calculate an error signal. A frequency domain converting unit(120) converts the error signal obtained in the error signal calculating unit into a frequency domain signal. A masking threshold value calculating unit(131,132) calculates a masking threshold value used in the encoding of the error signal by using an original signal and encoding information used in the warped linear prediction coding of the original signal. A perceptual encoding unit(140) performs the perceptual encoding of the error signal converted in the frequency domain converting unit by using the calculated masking threshold value.

Abstract translation: 提供了一种使用翘曲线性预测编码的音频编码和解码装置及其方法，用于通过在音频编码处理中使用翘曲的线性预测编码来消除原始信号的冗余度，向音频编码器提供误差信号作为输入信号，并将心理声音模型变换为适合于误差信号，从而提高音频信号压缩和执行音频信号编码的效率。误差信号计算单元（110）对从时间区域外部输入的音频信号执行翘曲的线性预测编码，以计算误差信号。频域转换单元（120）将在误差信号计算单元中获得的误差信号转换成频域信号。屏蔽阈值计算单元（131,132）通过使用原始信号和在原始信号的扭曲线性预测编码中使用的编码信息来计算在误差信号的编码中使用的掩蔽阈值。感知编码单元（140）通过使用所计算的屏蔽阈值来执行在频域转换单元中转换的误差信号的感知编码。

68.

发明公开
화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법 有权
Title translation: 根据像素相似度使用DCT系数的自适应扫描编码和解码的装置和方法

公开(公告)号：KR1020080016413A

公开(公告)日：2008-02-21

申请号：KR1020070008247

申请日：2007-01-26

Applicant: 한국전자통신연구원 , 세종대학교산학협력단 , 광운대학교 산학협력단

Inventor： 정세윤 , 최해철 , 서정일 , 백승권 , 장인선 , 김재곤 , 문경애 , 장대영 , 홍진우 , 김진웅 , 이영렬 , 심동규 , 오승준 , 안창범 , 김대연 , 김동균

IPC: H04N19/129 , H04N19/13

CPC classification number: H04N19/159 , H04N19/103 , H04N19/11 , H04N19/129 , H04N19/13 , H04N19/136 , H04N19/176 , H04N19/18 , H04N19/182 , H04N19/61 , H04N19/91

Abstract: A coding/decoding apparatus using DCT(Discrete Cosine Transform) coefficient scanning adaptive according to pixel similarity and a method thereof are provided to enhance the compression rate of intra encoding by applying the most efficient scanning method according to pixel similarity and coding or decoding images. A coding apparatus using DCT coefficient scanning comprises a mode selection part(10), an intra prediction part(20), a DCT and quantization part(30), and an entropy coding part(40). The mode selection part(10) selects the optimum mode for intra prediction. The intra prediction part(20) executes intra prediction for an inputted image, based on the selected mode. The DCT and quantization part(30) executes DCT and quantization for the residual coefficients outputted from the intra prediction part(20). Using a certain scanning mode determined according to the pixel similarity of the residual coefficients, the entropy coding part(40) performs entropy coding for the quantized DCT coefficients.

Abstract translation: 提供了一种使用根据像素相似度自适应的DCT（离散余弦变换）系数扫描的编码/解码装置及其方法，以通过根据像素相似度和编码或解码图像应用最有效的扫描方法来增强帧内编码的压缩率。使用DCT系数扫描的编码装置包括模式选择部（10），帧内预测部（20），DCT和量化部（30）以及熵编码部（40）。模式选择部（10）选择帧内预测的最佳模式。帧内预测部（20）基于所选择的模式对输入图像执行帧内预测。 DCT和量化部分（30）对从帧内预测部分（20）输出的残差系数执行DCT和量化。使用根据残差系数的像素相似度确定的特定扫描模式，熵编码部分（40）对量化的DCT系数执行熵编码。

69.

发明公开
가상음원위치정보를 이용한 멀티채널 오디오 신호의 압축및 복원 방법 有权
Title translation: 使用虚拟源位置信息的多通道音频压缩和解码方法

公开(公告)号：KR1020060100221A

公开(公告)日：2006-09-20

申请号：KR1020060023545

申请日：2006-03-14

Applicant: 한국전자통신연구원

Inventor： 서정일 , 백승권 , 장인선 , 강경옥 , 홍진우 , 한민수

IPC: G10L19/008 , G10L19/02

CPC classification number: H04S3/008 , H04S2400/11 , H04S2420/03 , H04S2420/07

Abstract: 본 발명은 반원 평면상의 가상음원정보(VSLI:Virtual Source Location Information)를 이용한 멀티채널 신호의 압축 및 복원 방법에 관한 것으로, 공간 큐(spatial cue) 정보로서 채널간 에너지 비(Inter Channel Level Difference: ICLD) 대신 VSLI를 이용함으로써 공간 큐 정보의 양자화에 의한 손실을 최소화하여 복원된 오디오 신호의 음질을 향상시킬 수 있으며, 복호기에서 원 신호 복원 시 스펙트럼 왜곡을 감쇄시켜 보다 양질의 오디오 신호를 재생할 수 있는 효과가 있다.
바이노럴 큐 코딩(BCC: Binaural Cue Coding), 가상음원위치정보(VSLI: Virtual Source Location Information), 멀티채널 오디오

70.

发明授权
객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체 有权

公开(公告)号：KR102149019B1

公开(公告)日：2020-08-28

申请号：KR1020190081325

申请日：2019-07-05

Applicant: 한국전자통신연구원 , (주)오디즌

Inventor： 장인선 , 김휘용 , 서정일 , 강경옥 , 홍진우 , 김진웅 , 안치득 , 이태진 , 함승철

IPC: G10L19/008 , G10L19/20 , G11B20/10 , H03M7/30

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification