Abstract:
An apparatus for audio encoding and decoding using warped linear prediction coding, and a method thereof are provided to remove the redundancy of an original signal by using the warped linear prediction coding in an audio encoding process, provide an error signal to an audio encoder as an input signal, and transform a psychological sound model to be suitable for the error signal, thereby increasing the efficiency of audio signal compression and performing audio signal encoding. An error signal calculating unit(110) performs the warped linear prediction coding of an audio signal inputted from the outside in a temporal area to calculate an error signal. A frequency domain converting unit(120) converts the error signal obtained in the error signal calculating unit into a frequency domain signal. A masking threshold value calculating unit(131,132) calculates a masking threshold value used in the encoding of the error signal by using an original signal and encoding information used in the warped linear prediction coding of the original signal. A perceptual encoding unit(140) performs the perceptual encoding of the error signal converted in the frequency domain converting unit by using the calculated masking threshold value.
Abstract:
본 발명은 화소 단위 예측 DPCM(Difference Pulse Code Modulation)을 적용하여 공간적 중복성을 제거함으로써 압축 성능을 향상시킬 수 있는 장치 및 방법에 관한 것이다. 본 발명의 영상 부호화 장치는 참조 영상과 현재 영상 간에 시간적 또는 공간적 예측을 수행하여 부호화할 현재 블록에 대응되는 예측 블록을 생성하는 블록 예측부, 예측 블록의 화소와 상기 현재 블록의 대응하는 화소들 사이의 차에 해당하는 잔차 신호로 이루어진 차분 영상 블록을 생성하는 차분영상 생성부, 차분 영상 블록의 각 화소에 DPCM을 수행한 결과와 수행하지 않은 결과 각각에 대한 레이트 디스토션 최적화 값에 기초하여 상기 차분 영상 블록의 각 화소에 DPCM 적용여부를 결정하는 화소 예측부 및 차분 영상 블록을 엔트로피 부호화하는 엔트로피 부호화부를 포함하며, 비디오 코딩의 압축률을 향상시키는 효과가 있다. 비디오 압축, DPCM
Abstract:
A coding/decoding apparatus using DCT(Discrete Cosine Transform) coefficient scanning adaptive according to pixel similarity and a method thereof are provided to enhance the compression rate of intra encoding by applying the most efficient scanning method according to pixel similarity and coding or decoding images. A coding apparatus using DCT coefficient scanning comprises a mode selection part(10), an intra prediction part(20), a DCT and quantization part(30), and an entropy coding part(40). The mode selection part(10) selects the optimum mode for intra prediction. The intra prediction part(20) executes intra prediction for an inputted image, based on the selected mode. The DCT and quantization part(30) executes DCT and quantization for the residual coefficients outputted from the intra prediction part(20). Using a certain scanning mode determined according to the pixel similarity of the residual coefficients, the entropy coding part(40) performs entropy coding for the quantized DCT coefficients.
Abstract:
본 발명은 동영상 부호화 및 복호화 기법에 관한 것으로, 구체적으로는 GOP 단위로 수행되는 동영상 부호화시에 발생하는 저주파 영상 프레임의 예측 부호화 및 이에 따라 부호화된 스트림의 복호화에 관한 것이다. 본 발명에 따른 저주파 영상 프레임 부호화 방법은, 상기 저주파 영상에 대하여 예측 부호화를 수행할지 인트라 프레임 부호화를 수행할지 선택하는 단계와, 예측 부호화가 선택된 경우에, 슬라이스 헤더내에 예측 부호화의 수행여부를 나타내는 비트값을 "1"로 저장하고, 바로 앞의 GOP의 저주파 영상을 이용하여 상기 저주파 영상에 대하여 예측 부호화를 수행하는 단계와, 인트라 프레임 부호화가 선택된 경우에, 상기 슬라이스 헤더내에 예측 부호화의 수행여부를 나타내는 상기 비트값을 "0"으로 저장하고, 상기 저주파 영상에 대하여 인트라 프레임 부호화를 수행하는 단계를 포함하는 것을 특징으로 한다. GOP, 동영상 부호화, 저주파 영상 예측 부호화, 시간적 해상도
Abstract:
An apparatus and a method for encoding and decoding an image based on a pixel unit are provided to improve compression performance by applying pixel unit prediction DPCM(Difference Pulse Code Modulation), not block-based prediction, and removing spatial redundancy. A block predicting unit(210) performs temporal or spatial prediction between a reference image and a current image, and generates a predictive block corresponding to a current block to be encoded. A differential image generating unit(220) generates a differential image block formed as residual signals corresponding to difference between pixels of the predictive block and corresponding pixels of the current block. A pixel predicting unit(230) determines whether to apply DPCM to respective pixels of the differential image block on the basis of rate distortion optimization values for a result in which the DPCM is performed in the respective pixels of the differential image block and a result in which the DPCM is not performed in the respective pixels of the differential image block. An entropy encoding unit(240) performs the entropy coding of the differential image block.
Abstract:
1. 청구범위에 기재된 발명이 속한 기술분야 본 발명은 랜덤 엑세스(RA : Random Access)를 지원하면서도 대역폭에 효율적으로 장면 기술(SD : Scene Description)/객체 기술자(OD : Object Descriptor)를 갱신(update)하여 전송하기 위한 장면 기술/객체 기술자 갱신 장치 및 그 방법에 관한 것임. 2. 발명이 해결하려고 하는 기술적 과제 본 발명은 지상파 디지털멀티미디어방송(DMB) 또는 인터넷 방송 등과 같은 저대역폭 환경에서 엠펙-4 기반 대화형 방송 데이터를 전송할 경우 등에 있어서, 장면 기술/객체 기술자를 갱신하여야 하는 시점에 랜덤 엑세스를 위하여 갱신하기 이전의 장면 기술/객체 기술자를 함께 전송할 경우, 각각의 장면 기술/객체 기술자를 병합/재구성하여 전송함으로써 랜덤 엑세스를 지원하면서도 대역폭에 효율적인 장면 기술/객체 기술자 갱신 장치 및 그 방법을 제공하는데 그 목적이 있음. 3. 발명의 해결방법의 요지 본 발명은, 장면 기술/객체 기술자 갱신 장치에 있어서, 외부로부터 장면 기술/객체 기술자 데이터를 입력받기 위한 장면 기술/객체 기술자 입력 수단; 장면 기술/객체 기술자를 갱신해야 하는 경우가 발생함에 따라, 기존의 장면 기술/객체 기술자와 갱신해야 하는 장면 기술/객체 기술자를 각각 동시에 전송하여야 하는 경우를 검사하기 위한 제어 수단; 장면 기술/객체 기술자를 각각 동시에 전송하여야 함에 따라 두 가지 이상의 장면 기술/객체 기술자를 각각 서로 병합하여 재구성하기 위한 장면 기술/객체 기술자 재구성 수단; 및 상기 장면 기술/객체 기술자 재구성 수단에서 병합/재구성한 각각의 장면 기술/객체 기술자를 전송 주기에 따라 주기적으로 외부로 전송하기 위한 장면 기술/객체 기술자 출력 수단을 포함함. 4. 발명의 중요한 용도 본 발명은 지상파 디지털멀티미디어방송(DMB), 인터넷 방송 등에 이용됨. 장면 기술, 객체 기술자, 갱신, 병합/재구성, 랜덤 엑세스, 저대역폭, 지상파 디지털멀티미디어방송(DMB), 인터넷 방송, 엠펙-4
Abstract:
Provided is a method for performing hierarchical B picture-based coding on a video sequence using the structure of adaptively divided group of pictures (GOP). The method includes the steps of, for each predefined 2N frame-sized group of pictures (GOP) of the video sequence, (a) encoding the 2N frame-sized GOP of the video sequence based on each of the different GOP sizes from the maximum size, 2N, to the minimum size, 2M (M is an integer between 1 and N) and obtaining different values between frames reconstructed after the encoding is performed and frames after the hierarchical B-picture prediction is performed, based on each of the different GOP sizes; (b) selecting at least one sub-GOP based on the difference values obtained by encoding the 2N frame-sized GOP of the video sequence based on each of the different GOP sizes; and (c) generating a bitstream by encoding the 2N-frame-sized GOP based on the at least one selected sub-GOP. Thereby, the hierarchical B picture-based video coding is performed by adaptively dividing the GOP size based on performance and thereby obtains high coding efficiency.
Abstract:
본 발명은 2 N 개의 프레임 시퀀스로 이루어진 GOP(Group of Picture) 단위로 수행되는 계층적 B-픽쳐 기반 동영상 부호화시에 GOP를 적응적으로 세분하여 부호화하는 방법에 관한 것이다. 상기 방법은, 상기 GOP 단위의 프레임 시퀀스에 대하여, (a) 최대 2 N 크기부터 최소 2 M ( M은 1 이상이고 N보다는 작은 정수임) 크기의 상이한 세부 GOP 단위 각각에 대하여 계층적 B-픽쳐 기반 부호화를 수행하여 서브밴드별로 구성된 원본 영상과 부호화 후에 재구성된 영상간의 차이값을 각각 구하는 단계와, (b) 상기 상이한 세부 GOP 단위의 부호화 각각의 결과로부터 구해진 상기 차이값에 기반하여 적어도 1개 이상의 세부 GOP 크기를 선택하는 단계와, (c) 상기 선택된 적어도 1개 이상의 세부 GOP 단위로 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 한다. 본 발명에 따르면, 계층적 B-픽쳐를 이용한 동영상 부호화시에 GOP 크기를 성능에 따라 적응적으로 세분하여 부호화함으로써 높은 부호화 효율을 얻을 수 있다. 계층적 B-픽쳐 기반 부호화(hierarchical B-picture_based coding), 동영상 부호화, 적응적 GOP 구조.
Abstract:
PURPOSE: An apparatus and a method for combining both eyes type contents are provided to convert both eyes contents through the first both eyes type information converting unit so that the both eyes contents may be matched reference camera information, thereby constructing a normal scene. CONSTITUTION: A reference camera information setting unit(11) sets reference camera information. The information needs to convert the inputted both eyes type contents. The converted contents have the same camera information. The first both eyes type contents information converting unit(12) converts the both eyes type contents on the basis of the camera information set from the reference camera information setting unit(11). A scene construction unit(13) constructs the converted both eyes type contents by using both eyes type contents converted from the first both eyes type contents information converting unit(12).
Abstract:
PURPOSE: A system and a method for producing binocular multimedia contents are provided to combine a binocular technique with a multi-media contents producing system to produce a three-dimensional binocular multimedia contents. CONSTITUTION: A system for producing binocular multimedia contents includes a media input unit(11) for receiving media used for producing the multimedia contents, a media pre-processor(12) for pre-processing the received media, and a media editing unit(13) for constructing or editing a scene using the received media. The system further includes a media encoding unit(14) for encoding media that have not been encoded, and a binocular contents converter(15) for converting all of components of the scene into binocular contents form.