Abstract:
배치 쓰레드 처리 기반의 프로세서에 관한 것으로, 일 실시예에 따른 프로세서는 중앙 레지스터 파일 및 둘 이상의 기능 유닛과 중앙 레지스터 파일에 액세스하기 위한 하나 이상의 포트를 포함하는 하나 이상의 기능 유닛 배치를 포함하고, 기능 유닛 배치 각각은 하나 이상의 인스트럭션을 포함하는 인스트럭션 배치를 수행하되 인스트럭션 배치 내의 하나 이상의 인스트럭션을 순차적으로 수행할 수 있다.
Abstract:
The present invention relates to a processor supporting a multi-mode. The processor according to an embodiment includes: two or more front end units; processing elements more than the front end units; and a control unit which enables a processing element to process a command by using two or more currently activated front end units when a thread divergence occurs by condition branching, otherwise sets control information to process the command by using one activated front end unit.
Abstract:
A coarse-grained reconfigurable processor having an improved code decompression rate and a code decompression method for the same are disclosed to reduce the capacity of a configuration memory and reduce the power consumption in a processor chip. The coarse-grained reconfigurable processor includes: a configuration memory unit which stores reconfiguration information and includes a header unit for storing a compression mode indicator and a compressed code for each of a plurality of units and a body for storing at least one uncompressed code; a decompression unit which specifies a code corresponding to each of the plurality of units among at least one uncompressed code within the body based on the compression mode indicator and the compressed code within the header unit; and a reconfiguration unit which includes a plurality of processing elements and reconfigures the data paths of the plurality of the processing elements based on the code corresponding to each unit. [Reference numerals] (100) Configuration memory unit;(110) Decompression unit;(120) Reconfiguration unit
Abstract:
A method of managing an instruction cache and a processor using the same are provided to solve cache miss to be generated without using a prediction algorithm. A processor core(110) has the first active mode and the second active mode. An instruction cache(120) detects cache miss during the second active mode by tracing the first instruction that the processor core performs during the first active mode. The instruction cache produces a fake program counter. The instruction cache traces the first instruction in advance by changing a value of the fake program counter. If the cache miss about the first instruction is detected, the instruction cache receives the first instruction from an external memory(150). The instruction cache stores the first instruction received from the external memory.
Abstract:
본 발명은 데이터 처리 시스템 및 데이터 처리방법에 관한 것이다. 본 발명에 따른 데이터 처리 시스템은, 프로그램을 수행하는 프로세서 코어와, 복수개의 데이터 처리셀로 구성된 어레이부를 포함하고, 소정의 구성 비트 집합(set of configuration bits)에 따라 어레이부를 구성하여 프로그램에 포함된 소정 루프를 수행하는 루프 가속기 및, 프로그램 수행 중에 사용되는 데이터를 프로세서 코어와 루프 가속기 사이에서 공유시키는 중앙 레지스터 파일을 포함하며, 루프 가속기는 루프의 수행 중 중앙 레지스터 파일과의 데이터 교환 여부에 따라 어레이부의 구성을 적어도 3개의 단계로 나누어 재구성한다. 이에 의해, 루프 수행 중에 루프 가속기와 중앙 레지스터 파일 사이의 데이터 교환을 위해 사용되는 라우팅 리소스의 불필요한 점유를 줄일 수 있다. 중앙 레지스터 파일, 프로세서 코어, 루프, 프로그램, 가속기
Abstract:
A method and a device for handing an interrupt in a reconfigurable array are provided to efficiently handle the interrupt if the interrupt is generated in a computing device including the reconfigurable array. The reconfigurable array(406) includes a plurality of processing units. An interrupt handler stores a value of a register used for handling the interrupt request and restores the value of the register after an interrupt service for the interrupt request is performed. If the interrupt request is generated during operation of the reconfigurable array, the operation of the reconfigurable array is paused by stopping inputting clock to the reconfigurable array. If the interrupt service for the interrupt request is finished, the operation of the reconfigurable array is resumed by restarting inputting the clock to the reconfigurable array.