Abstract:
배치 쓰레드 처리 기반의 프로세서에 관한 것으로, 일 실시예에 따른 프로세서는 중앙 레지스터 파일 및 둘 이상의 기능 유닛과 중앙 레지스터 파일에 액세스하기 위한 하나 이상의 포트를 포함하는 하나 이상의 기능 유닛 배치를 포함하고, 기능 유닛 배치 각각은 하나 이상의 인스트럭션을 포함하는 인스트럭션 배치를 수행하되 인스트럭션 배치 내의 하나 이상의 인스트럭션을 순차적으로 수행할 수 있다.
Abstract:
The present invention relates to a processor supporting a multi-mode. The processor according to an embodiment includes: two or more front end units; processing elements more than the front end units; and a control unit which enables a processing element to process a command by using two or more currently activated front end units when a thread divergence occurs by condition branching, otherwise sets control information to process the command by using one activated front end unit.
Abstract:
A coarse-grained reconfigurable processor having an improved code decompression rate and a code decompression method for the same are disclosed to reduce the capacity of a configuration memory and reduce the power consumption in a processor chip. The coarse-grained reconfigurable processor includes: a configuration memory unit which stores reconfiguration information and includes a header unit for storing a compression mode indicator and a compressed code for each of a plurality of units and a body for storing at least one uncompressed code; a decompression unit which specifies a code corresponding to each of the plurality of units among at least one uncompressed code within the body based on the compression mode indicator and the compressed code within the header unit; and a reconfiguration unit which includes a plurality of processing elements and reconfigures the data paths of the plurality of the processing elements based on the code corresponding to each unit. [Reference numerals] (100) Configuration memory unit;(110) Decompression unit;(120) Reconfiguration unit
Abstract:
프로세서 및 메모리 관리 방법이 제공된다. 본 발명의 프로세서는 프로세서 코어, 싱글 포트를 경유하여 상기 프로세서 코어와 데이터를 송수신하고, 상기 프로세서 코어에 의해 억세스된 데이터를 저장하는 캐쉬, 및 복수의 멀티 포트 중 하나 이상을 경유하여 상기 프로세서 코어와 데이터를 송수신하는 스크래치패드 메모리를 포함하는 것을 특징으로 하며, 이를 통해 다수의 로드/스토어 명령의 처리를 용이하게 할 수 있다. 캐쉬, 스크래치패드 메모리, SPM
Abstract:
A method of managing an instruction cache and a processor using the same are provided to solve cache miss to be generated without using a prediction algorithm. A processor core(110) has the first active mode and the second active mode. An instruction cache(120) detects cache miss during the second active mode by tracing the first instruction that the processor core performs during the first active mode. The instruction cache produces a fake program counter. The instruction cache traces the first instruction in advance by changing a value of the fake program counter. If the cache miss about the first instruction is detected, the instruction cache receives the first instruction from an external memory(150). The instruction cache stores the first instruction received from the external memory.
Abstract:
본 발명은 데이터 처리 시스템 및 데이터 처리방법에 관한 것이다. 본 발명에 따른 데이터 처리 시스템은, 프로그램을 수행하는 프로세서 코어와, 복수개의 데이터 처리셀로 구성된 어레이부를 포함하고, 소정의 구성 비트 집합(set of configuration bits)에 따라 어레이부를 구성하여 프로그램에 포함된 소정 루프를 수행하는 루프 가속기 및, 프로그램 수행 중에 사용되는 데이터를 프로세서 코어와 루프 가속기 사이에서 공유시키는 중앙 레지스터 파일을 포함하며, 루프 가속기는 루프의 수행 중 중앙 레지스터 파일과의 데이터 교환 여부에 따라 어레이부의 구성을 적어도 3개의 단계로 나누어 재구성한다. 이에 의해, 루프 수행 중에 루프 가속기와 중앙 레지스터 파일 사이의 데이터 교환을 위해 사용되는 라우팅 리소스의 불필요한 점유를 줄일 수 있다. 중앙 레지스터 파일, 프로세서 코어, 루프, 프로그램, 가속기
Abstract:
A method and a device for handing an interrupt in a reconfigurable array are provided to efficiently handle the interrupt if the interrupt is generated in a computing device including the reconfigurable array. The reconfigurable array(406) includes a plurality of processing units. An interrupt handler stores a value of a register used for handling the interrupt request and restores the value of the register after an interrupt service for the interrupt request is performed. If the interrupt request is generated during operation of the reconfigurable array, the operation of the reconfigurable array is paused by stopping inputting clock to the reconfigurable array. If the interrupt service for the interrupt request is finished, the operation of the reconfigurable array is resumed by restarting inputting the clock to the reconfigurable array.
Abstract:
본 발명은 재구성 프로세서에서 루프 버퍼를 최적화하기 위한 장치 및 방법에 관한 것으로서, 상기 재구성 프로세서는, 각 PU(Processing Unit)에 일정 연산의 수행을 위한 구성 비트들을 제공하는 구성 메모리 이외에 딜레이 연산 여부를 알려주는 유효 정보 메모리를 가진다. 상기 PU에서는 딜레이 제어부가 상기 유효 정보 메모리로부터 전달되는 비트 정보(VALID)를 참조하여 다음 연산이 딜레이 연산인지를 결정함에 따라, 딜레이 연산에 대하여는 PE(Processing Element)의 실행이 디스에이블되고, 또한 루프 버퍼가 상기 구성 메모리에서 전달된 구성 비트들을 상기 PE로 전달하지 않는다. 따라서, 딜레이 연산을 지정하는 구성 비트들을 상기 루프 버퍼에 저장할 필요가 없다. 재구성 프로세서(Reconfigurable Processor), 루프 버퍼, 구성 메모리, 루프 카운터