멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
    1.
    发明授权
    멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법 失效
    基于多线程处理器的并行系统的自适应执行方法

    公开(公告)号:KR100806274B1

    公开(公告)日:2008-02-22

    申请号:KR1020060043645

    申请日:2006-05-16

    CPC classification number: G06F8/456 G06F9/5066 G06F11/3404 G06F2201/88

    Abstract: 본 발명은 멀티 쓰레디드 프로세서 기반의 병렬 시스템의 구조적 특성을 반영하기 위해 컴파일 시나 실행 시에 성능 예측 모델을 이용하여 병렬 루프의 성능을 예측한 다음 적응형 실행 방법을 이용하여 병렬 프로그램을 실행하는 방법에 관한 것으로,
    본 발명의 방법은 병렬 프로그램 내에 하나 이상 포함된 병렬 루프의 실행을 위해 병렬 시스템의 물리 프로세서 개수만큼의 쓰레드를 생성하는 단계와, 상기 병렬 루프를 구성하는 단일 루프를 상기 쓰레드를 통해 실행하는 단계와, 상기 단일 루프의 실행 동안의 실행 시간, 실행된 명령어의 개수 및 캐쉬 미스 개수를 측정하는 단계와, 상기 측정된 값들을 기준으로 상기 각 병렬 루프를 실행하는데 사용되는 상기 쓰레드의 개수를 결정함으로써 상기 각 병렬 루프의 실행 모드를 결정하는 단계와, 상기 결정 결과에 따라 상기 쓰레드를 상기 각 물리 프로세서에 할당하여 각 병렬 루프를 실행하는 단계를 포함하는 것을 특징으로 한다.
    상기와 같은 구성을 통해 본 발명은 멀티 쓰레디드 기반의 병렬 시스템에서 구동되는 병렬 프로그램의 성능을 비약적으로 향상시킬 수 있다.
    병렬 시스템, 병렬 프로그램, 병렬 루프, 쓰레드

    멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법
    2.
    发明公开
    멀티 쓰레디드 프로세서 기반의 병렬 시스템을 위한 적응형실행 방법 失效
    基于多处理器的并行系统的自适应执行方法

    公开(公告)号:KR1020070059837A

    公开(公告)日:2007-06-12

    申请号:KR1020060043645

    申请日:2006-05-16

    CPC classification number: G06F8/456 G06F9/5066 G06F11/3404 G06F2201/88

    Abstract: An adaptive execution method for a multithreaded processor-based parallel system is provided to optimize performance of a parallel program by automatically finding performance factors of the parallel system in reflection of a structural property of the parallel system. Threads are generated as many as the number of physical processors of the multithreaded processor-based parallel system to execute more than one parallel loops included in the parallel program. More than one loop is executed through the generated threads by each parallel loop. Execution time of the parallel loop, the number of executed commands, and the number of cache misses are measured(510). An execution mode of each parallel loop is determined by determining the number of threads used for executing each parallel loop based on measured values. Each parallel loop is executed by assigning the thread to each physical processor according to a determination result(560).

    Abstract translation: 提供了一种用于基于多线程处理器的并行系统的自适应执行方法,以通过自动查找并行系统的性能因素来反映并行系统的结构特性来优化并行程序的性能。 线程的生成与基于多线程处理器的并行系统的物理处理器数量一样多,以执行并行程序中包含的多个并行循环。 每个并行循环通过生成的线程执行多个循环。 测量并行循环的执行时间,执行命令的数量和高速缓存未命中的数量(510)。 通过基于测量值确定用于执行每个并行循环的线程数来确定每个并行循环的执行模式。 通过根据确定结果(560)将线程分配给每个物理处理器来执行每个并行循环。

Patent Agency Ranking