KR102228586B1 - Gpu-based adaptive blas operation acceleration apparatus and method thereof

    公开(公告)号:KR102228586B1

    公开(公告)日:2021-03-16

    申请号:KR1020180006966A

    申请日:2018-01-19

    CPC classification number: G06N20/00 G06F17/11 G06F17/16 G06F8/443 G06F8/45

    Abstract: GPU 기반의 적응적 BLAS 연산 가속화 장치 및 방법이 개시된다. 본 발명에 따른 GPU 기반의 적응적 BLAS 연산 가속화 장치는, 기계학습 데이터 특징 정보 및 OpenCL 장치 정보를 이용하여, 최적 OpenCL 파라미터를 설정하고, 커널 소스코드를 컴파일하여 바이너리 형태의 커널을 생성하는 BLAS 연산 가속화부, OpenCL 실행 환경 정보 및 상기 최적 OpenCL 파라미터를 이용하여 BLAS 연산을 위한 OpenCL 버퍼를 생성하고, 생성된 상기 OpenCL 버퍼에 접근 가능한 GPU가 커널을 통해 상기 BLAS 연산을 수행하여 임베디드 시스템에서의 기계학습을 가속화하는 OpenCL 실행부, 그리고 상기 BLAS 연산의 수행 결과를 기계학습 알고리즘에 반환하는 가속 장치 응용부를 포함한다.

    GPU 기반의 적응적 BLAS 연산 가속화 장치 및 방법

    公开(公告)号:KR102228586B1

    公开(公告)日:2021-03-16

    申请号:KR1020180006966

    申请日:2018-01-19

    Abstract: GPU 기반의적응적 BLAS 연산가속화장치및 방법이개시된다. 본발명에따른 GPU 기반의적응적 BLAS 연산가속화장치는, 기계학습데이터특징정보및 OpenCL 장치정보를이용하여, 최적 OpenCL 파라미터를설정하고, 커널소스코드를컴파일하여바이너리형태의커널을생성하는 BLAS 연산가속화부, OpenCL 실행환경정보및 상기최적 OpenCL 파라미터를이용하여 BLAS 연산을위한 OpenCL 버퍼를생성하고, 생성된상기 OpenCL 버퍼에접근가능한 GPU가커널을통해상기 BLAS 연산을수행하여임베디드시스템에서의기계학습을가속화하는 OpenCL 실행부, 그리고상기 BLAS 연산의수행결과를기계학습알고리즘에반환하는가속장치응용부를포함한다.

Patent Agency Ranking