소개

CUDA - Compute Unified Device Architecture
GPU를 GPGPU 목적으로 사용할 수 있게 제공하는 프로그래밍 인터페이스
다른 GPGPU API들 역시 CUDA와 많은 개념들을 공유하며, 사용법도 유사하다.

Driver API & Runtime API

CUDA는 두가지 API를 제공하며, 하나의 프로그램에서 병행사용도 가능하다. driver API는 runtime API 대비 더 low-level에서의 제어 기능을 제공한다. Driver API의 장단점은 아래와 같다.

장점
- CUDA 문맥 및 모듈 로드 등에 대한 더 세밀한 제어 기능을 제공
- CUDA kernel 들을 동적으로 로드해서 사용해 자원을 더 효율적으로 사용 가능
- 코드를 컴파일한 cubin(CUDA library) 오브젝트 파일을 통해 다양한 언어에서 해당 모듈 사용 가능
단점
- CUDA kernel 실행을 위한 구현 방법이 runtime API 보다 복잡함

하지만, runtime API에서도 대부분의 기능을 지원하고 사용이 간단하므로 이후 내용은 runtime API로 진행한다.

개발환경 설정

CUDA Toolkit 설치
- Visual Studio를 사용하는 경우, 꼭 Visual Studio가 설치된 후에 설치!
- VS Code의 경우 Nsight 비주얼 스튜디오 코드 에디션을 사용하면 CUDA 프로그래밍을 할 수 있다.
nvcc는 CUDA를 위한 컴파일러이며, gcc 컴파일러와 동일한 방법으로 사용할 수 있다.

Hello CUDA

CUDA 및 GPU 프로그래밍 관련 문서와 자료에 등장하는 호스트(host)와 디바이스(device)는 일반적으로 각각 CPU, GPU를 의미한다.

CUDA 프로그램

일반적으로 GPU에서 실행되는 최초의 디바이스 코드(커널)는 호스트 코드에서 호출되어야 하기 때문에 호스트 코드가 함께 있어야 한다. gcc또는 C언어 컴파일러로, 디바이스 코드는 nvcc 컴파일러로 컴파일 된다.

예제 코드.

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <studio.h>

__global__ void helloCUDA(void) // CUDA C/C++ 키워드 단락 참고
{
	printf("Hello CUDA from GPU!\\n")
}

int main(void)
{
	printf("Hello GPU from CPU!\\n");
	helloCUDA<<<1, 10>>>(); // 커널의 실행과 실행 구성 단락 참고
	return 0;
}