CUDA編02::カーネルの呼び出し

現在地 >> メニュー >> CUDA >> CUDA編02 >> CUDA編02::カーネルの呼び出し

global関数の呼び出し方

__global__関数はCPUからGPUで実行関数をコールするもの。
つまり、CUDA側の処理の開始点みたいなもの。

その書き方は次の通り

宣言や定義時には修飾子として「__global__」を付ける
呼び出す時には「<<<…　…>>>」を使って、「Grid数」や「Block数」を指定する

構文としては次のようになる

Func<<<Dg,Db,Ns,S>>>(parameter)

【例】

//------------- CUDAでの処理 ---------------//
__global__ void cuAddValue(float *gpuAryData)
{
	…　…
}

…　…

float *gpuAry;//GPUメモリ用

//GPU用にブロックとスレッドを用意
dim3 grid(100,1,1);//100個のグリッド
dim3 block(200,1,1);//200個のブロック
	
//グリッド100個、ブロック200個
cuAddValue<<<grid,block>>>(gpuAry);

【解説】

Dg　グリッドのサイズ

dim3型。グリッドのサイズを指定する。（１グリッドあたりのブロックの数）
Dg.x * Dg.yが１グリッドあたりの総ブロック数となる。Dg.zは「１」。

Db ブロックのサイズ

dim3型。ブロックのサイズを指定する。（１ブロック当たりのスレッドの数）
Db.x*Db.y*Db.zが１ブロックあたりの総スレッド数となる。

Ns ブロック単位で動的に確保される共有メモリ

size_t型。ブロック単位で動的に確保される共有メモリを指定する。
デフォルトは０。

S　何らかのストリーム用

cudaStream_t型。何らかのストリーム用。

関数についている修飾子

__global__	カーネルを意味する。GPUで実行し、CPUからコールする
__device__	GPUでコールして、GPUで実行する
__host__	CPUでコールしてCPUで実行する

このページを編集するこのページを元に新規ページを作成

印刷する

カテゴリ：
学問・理系
数学

CUDA編02::カーネルの呼び出し - OpenGL de プログラミング先頭へ

OpenGL de プログラミング

目次

global関数の呼び出し方

【解説】

Dg　グリッドのサイズ

Db ブロックのサイズ

Ns ブロック単位で動的に確保される共有メモリ

S　何らかのストリーム用

関数についている修飾子

目次

最近更新したページ

2010-07-09

2010-07-03

2010-06-27

2010-06-26

2010-06-19

2010-06-14

2010-06-05

2010-05-22

2010-05-16

2010-05-08

2010-05-06

Wiki内検索

計測中...(07.10.8～)

Save The World

アクセス解析中

OpenGL de プログラミング

CUDA編02::カーネルの呼び出し

目次

__global__関数の呼び出し方

【解説】

Dg グリッドのサイズ

Db ブロックのサイズ

Ns ブロック単位で動的に確保される共有メモリ

S 何らかのストリーム用

関数についている修飾子

目次

最近更新したページ

2010-07-09

2010-07-03

2010-06-27

2010-06-26

2010-06-19

2010-06-14

2010-06-05

2010-05-22

2010-05-16

2010-05-08

2010-05-06

Wiki内検索

計測中...(07.10.8～)

Save The World

アクセス解析中

global関数の呼び出し方

Dg　グリッドのサイズ

S　何らかのストリーム用