最終更新: mikk_ni3_92 2008年10月01日(水) 12:43:58履歴
現在地 >> メニュー >> CUDA >> CUDA::基本編02
INDEX:CUDA::基本編01 << CUDA::基本編02 >> CUDA::基本編03
GPUの情報を格納する構造体にcudaDeviceProp構造体がある。
cudaDeviceProp構造体
いくつのGPUを積んでいるかを確認するには、「cudaGetDeviceCount()関数」を使う
[例]
GPUの情報を取得するには、
[例]
これによって、各ブロック毎のスレッド数などの限界値がわかる。
サンプルコード >> CUDA::デバイス
INDEX:CUDA::基本編01 << CUDA::基本編02 >> CUDA::基本編03
GPUの情報を格納する構造体にcudaDeviceProp構造体がある。
cudaDeviceProp構造体
struct cudaDeviceProp { char name[256]; size_t totalGlobalMem; size_t sharedMemPerBlock; int regsPerBlock; int warpSize; size_t memPitch; int maxThreadsPerBlock; int maxThreadsDim[3]; int maxGridSize[3]; size_t totalConstMem; int major; int minor; int clockRate; size_t textureAlignment; int deviceOverlap; int multiProcessorCount; }
いくつのGPUを積んでいるかを確認するには、「cudaGetDeviceCount()関数」を使う
[例]
int device_num; cudaGetDeviceCount(&device_num); std::cout << "ビデオカードの数 : " << device_num << "\n";
GPUの情報を取得するには、
cudaGetDeviceProperties()関数を使う
[例]
cudaDeviceProp dev_info; CUDA_SAFE_CALL(cudaGetDeviceProperties(&dev_info, 0)); //0番目のGPUの情報を取得
これによって、各ブロック毎のスレッド数などの限界値がわかる。
サンプルコード >> CUDA::デバイス