精选【CUDA编程4】获取device详细信息

木盏

发布时间 2024.05.17阅读数 818 评论数 0

CUDA编程，从某种意义而言，可以划分为异构系统编程，其实是一个CPU+GPU模式。其中，CPU被称为Host，而GPU被称为Device。

#include <cuda_runtime.h>
#include <stdio.h>

int main(int argc,char** argv)
{
    int deviceCount = 0;
    cudaError_t error_id = cudaGetDeviceCount(&deviceCount);
    if(error_id!=cudaSuccess)
    {
        printf("cudaGetDeviceCount returned %d\n ->%s\n",
              (int)error_id,cudaGetErrorString(error_id));
        printf("Result = FAIL\n");
        exit(EXIT_FAILURE);
    }
    if(deviceCount==0)
    {
        printf("There are no available device(s) that support CUDA\n");
    }
    else
    {
        printf("Detected %d CUDA Capable device(s)\n",deviceCount);
    }
    int dev=0, driverVersion=0, runtimeVersion=0;
    cudaSetDevice(dev);
    cudaDeviceProp deviceProp;
    cudaGetDeviceProperties(&deviceProp,dev);
    printf("Device %d:\"%s\"\n",dev,deviceProp.name);
    cudaDriverGetVersion(&driverVersion);
    cudaRuntimeGetVersion(&runtimeVersion);
    printf("  CUDA Driver Version / Runtime Version         %d.%d  /  %d.%d\n",
        driverVersion/1000,(driverVersion%100)/10,
        runtimeVersion/1000,(runtimeVersion%100)/10);
    printf("  CUDA Capability Major/Minor version number:   %d.%d\n",
        deviceProp.major,deviceProp.minor);
    printf("  Total amount of global memory:                %.2f GBytes (%llu bytes)\n",
            (float)deviceProp.totalGlobalMem/pow(1024.0,3),deviceProp.totalGlobalMem);
    printf("  GPU Clock rate:                               %.0f MHz (%0.2f GHz)\n",
            deviceProp.clockRate*1e-3f,deviceProp.clockRate*1e-6f);
    printf("  Memory Bus width:                             %d-bits\n",
            deviceProp.memoryBusWidth);
    if (deviceProp.l2CacheSize)
    {
        printf("  L2 Cache Size:                                %d bytes\n",
                deviceProp.l2CacheSize);
    }
    printf("  Max Texture Dimension Size (x,y,z)            1D=(%d),2D=(%d,%d),3D=(%d,%d,%d)\n",
            deviceProp.maxTexture1D,deviceProp.maxTexture2D[0],deviceProp.maxTexture2D[1]
            ,deviceProp.maxTexture3D[0],deviceProp.maxTexture3D[1],deviceProp.maxTexture3D[2]);
    printf("  Max Layered Texture Size (dim) x layers       1D=(%d) x %d,2D=(%d,%d) x %d\n",
            deviceProp.maxTexture1DLayered[0],deviceProp.maxTexture1DLayered[1],
            deviceProp.maxTexture2DLayered[0],deviceProp.maxTexture2DLayered[1],
            deviceProp.maxTexture2DLayered[2]);
    printf("  Total amount of constant memory               %lu bytes\n",
            deviceProp.totalConstMem);
    printf("  Total amount of shared memory per block:      %lu bytes\n",
            deviceProp.sharedMemPerBlock);
    printf("  Total number of registers available per block:%d\n",
            deviceProp.regsPerBlock);
    printf("  Wrap size:                                    %d\n",deviceProp.warpSize);
    printf("  Maximun number of thread per multiprocesser:  %d\n",
            deviceProp.maxThreadsPerMultiProcessor);
    printf("  Maximun number of thread per block:           %d\n",
            deviceProp.maxThreadsPerBlock);
    printf("  Maximun size of each dimension of a block:    %d x %d x %d\n",
            deviceProp.maxThreadsDim[0],deviceProp.maxThreadsDim[1],deviceProp.maxThreadsDim[2]);
    printf("  Maximun size of each dimension of a grid:     %d x %d x %d\n",
            deviceProp.maxGridSize[0],
        deviceProp.maxGridSize[1],
        deviceProp.maxGridSize[2]);
    printf("  Maximu memory pitch                           %lu bytes\n",deviceProp.memPitch);
    printf("----------------------------------------------------------\n");
    printf("Number of multiprocessors:                      %d\n", deviceProp.multiProcessorCount);
    printf("Total amount of constant memory:                %4.2f KB\n",
    deviceProp.totalConstMem/1024.0);
    printf("Total amount of shared memory per block:        %4.2f KB\n",
     deviceProp.sharedMemPerBlock/1024.0);
    printf("Total number of registers available per block:  %d\n",
    deviceProp.regsPerBlock);
    printf("Warp size                                       %d\n", deviceProp.warpSize);
    printf("Maximum number of threads per block:           %d\n", 
    deviceProp.maxThreadsPerBlock);
    printf("Maximum number of threads per multiprocessor:  %d\n",
    deviceProp.maxThreadsPerMultiProcessor);
    printf("Maximum number of warps per multiprocessor:     %d\n",
    deviceProp.maxThreadsPerMultiProcessor/32);
    return EXIT_SUCCESS;
}

将上述代码保存为device_info.cu，然后编译运行：

nvcc -o device_info device_info.cu
./device_info

输出为：

深度学习 CUDA GPU 并行计算

转载原出处：https://muzhan.blog.csdn.net/article/details/120212374?spm=1001.2014.3001.5502

打赏 0

上一篇：轻量级Visual Transformer模型——LeViT(ICCV2021)

精选【CUDA编程4】获取device详细信息

木盏

为你推荐

inline内联函数速解

柔顺控制---python解微分方程（二）

c++值deque容器

VScode 关闭新建文件的语言选择提示后如何再开启

0.MySQL数据库的基本管理(增、删、改、查)

从 CodeGemma 到 CodeQwen1.5：开源编程大模型百家争鸣

关于作者

木盏

37

0

500

2

AugGAN：基于GAN的图像数据增强

matplotlib画3D人体关键点

用3D高斯泼溅(3DGS)重建自己的数据

相关推荐

ROS2学习笔记10--使用ros2 bag进行录制和回放数据

Qt windows端的蓝牙串口服务

精选C语言指针--二级指针

分类评价指标：TP、TN、FP、FN、Recall，以及人脸识别评价指标TAR、FAR、FRR

LeetCode：654. 最大二叉树（单调栈）

详细介绍如何从0开始写一个数据通信，将数据从单片机发送到上位机（或者虚拟示波器）进行数据或图像显示，以及常见问题或注意事项解答，本文主要以匿名上位机为例，适合新手和小白

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

精选【CUDA编程4】获取device详细信息

木盏

为你推荐

inline内联函数速解

柔顺控制---python解微分方程（二）

c++值deque容器

VScode 关闭新建文件的语言选择提示后如何再开启

0.MySQL数据库的基本管理(增、删、改、查)

从 CodeGemma 到 CodeQwen1.5：开源编程大模型百家争鸣

评论（0）

关于作者

木盏

37

0

500

2

AugGAN：基于GAN的图像数据增强

matplotlib画3D人体关键点

用3D高斯泼溅(3DGS)重建自己的数据

相关推荐

ROS2学习笔记10--使用ros2 bag进行录制和回放数据

Qt windows端的蓝牙串口服务

精选C语言指针--二级指针

分类评价指标：TP、TN、FP、FN、Recall，以及人脸识别评价指标TAR、FAR、FRR

LeetCode：654. 最大二叉树（单调栈）

详细介绍如何从0开始写一个数据通信，将数据从单片机发送到上位机（或者虚拟示波器）进行数据或图像显示，以及常见问题或注意事项解答，本文主要以匿名上位机为例，适合新手和小白

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板