如何搭建Ubuntu 22.04上CUDA 12.5与NVIDIA驱动555的Docker GPU容器环境?

摘要:教程概述 目标 在 Ubuntu 22.04 系统中,完成「NVIDIA 555 驱动(原生支持 CUDA 12.5)+ CUDA 12.5 Toolkit + NVIDIA Container Tool
教程概述 目标 在 Ubuntu 22.04 系统中,完成「NVIDIA 555 驱动(原生支持 CUDA 12.5)+ CUDA 12.5 Toolkit + NVIDIA Container Toolkit」全环境部署,实现宿主机 / 容器双端 CUDA 12.5 开发 / 运行能力,解决版本冲突、依赖断裂、Docker 识别 GPU 等核心问题。 环境基础 系统:Ubuntu 22.04 LTS (amd64) GPU:NVIDIA GeForce RTX 2080 Ti(适配 555 驱动,其他 GPU 通用) 最终目标:宿主机nvcc -V显示 12.5,Docker 容器运行nvidia/cuda:12.5.0-devel-ubuntu22.04并正常调用 GPU + nvcc 一、前置准备:清理旧环境(避免版本冲突) 1.1 卸载旧版本 NVIDIA 驱动 / CUDA bash 运行 # 彻底卸载所有 NVIDIA 相关包 sudo apt purge -y nvidia-* libnvidia-* cuda-* # 清理残留依赖 sudo apt autoremove -y --purge # 删除 DKMS 残留 sudo rm -rf /usr/src/nvidia-* sudo dkms remove --all nvidia # 清空 CUDA 残留目录 sudo rm -rf /usr/local/cuda* 1.2 备份关键配置(可选) bash 运行 # 备份 apt 源和 Docker 配置 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak sudo cp /etc/docker/daemon.json /etc/docker/daemon.json.bak 2>/dev/null 1.3 重启系统(清空内核模块残留) bash 运行 sudo reboot 二、步骤 1:安装 NVIDIA 555 驱动(适配 CUDA 12.5) 555 是 NVIDIA 官方适配 CUDA 12.5 的稳定版,避开 590 版本的依赖冲突问题。
阅读全文