如何搭建Ubuntu 22.04上CUDA 12.5与NVIDIA驱动555的Docker GPU容器环境?
摘要:教程概述 目标 在 Ubuntu 22.04 系统中,完成「NVIDIA 555 驱动(原生支持 CUDA 12.5)+ CUDA 12.5 Toolkit + NVIDIA Container Tool
教程概述
目标
在 Ubuntu 22.04 系统中,完成「NVIDIA 555 驱动(原生支持 CUDA 12.5)+ CUDA 12.5 Toolkit + NVIDIA Container Toolkit」全环境部署,实现宿主机 / 容器双端 CUDA 12.5 开发 / 运行能力,解决版本冲突、依赖断裂、Docker 识别 GPU 等核心问题。
环境基础
系统:Ubuntu 22.04 LTS (amd64)
GPU:NVIDIA GeForce RTX 2080 Ti(适配 555 驱动,其他 GPU 通用)
最终目标:宿主机nvcc -V显示 12.5,Docker 容器运行nvidia/cuda:12.5.0-devel-ubuntu22.04并正常调用 GPU + nvcc
一、前置准备:清理旧环境(避免版本冲突)
1.1 卸载旧版本 NVIDIA 驱动 / CUDA
bash
运行
# 彻底卸载所有 NVIDIA 相关包
sudo apt purge -y nvidia-* libnvidia-* cuda-*
# 清理残留依赖
sudo apt autoremove -y --purge
# 删除 DKMS 残留
sudo rm -rf /usr/src/nvidia-*
sudo dkms remove --all nvidia
# 清空 CUDA 残留目录
sudo rm -rf /usr/local/cuda*
1.2 备份关键配置(可选)
bash
运行
# 备份 apt 源和 Docker 配置
sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak
sudo cp /etc/docker/daemon.json /etc/docker/daemon.json.bak 2>/dev/null
1.3 重启系统(清空内核模块残留)
bash
运行
sudo reboot
二、步骤 1:安装 NVIDIA 555 驱动(适配 CUDA 12.5)
555 是 NVIDIA 官方适配 CUDA 12.5 的稳定版,避开 590 版本的依赖冲突问题。
