如何详细部署GPUStack Windows在WSL2上?

摘要:在 WSL2(Windows Subsystem for Linux) 中配置 NVIDIA GPU 并部署 GPUStack。
GPUStack v2 以高性能推理与生产级稳定性为核心演进方向,对整体架构进行了全面重构,实现了组件间的灵活解耦,并对多推理引擎和异构算力进行了深度优化,充分释放推理引擎在吞吐、延迟与并发方面的性能潜力。 基于这一架构设计,GPUStack v2 聚焦 Linux 原生环境,以充分利用其在生态和 AI 基础设施领域的成熟优势。 对于 Windows 用户,推荐通过 WSL2(Windows Subsystem for Linux) 运行 GPUStack v2,在 Windows 上构建与 Linux 生产环境高度一致的 AI 运行环境,完整体验 v2 带来的性能优化与架构优势。 整篇稍长,可先看以下总结的六点,有问题再细看全文: 驱动安装:在 Windows 主机安装 NVIDIA 驱动,不要在 WSL 内部安装。 CUDA 环境:无需 CUDA Toolkit(Windows/WSL 均不需要)。 容器环境:请在 WSL 内部安装原生 Docker Engine,不要使用 Docker Desktop。 (可选)局域网访问:若需局域网访问 Server,可在 "WSL Settings" 中将网络模式配置为 Mirrored。 环境检测:运行环境检测时,请使用 默认用户,不要使用 root 用户(nvidia-smi 在 WSL 中的非标准路径中,此路径不在 root 用户下的环境变量中)。 IP 配置:Worker IP 填写 WSL 的具体 IP,使用 127.0.0.1 可能存在问题。 下面将详细介绍如何在 WSL 环境中配置 NVIDIA GPU 并部署 GPUStack。 1. 实验环境 本文基于以下实验环境编写,但适用于大多数支持 WSL 的 Windows 10/11 系统。 操作系统:Windows 11 硬件:GeForce RTX 4090D 虚拟化:需在 BIOS/UEFI 中开启虚拟化支持 2. 关键架构说明 相关参考文档: Microsoft WSL 官方文档(GPU 支持):https://learn.microsoft.com/en-us/windows/wsl/tutorials/gpu-compute NVIDIA CUDA on WSL 用户指南:https://docs.nvidia.com/cuda/wsl-user-guide/index.html 在 WSL 中部署 GPUStack 有两点需要注意: 2.1 驱动安装 在 Windows 系统中安装 NVIDIA 显卡驱动,不要在 WSL 中安装。WSL 内部会自动通过 Passthrough 机制调用宿主机的驱动,在 WSL Linux 发行版中重复安装 NVIDIA 驱动或 CUDA Toolkit 可能会破坏现有环境。 2.2 容器运行时 请使用原生 Docker Engine,不要使用 Docker Desktop 集成。Docker Desktop 的网络模型与标准 Docker Engine 不同,会导致 GPUStack 组件间通信失败。 如果已经安装 Docker Desktop,请在 Docker Desktop 设置中关闭对目标子系统的集成。参考配置如图所示: 3. 环境准备步骤 步骤 1:安装 NVIDIA 驱动(Windows 端) 前往 NVIDIA 官方驱动下载页面,根据显卡型号下载并安装Windows 版本的最新驱动程序。 下载地址:https://www.nvidia.com/en-us/drivers/ 步骤 2:安装或更新 WSL(Windows 端) 以管理员身份打开 PowerShell 或命令提示符,执行以下命令安装或更新 WSL: # 安装 WSL(默认安装 Ubuntu) wsl --install # 或者更新 WSL 至最新内核 wsl --update 注意:首次安装 WSL 后,系统可能要求重启计算机。 详细步骤参考:https://learn.microsoft.com/en-us/windows/wsl/install 步骤 3:安装 Docker Engine(WSL 端) 进入 WSL Linux 终端,按照 Docker 官方文档安装 Docker Engine。
阅读全文