如何使用英博云集群云服务器?

摘要:title: 以英博云为例介绍集群云服务器的使用 date: 2025-11-27 20:23:34 categories: [项目与实践] 目录基本关系开发机使用开创环境盘环境配置更改conda的环境存放位置更改pip缓存的存放位置共享存
目录基本关系开发机使用开创环境盘环境配置更改conda的环境存放位置更改pip缓存的存放位置共享存储卷通过huggingface_cli下载模型和数据集加速访问hfd+aria2一步到位——英博云内置加速服务 基本关系 集群下管理着多个开发机,开发机是用户使用计算资源的基本单位。每个集群有自己的共享存储卷、块存储卷以及对象存储卷。不同集群的存储不共享。 共享存储卷一般存放数据集之类的大型训练数据,可挂载到多个开发机,块存储一般只挂载到一个开发机。对象存储主要是存海量非结构化数据,如图片、音频、视频、文本等。 开发机使用 介绍两种常用的使用方式。方式一,开机后使用开发机自带的Jupyter,即点击JupyterLab。在JupyterLab里可以通过这个按钮上传文件: 然后红框左边的按钮是创建新的目录,红框右边是刷新,蓝色加号是打开新的Jupyter页面。 方式二,用ssh+VSCode连接。在VSCode搜索如下两个插件: 安装完毕后重启VSCode,点击左侧的远程资源管理器打开ssh服务器选择栏: 点中加号,增加远程服务器: 打开英博云的开发机页面,点击开发机的远程连接,复制登陆方式命令: 粘贴到弹窗: 选择要更新的ssh配置文件,没有就自己创建一个: 在弹出的配置页面中配置ssh: Host是远程服务器名字,可以自己取。假如我们复制的ssh登录方式是:ssh -p 39000 root@ssh-cn-huabei1.ebcloud.com,那么HostName就是@后面的内容,Port是ssh - p后面的数字,User是@前面的root。 保存后退出,点击箭头进入连接: 会要求选择远程平台类型,选择Linux,然后会弹出有指纹,点击继续后进入密码输入,复制英博云开发机远程连接的登录密码然后粘贴过去即可连接: 开创环境盘 系统盘默认挂载到root目录,进入root目录会看到miniconda3已经安装好,之后conda create的虚拟环境会安装到miniconda3/envs中,pip的缓存也在root目录下。 然而系统盘只有30G,将来创建更多虚拟环境时,这点空间是肯定不够的。因此推荐将pip缓存以及虚拟环境的位置更改到其他地方。 我们在英博云开一个块存储卷,专门放置环境: 存储空间可以取大些,比如64G、128G。然后到开发机中更改实例配置,下滑到存储配置,在块存储卷中挂载你新开的存储卷,然后挂载路径自定,之后在这个路径放东西就相当于放到这个新盘。 为什么要开一个新盘放环境已经讲清楚了。那么为什么选择块存储卷而不是共享存储卷放置环境?这是因为一个块存储卷只能挂载到一个开发机,也就是说如果你把这个新盘挂载到你的开发机,那么其他开发机就无法再访问这个盘的数据,就能够避免了环境被其他开发机删除的情况,而且允许了不同的开发机有不同的虚拟环境名。 如果已经开过一个环境盘,还有空间的话,那就不用再开了,这里是针对新创建机器的。 环境配置 更改conda的环境存放位置 进入根目录下的conda目录(通常叫miniconda3或者anaconda3),在该级目录下找到.condarc这个文件,添加如下内容: envs_dirs: - /data/envs /data/envs是你自定义的存放虚拟环境的位置,一般是在前面新盘的挂载路径下。保存后,以后创建虚拟环境就能自动在这个目录下创建了。同时,你可以把虚拟环境env目录移动到这个自定义的位置,conda也会识别到虚拟环境。 这样,多个虚拟环境就会安装到块存储卷中,避免了系统盘的臃肿。 更改pip缓存的存放位置 pip的缓存是全局的,也就是说所有的虚拟环境的pip缓存都将存放到一个地方,一般默认存放到根目录root下的.cache目录下。这时可以通过如下命令更改pip缓存的存放位置: pip config set global.cache-dir "/home/your_path" 或者进入根目录下的.config/pip目录,找到pip.conf文件,打开可以发现有如下内容: [global] cache-dir = /data/pip_cache 在cache-dir字段更改为自定义的路径位置即可。 如果你想恢复默认设置,可以使用以下命令: pip config unset global.cache-dir 同样,如果之前已经更改过了配置的开发机,就没必要再更改了。 共享存储卷 确保你的开发机做好了共享存储卷的挂载,打开开发机的实例配置,下滑到存储配置: 添加共享存储卷后,为其定义挂载路径,这样之后代码和数据集可以放到开发机的这个路径下。
阅读全文