如何高效安装部署向量数据库Milvus?
摘要:1 概述:Milvus 向量数据库之安装部署篇 前置知识: Milvus 向量数据库 [向量数据库AI] Milvus: 开源向量数据库 - 博客园千千寰宇 硬件要求 Milvus Standalone 部署模式的最低硬件要求为 4 核
1 概述:Milvus 向量数据库之安装部署篇
前置知识: Milvus 向量数据库
[向量数据库/AI] Milvus: 开源向量数据库 - 博客园/千千寰宇
硬件要求
Milvus Standalone 部署模式的最低硬件要求为 4 核 CPU 和 8 GB 内存
端口占用情况
端口占用情况
Milvus (Standalone / Distributed ) 支持 19530 和 9091 两个端口
端口 19530 : 用于 gRPC 和 RESTful API。
这是您使用不同 Milvus SDK 或 HTTP 客户端连接到 Milvus 服务器时的默认端口。
端口 9091 : 作为管理端口,用于 Kubernetes 内的指标收集、pprof 分析和运行状况探测。
部署模式
部署模式
维护状态
适用场景
数据规模
Milvus Lite
✅ 活跃维护
快速原型开发、Jupyter Notebook、边缘设备
数百万向量以内
Milvus Standalone
✅ 活跃维护
中小规模生产环境、早期产品阶段
最高可达1亿向量
Milvus Distributed
✅ 活跃维护
大规模生产、企业级部署
数亿至数百亿向量
Milvus Lite:作为 Python 库集成在 pymilvus 中,持续更新。最新版本可通过 pip install pymilvus 直接安装使用,无需额外启动服务端,数据持久化通过本地文件实现。
仅适用于小规模原型设计(通常少于 100 万个矢量)或边缘设备。
适合场景: Jupyter Notebook / 谷歌 Colab; 笔记本 电脑; 边缘设备
Milvus Standalone:所有组件打包在单个 Docker 镜像中,支持主备模式实现高可用,适合生产环境部署。官方文档明确说明该模式仍在持续维护,并支持扩展到1亿向量的规模。
Milvus Distributed:采用云原生架构,支持 Kubernetes 部署。最新版本(如 v2.5.x)仍在积极开发和维护中,社区讨论显示用户正在使用 v2.5.2-gpu 等较新版本进行部署测试
Milvus Lite
Milvus Lite 是 Milvus 的轻量级版本
Milvus 是一个高性能矢量数据库,通过矢量相似性搜索为 AI 应用程序提供支持。
该存储库包含 Milvus Lite 的核心组件。
使用 Milvus Lite,您可以在几分钟内开始构建具有向量相似性搜索的 AI 应用程序!Milvus Lite 适合在以下环境中运行:
Jupyter Notebook / 谷歌 Colab
笔记本 电脑
边缘设备
Milvus Lite 可以导入到您的 Python 应用程序中,提供 Milvus 的核心矢量搜索功能。
Milvus Lite 已经包含在 Milvus 的 Python SDK 中。
要使用它,您只需要: pip install pymilvus
Milvus Lite 使用与 Milvus Standalone 和 Distributed 相同的 API,提供跨环境的一致体验。
只需开发一次 GenAI 应用程序,即可在任何地方运行它们:
在笔记本电脑或 Jupyter Notebook 上使用 Milvus Lite,
在 Docker 容器中使用 Milvus Standalone,
或者在 K8s 集群上使用 Milvus Distributed 进行大规模生产。
Milvus Lite 仅适用于小规模原型设计(通常少于 100 万个矢量)或边缘设备。
对于大规模生产,我们建议使用 Milvus Standalone 或 Milvus Distributed。
您还可以考虑 Zilliz Cloud 上的完全托管的 Milvus。
Milvus-Lite
https://pypi.org/project/milvus-lite/
Milvus Lite 目前支持以下环境:
Ubuntu >= 20.04(x86_64 和 arm64)
MacOS >= 11.0(Apple Silicon M1/M2 和 x86_64)
注意:尚不支持 Windows。
