如何高效安装部署向量数据库Milvus?

摘要:1 概述:Milvus 向量数据库之安装部署篇 前置知识: Milvus 向量数据库 [向量数据库AI] Milvus: 开源向量数据库 - 博客园千千寰宇 硬件要求 Milvus Standalone 部署模式的最低硬件要求为 4 核
1 概述:Milvus 向量数据库之安装部署篇 前置知识: Milvus 向量数据库 [向量数据库/AI] Milvus: 开源向量数据库 - 博客园/千千寰宇 硬件要求 Milvus Standalone 部署模式的最低硬件要求为 4 核 CPU 和 8 GB 内存 端口占用情况 端口占用情况 Milvus (Standalone / Distributed ) 支持 19530 和 9091 两个端口 端口 19530 : 用于 gRPC 和 RESTful API。 这是您使用不同 Milvus SDK 或 HTTP 客户端连接到 Milvus 服务器时的默认端口。 端口 9091 : 作为管理端口,用于 Kubernetes 内的指标收集、pprof 分析和运行状况探测。 部署模式 部署模式 维护状态 适用场景 数据规模 Milvus Lite ✅ 活跃维护 快速原型开发、Jupyter Notebook、边缘设备 数百万向量以内 Milvus Standalone ✅ 活跃维护 中小规模生产环境、早期产品阶段 最高可达1亿向量 Milvus Distributed ✅ 活跃维护 大规模生产、企业级部署 数亿至数百亿向量 Milvus Lite:作为 Python 库集成在 pymilvus 中,持续更新。最新版本可通过 pip install pymilvus 直接安装使用,无需额外启动服务端,数据持久化通过本地文件实现。 仅适用于小规模原型设计(通常少于 100 万个矢量)或边缘设备。 适合场景: Jupyter Notebook / 谷歌 Colab; 笔记本 电脑; 边缘设备 Milvus Standalone:所有组件打包在单个 Docker 镜像中,支持主备模式实现高可用,适合生产环境部署。官方文档明确说明该模式仍在持续维护,并支持扩展到1亿向量的规模。 Milvus Distributed:采用云原生架构,支持 Kubernetes 部署。最新版本(如 v2.5.x)仍在积极开发和维护中,社区讨论显示用户正在使用 v2.5.2-gpu 等较新版本进行部署测试 Milvus Lite Milvus Lite 是 Milvus 的轻量级版本 Milvus 是一个高性能矢量数据库,通过矢量相似性搜索为 AI 应用程序提供支持。 该存储库包含 Milvus Lite 的核心组件。 使用 Milvus Lite,您可以在几分钟内开始构建具有向量相似性搜索的 AI 应用程序!Milvus Lite 适合在以下环境中运行: Jupyter Notebook / 谷歌 Colab 笔记本 电脑 边缘设备 Milvus Lite 可以导入到您的 Python 应用程序中,提供 Milvus 的核心矢量搜索功能。 Milvus Lite 已经包含在 Milvus 的 Python SDK 中。 要使用它,您只需要: pip install pymilvus Milvus Lite 使用与 Milvus Standalone 和 Distributed 相同的 API,提供跨环境的一致体验。 只需开发一次 GenAI 应用程序,即可在任何地方运行它们: 在笔记本电脑或 Jupyter Notebook 上使用 Milvus Lite, 在 Docker 容器中使用 Milvus Standalone, 或者在 K8s 集群上使用 Milvus Distributed 进行大规模生产。 Milvus Lite 仅适用于小规模原型设计(通常少于 100 万个矢量)或边缘设备。 对于大规模生产,我们建议使用 Milvus Standalone 或 Milvus Distributed。 您还可以考虑 Zilliz Cloud 上的完全托管的 Milvus。 Milvus-Lite https://pypi.org/project/milvus-lite/ Milvus Lite 目前支持以下环境: Ubuntu >= 20.04(x86_64 和 arm64) MacOS >= 11.0(Apple Silicon M1/M2 和 x86_64) 注意:尚不支持 Windows。
阅读全文