专题:云原生
共42篇相关文章

如何通过Scheduler Extender在K8s中实现自定义调度逻辑?
本文主要分享如何通过 Scheduler Extender 扩展调度器从而实现自定义调度策略。 1. 为什么需要自定义调度逻辑 什么是所谓的调度? 所谓调度就是指给 Pod 对象的 spec.nodeName 赋值 待调度对象则是所有 sp...

如何深入理解 HAMi vGPU 中的 hami-webhook 工作机制?
上篇我们分析了 hami-device-plugin-nvidia,知道了 HAMi 的 NVIDIA device plugin 工作原理。 本文为 HAMi 原理分析的第二篇,分析 hami-scheduler 实现原理。 为了实现基于...

如何详细解析 HAMi vGPU 中 hami-scheduler 的工作流程机制?
上篇我们分析了 hami-webhook,该 Webhook 将申请了 vGPU 资源的 Pod 的调度器修改为 hami-scheduler,后续使用 hami-scheduler 进行调度。 本文为 HAMi 原理分析的第三篇,分析 h...

如何用Buildah实现轻量级镜像构建,摆脱Docker依赖?
Buildah 是一个专注于构建 OCI 镜像的工具,Buildah CLI 工具使用底层 OCI 技术实现(例如 containersimage 和 containersstorage)。 OCI 三剑客包括: 专注于镜像构建的 Bu...

vivo GPU容器在AI训练平台中的应用探索与实践有哪些?
本文展示vivo GPU平台的总体架构,介绍容器平台在大规模GPU容器集群稳定性建设措施,以及探索多种GPU容器降本提效的解决方案。分享AI工程训练平台大规模训练稳定性建设,及GPU利用率提升实践经验。...

Karmada v1.15版本发布,如何增强多模板工作负载资源感知能力?
本文分享自华为云社区《Karmada v1.15 版本发布!多模板工作负载资源感知能力增强》,作者:云容器大未来。 Karmada 是开放的多云多集群容器编排引擎,旨在帮助用户在多云环境下部署和运维业务应用。凭借兼容 Kubernetes...

Volcano v1.13发布,大模型训练推理调度能力全面增强,这是不是意味着更高效?
本文分享自华为云社区《Volcano v1.13 重磅发布!大模型训练与推理等调度能力全面增强》,作者:云容器大未来。 北京时间2025年9月29日,Volcano v1.13 版本[1]正式发布。本次更新在多方面进行了功能增强,为用户提供...

阿里云新发的AgentRun有哪些独特功能?
AI Agent 正从技术概念快步走向生产应用。然而,当开发者试图将原型推向生产环境时,一道巨大的“生产化鸿沟”随之显现:众多开源框架虽提供了强大的“大脑”,却缺失了企业级应用赖以为生的“基础设施”。 开发者实现从“原型”到“产品”的每一步...

AgentRun Sandbox SDK开源了吗?它能集成LangChain等框架吗?
让智能体开发更轻盈,让云端运行更安全——AgentRun Sandbox SDK 开源发布,赋能 Agentic AI 快速落地 引言:构建面向未来的 Agentic AI 基础设施 在大模型与智能体(Agent)技术迅猛发展的今天,开发者...

如何快速构建AI舆情实时分析专家——AgentRun实战?
舆情分析是企业感知市场脉搏、预警公关危机的“听诊器”,然而传统的舆情分析系统更像是一个个“手工作坊”,面临数据收集效率低、分析深度不够、实时性差等问题,经常反馈之后,等企业拿到报告时,舆论热点早已转移,错过最佳时间。这些挑战,正是所有舆情系...

如何将BrowserUse Agentrun Sandbox的最佳实践指南应用于进阶使用?
提示: 本文是AgentRun Browser Sandbox 快速上手实践指南的姊妹篇,专注于高级集成方案、生产环境的最佳实践、性能优化和部署策略。如果您还没有完成基础学习,请先阅读《快速上手:LangChain + A...

Serverless AI Agent 沙箱工程化之路,探秘 AgentRun 是什么?
阿里云函数计算 AgentRun 全新发布后,我们整理了“探秘 AgentRun”系列文章,本系列将梳理企业落地Agent 常见难题,给出具体解法,助力 Agentic AI 快速走进生产级环境。欢迎加入“函数计算 AgentRun 客户群...
