如何快速实现LangChain AgentRun在浏览器沙箱的极简集成?
摘要:前言 在 Agentic AI 时代,智能体需要与真实世界交互,而浏览器是连接虚拟世界与现实世界的重要桥梁。AgentRun Browser Sandbox 为智能体提供了安全、高性能、免运维的浏览器执行环境,让 AI Agent 真正具备
前言
在 Agentic AI 时代,智能体需要与真实世界交互,而浏览器是连接虚拟世界与现实世界的重要桥梁。AgentRun Browser Sandbox 为智能体提供了安全、高性能、免运维的浏览器执行环境,让 AI Agent 真正具备"上网"的能力——从网页抓取、信息提取到表单填写、自动化操作,一切皆可实现。
AgentRun Browser Sandbox 介绍
什么是 Browser Sandbox?
Browser Sandbox 是 AgentRun 平台提供的云原生无头浏览器沙箱服务,基于阿里云函数计算(FC)构建。它为智能体提供了一个安全隔离的浏览器执行环境,支持通过标准的 Chrome DevTools Protocol (CDP) 远程控制浏览器实例。
核心特性
无头浏览器能力
内置 Chromium/Chrome 浏览器,支持完整的 Web 标准
原生兼容 Puppeteer、Playwright 等主流自动化框架
支持通过 CDP 协议进行精细化控制
实时可视化
内置 VNC 服务,支持实时查看浏览器界面
提供操作录制功能,方便调试和回放
支持通过 noVNC 客户端在网页中直接观看
安全与隔离
每个沙箱实例运行在独立的容器环境中
文件系统和进程空间完全隔离
支持 WSS 加密传输,确保数据安全
Serverless 架构
按需创建,按量付费,无需提前预置资源
快速弹性伸缩,支持高并发场景
零运维,无需管理服务器和浏览器依赖
主要应用场景
AI Agent 赋能: 为大模型提供"眼睛"和"手",执行网页浏览、信息提取、在线操作等任务
自动化测试: 在云端运行端到端(E2E)测试和视觉回归测试
数据采集: 稳定、高效地进行网页抓取,应对动态加载和反爬虫挑战
内容生成: 自动化生成网页截图或 PDF 文档
上手使用 Agentrun Browser Sandbox
AgentRun SDK 快速介绍
后续的内容将基于 Agentrun SDK 进行,因此我们先对 SDK 进行简要介绍
AgentRun SDK 是一个开源的 Python 工具包,旨在简化智能体与 AgentRun 平台各种服务(包括 Browser Sandbox)的集成。它提供了统一的接口,让您可以用几行代码就将沙箱能力集成到现有的 Agent 框架中。SDK 的核心功能如下:
统一集成接口
提供对 LangChain、AgentScope 等主流框架的开箱即用支持
统一的模型代理接口,简化多模型管理
标准化的工具注册机制
Sandbox 生命周期管理
自动创建和销毁沙箱实例
支持会话级别的状态保持
灵活的资源配置和超时控制
安装 AgentRun SDK
pip install agentrun-sdk[playwright,server]
注意: 确保您的 Python 环境版本在 3.10 及以上。
