写点什么

某中心发布云端浏览器工具 AgentCore,赋能 AI 网页交互

作者:qife
  • 2025-08-10
    福建
  • 本文字数:944 字

    阅读完需:约 3 分钟

某中心发布 AgentCore 云端浏览器工具

在某机构 2025 纽约峰会上,某机构云服务(AWS)宣布推出 Amazon Bedrock AgentCore 浏览器工具的预览版。该工具作为完全托管的云端浏览器,使生成式 AI 代理能够无缝与网站交互,解决两大核心问题:基础模型依赖静态训练数据而缺乏实时信息获取能力;企业在规模化部署 AI 网页自动化时面临的技术挑战。

技术背景与价值

AgentCore 浏览器工具专为多步骤复杂任务设计,提供以下关键能力:


  • 动态数据获取:突破 API 限制,直接从网页获取实时数据

  • 规模化部署:支持数千并发会话的企业级自动化需求

  • 基础设施托管:消除自建浏览器集群的管理负担


典型应用场景包括:


  1. 重复性任务自动化:表单填写、数据提取、内容预审

  2. 智能研究助手:价格监控、舆情分析、知识库更新

  3. 跨系统工作流:多 SaaS 系统集成、供应链可视化

  4. 测试验证:跨设备兼容性测试、持续性监控

  5. 遗留系统对接:无 API 旧系统的数据提取

核心技术特性

网页交互能力

  • 完整导航控制(含多页流程)

  • JavaScript 富应用支持

  • 表单操作(文本/下拉/文件上传)

  • 拟人化交互(滚动/悬停/点击)

无服务器架构

  • 自动扩缩容(单会话至数千并发)

  • 全球部署选项

  • 按用量计费模式

视觉理解

  • 全页面截图分析

  • 视觉元素定位

  • 图形内容提取

  • 分辨率/设备模拟

企业级安全

  • 会话隔离机制

  • IAM 访问控制

  • 临时会话销毁

开发支持

# Playwright集成示例from bedrock_agentcore.tools.browser_client import browser_session
with browser_session('us-west-2') as client: ws_url, headers = client.generate_ws_headers() # 建立浏览器连接... page.goto("https://example.com")
复制代码

技术实现路径

AI 代理通过以下流程驱动浏览器:


  1. 用户输入自然语言指令(如"搜索某商品")

  2. 代理框架(如 Nova Act)将指令转换为结构化命令

  3. 通过 WebSocket 安全连接执行浏览器操作

  4. 返回页面响应及截图供 AI 进一步分析

部署要求

  • Python 3.10+环境

  • IAM 权限配置

  • 可选可视化组件 BrowserViewerServer


# 快速启动命令git clone https://github.com/awslabs/amazon-bedrock-agentcore-samples.gitpip install bedrock-agentcore
复制代码

计费模式

  • 按秒计费(CPU/内存峰值计量)

  • 预览期免费(截至 2025 年 9 月 16 日)

  • 128MB 内存起计


该工具现已开放使用,技术文档详见某机构云服务官方开发者指南。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码


办公AI智能小助手


用户头像

qife

关注

还未添加个人签名 2021-05-19 加入

还未添加个人简介

评论

发布
暂无评论
某中心发布云端浏览器工具AgentCore,赋能AI网页交互_人工智能_qife_InfoQ写作社区