678CHAT AI资讯 1美元搞定200个浏览器任务!开源神器BU-30B-A3B-Preview来了

1美元搞定200个浏览器任务!开源神器BU-30B-A3B-Preview来了

在AI驱动的自动化浪潮中,一个里程碑式的产品悄然登场。近日,广受开发者青睐的开源浏览器自动化框架BrowserUse宣布推出其首款自主研发的大语言模型——BU-30B-A3B-Preview。这款模型不仅迅速在技术社区引发热议,更被业内评价为“重新定义了Web Agent的能力边界”,凭借其惊人的响应速度与极低的部署成本,正加速推动网页智能操作迈向普惠化时代。

1美元搞定200个浏览器任务!开源神器BU-30B-A3B-Preview来了插图

架构革新:MoE机制让“聪明”变得轻巧

BU-30B-A3B-Preview最引人注目的设计在于其采用混合专家(MoE)结构,总参数量高达300亿,但在实际推理过程中仅动态激活30亿参数。这一精巧机制使得模型在维持强大认知能力的同时,显著降低了算力需求,实现了“高性能”与“低门槛”的罕见平衡。得益于此,开发者仅需一张主流消费级GPU即可实现本地化部署,彻底摆脱对昂贵云服务的依赖。

该模型基于阿里云通义千问团队发布的Qwen3-VL-30B-A3B-Instruct进行深度定制训练,专攻浏览器环境下的任务执行场景。支持文本与视觉双模态输入,并具备长达32K tokens的上下文理解能力,面对信息密集、结构复杂的现代网页也能游刃有余地解析和响应。

核心突破:像人类一样“看懂”网页

在实际应用中,BU-30B-A3B-Preview展现出卓越的DOM语义理解与视觉定位能力。无论是识别按钮位置、填写表单字段,还是滚动页面、点击链接,它都能以接近人类的操作逻辑完成精准交互。尤其在处理截图匹配、布局分析等视觉推理任务时,表现远超传统脚本工具。

官方指出,该模型特别适用于构建新一代Web Agent系统,在自动化测试、跨平台数据抓取、企业级RPA流程等领域具有广泛潜力。内部评测显示,其任务成功率和稳定性已达到行业领先水准。

效率革命:快十倍,便宜几十倍

性能数据尤为亮眼:平均每一步操作耗时仅1.2秒,整体任务执行效率遥遥领先;更令人震惊的是其成本控制——每投入1美元计算资源,可稳定完成约200个完整浏览器任务,性价比达到部分商用闭源模型的数十倍。这种极致的经济性,使得大规模并行运行多个AI代理成为可能。

开源赋能:点燃社区创新火种

值得关注的是,BrowserUse项目组已将BU-30B-A3B-Preview完全开源,模型权重已在Hugging Face平台公开发布,开发者可自由下载并集成至自有系统中。此举被视为对现有AI自动化生态的一次强力冲击,标志着高效、透明、可复用的Web Agent技术正式进入大众视野。

AIbase点评 让AI真正“走进”浏览器,一直是智能化演进的关键一步。BU-30B-A3B-Preview的成功落地,不仅破解了大模型“重而慢”的困局,更为中小企业和独立开发者提供了高性价比的解决方案。随着开源社区的持续参与与优化,这款模型有望成长为下一代网页自动化的核心引擎。即刻访问Hugging Face,体验属于未来的浏览器智能代理。

地址:https://huggingface.co/browser-use/bu-30b-a3b-preview

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/22387.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部