1美元搞定200个浏览器任务！开源神器BU-30B-A3B-Preview来了

在AI驱动的自动化浪潮中，一个里程碑式的产品悄然登场。近日，广受开发者青睐的开源浏览器自动化框架BrowserUse宣布推出其首款自主研发的大语言模型——BU-30B-A3B-Preview。这款模型不仅迅速在技术社区引发热议，更被业内评价为“重新定义了Web Agent的能力边界”，凭借其惊人的响应速度与极低的部署成本，正加速推动网页智能操作迈向普惠化时代。

架构革新：MoE机制让“聪明”变得轻巧

BU-30B-A3B-Preview最引人注目的设计在于其采用混合专家（MoE）结构，总参数量高达300亿，但在实际推理过程中仅动态激活30亿参数。这一精巧机制使得模型在维持强大认知能力的同时，显著降低了算力需求，实现了“高性能”与“低门槛”的罕见平衡。得益于此，开发者仅需一张主流消费级GPU即可实现本地化部署，彻底摆脱对昂贵云服务的依赖。

该模型基于阿里云通义千问团队发布的Qwen3-VL-30B-A3B-Instruct进行深度定制训练，专攻浏览器环境下的任务执行场景。支持文本与视觉双模态输入，并具备长达32K tokens的上下文理解能力，面对信息密集、结构复杂的现代网页也能游刃有余地解析和响应。

核心突破：像人类一样“看懂”网页

在实际应用中，BU-30B-A3B-Preview展现出卓越的DOM语义理解与视觉定位能力。无论是识别按钮位置、填写表单字段，还是滚动页面、点击链接，它都能以接近人类的操作逻辑完成精准交互。尤其在处理截图匹配、布局分析等视觉推理任务时，表现远超传统脚本工具。

官方指出，该模型特别适用于构建新一代Web Agent系统，在自动化测试、跨平台数据抓取、企业级RPA流程等领域具有广泛潜力。内部评测显示，其任务成功率和稳定性已达到行业领先水准。

效率革命：快十倍，便宜几十倍

性能数据尤为亮眼：平均每一步操作耗时仅1.2秒，整体任务执行效率遥遥领先；更令人震惊的是其成本控制——每投入1美元计算资源，可稳定完成约200个完整浏览器任务，性价比达到部分商用闭源模型的数十倍。这种极致的经济性，使得大规模并行运行多个AI代理成为可能。

开源赋能：点燃社区创新火种

值得关注的是，BrowserUse项目组已将BU-30B-A3B-Preview完全开源，模型权重已在Hugging Face平台公开发布，开发者可自由下载并集成至自有系统中。此举被视为对现有AI自动化生态的一次强力冲击，标志着高效、透明、可复用的Web Agent技术正式进入大众视野。

AIbase点评让AI真正“走进”浏览器，一直是智能化演进的关键一步。BU-30B-A3B-Preview的成功落地，不仅破解了大模型“重而慢”的困局，更为中小企业和独立开发者提供了高性价比的解决方案。随着开源社区的持续参与与优化，这款模型有望成长为下一代网页自动化的核心引擎。即刻访问Hugging Face，体验属于未来的浏览器智能代理。

地址：https://huggingface.co/browser-use/bu-30b-a3b-preview

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复