MIT新创公司OpenAGI搞出个AI智能体，说比OpenAI和Anthropic还强

近日，由麻省理工学院孵化的初创企业 OpenAGI 正式对外发布其自主研发的 AI 模型 Lux，该模型在执行计算机桌面任务方面展现出显著优势。据公司披露，在最新一轮的 Online-Mind2Web 基准测试中，Lux 以高达83.6% 的任务完成率遥遥领先于 OpenAI 的 Operator（61.3%）和 Anthropic 的 Claude Computer Use（56.3%）。更引人注目的是，Lux 的运行成本仅为上述两大竞争对手前沿模型的十分之一，同时在响应速度上也更具竞争力。

Lux 的核心突破在于其独特的训练范式——“Agent主动预训练”。与依赖海量文本数据的传统大语言模型不同，Lux 通过分析用户操作过程中的屏幕截图与对应动作序列进行学习。这种基于视觉与行为反馈的闭环训练机制，使其能够在模拟环境中不断试错、优化策略，从而逐步提升对复杂桌面任务的理解与执行能力。OpenAGI 表示，这种自我强化的学习路径不仅提高了模型效率，也大幅降低了对标注数据的依赖。

在应用场景方面，Lux 的能力远不止于网页浏览。它能够无缝操控包括 Microsoft Excel、Slack、Photoshop 等在内的主流桌面应用程序，真正实现了跨平台、多软件的自动化操作。这一特性为办公自动化、客户服务、数据处理等多个行业打开了新的可能性。为加速生态建设，OpenAGI 同步推出了面向开发者的软件开发工具包（SDK），允许第三方开发者基于 Lux 构建定制化智能代理应用。

面对当前 AI 代理技术快速演进所带来的安全隐忧，OpenAGI 在 Lux 中嵌入了多层次的安全防护机制。当系统检测到用户指令可能涉及敏感操作或违反预设安全策略时，Lux 会主动拒绝执行，并向用户发出明确警示。这一设计不仅增强了模型的可信度，也为未来在企业级环境中的部署奠定了安全基础。

OpenAGI 的创始人兼 CEO 秦增义博士在人工智能领域拥有深厚积累，曾参与多个知名开源模型的研发工作。他的团队虽规模精干，却凭借对技术路径的精准判断和高效执行，迅速在竞争激烈的 AI 代理赛道中崭露头角。业内分析认为，Lux 的出现不仅挑战了现有大模型厂商在计算机使用领域的主导地位，也为“小而美”的技术创新团队提供了有力范本。

划重点:

- 🚀 OpenAGI 推出的 Lux AI 代理在计算机操作基准测试中获得83.6% 的成功率，远超 OpenAI 和 Anthropic。

- 💡 Lux 采用独特的学习方式，通过计算机截图和动作序列进行训练，具有自我强化的能力。

- 🔒 安全机制内置于 Lux 中，能够识别和拒绝潜在的危险请求，保障用户数据安全。

相关文章

想玩转AI社交，腾讯元宝得大胆点

小心裸奔的开源AI！没人管可能被黑客当跳板

ChatGPT Agent 用户跑了七成五，定位不清成最大硬伤

清华推出法律大模型LegalOne-R1，智能司法要变天了！

Sora下载量暴跌45%！OpenAI的领先优势还稳吗？

小红书悄悄试水语音问一问：真人经验+AI，搜得更懂你

发表回复 取消回复

发表回复取消回复