近日,来自麻省理工学院的初创公司 OpenAGI 正式亮相,并宣布其新推出的 AI 模型 Lux 在计算机操作方面的表现超越了 OpenAI 和 Anthropic 的同类产品,且成本仅为其十分之一。OpenAGI 的首席执行官秦增义表示,Lux 是一种基础模型,旨在通过解析计算机截图,自动执行桌面应用程序中的操作。
在最新发布的 Online-Mind2Web 基准测试中,Lux 的成功率达到了83.6%,而 OpenAI 的 Operator 仅为61.3%,Anthropic 的 Claude Computer Use 则为56.3%。这种显著的性能差距让业界人士对 Lux 的技术能力充满期待。
与传统的大型语言模型不同,Lux 采用了 “Agent主动预训练” 的方法,专注于从计算机截图和动作序列中学习。这一自我强化的训练循环使得 Lux 能够在不断探索的过程中提高自身能力,从而实现了更高效的操作。
OpenAGI 还声称,Lux 的操作成本大约是 OpenAI 和 Anthropic 前沿模型的十分之一,且其速度也更快。不同于仅能处理浏览器任务的竞争对手,Lux 可以全面控制桌面应用程序,包括 Excel、Slack 等,极大地扩展了其市场潜力。公司同时发布了开发者软件开发工具包,允许第三方基于 Lux 开发应用。
在安全性方面,OpenAGI 为 Lux 设计了内置的安全机制,当模型接收到可能违反安全政策的请求时,会拒绝执行,并向用户发出警告。这一特性在当前 AI 代理快速发展的背景下尤为重要。
秦增义博士背景深厚,曾参与开发多个广受欢迎的 AI 模型,展示了较小团队在技术上的潜力与创新。
划重点:
– 🚀 OpenAGI 推出的 Lux AI 代理在计算机操作基准测试中获得83.6% 的成功率,远超 OpenAI 和 Anthropic。
– 💡 Lux 采用独特的学习方式,通过计算机截图和动作序列进行训练,具有自我强化的能力。
– 🔒 安全机制内置于 Lux 中,能够识别和拒绝潜在的危险请求,保障用户数据安全。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则