OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux

openagi 基金会近期正式推出其首款面向“computer-use”场景的基座模型——lux。官方宣称该模型为“全球性能最强、响应最快、成本最低的 computer-use 模型”,并已通过配套 sdk 全面开放,支持所有开发者及企业快速集成,用于打造自动化与智能代理类应用。

OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux

OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux

Lux 设计了三种灵活的运行模式,以精准匹配不同复杂度的任务需求:

  • Actor 模式:适用于目标清晰、步骤单一、执行路径明确的轻量任务,具备毫秒级响应能力;
  • Thinker 模式:面向目标抽象、流程多变、需自主规划的复杂任务,模型可主动将高层指令分解为可执行子任务,并依序推进;
  • Tasker 模式:用户直接提供结构化操作序列(以 Python 列表形式输入),Lux 严格按步执行,内置容错重试机制,确保高精度、强可控性的任务闭环 —— 尤其适用于关键业务流程与定制化自动化场景。

Lux 已在多个实际 Agent 应用领域完成验证,包括但不限于:软件质量保障全流程自动化、深度行业研究分析、跨平台社交媒体运营、电商后台管理、结构化数据批量录入与处理等。

OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux

在权威评测基准 “Online-Mind2Web”(覆盖超 300 个真实 Web 环境下的 computer-use 任务)中,Lux 取得 83.6 分的领先成绩,显著优于同期主流方案:Gemini CUA(69.0)、OpenAI Operator(61.3)以及 Claude Sonnet 4(61.0)。

OpenAGI 基金会推出号称全球最好的 Computer Use 基座模型:Lux

性能与经济性方面同样表现突出:Lux 单步操作平均耗时约 1 秒,相较竞品普遍 3 秒左右的延迟,效率提升达三倍;同时,其单位操作成本据称仅为传统方案的十分之一。

区别于传统大语言模型(LLM)依赖静态文本学习的范式,Lux 的训练采用了创新的“Agentic Active Pre-training”(主动代理式预训练)方法。模型并非被动阅读网页内容,而是在高度仿真的数字环境中持续执行动作、感知反馈、试错探索,从而内化真实操作逻辑与交互策略,真正实现“知行合一”。

OpenAGI 基金会同步开源了支撑 Agent 模型训练的核心基础设施——OSGym 数据引擎。该系统具备卓越的横向扩展能力,可无缝适配多样化 computer-use 场景,支持数千个操作系统实例并行运行,单分钟内稳定产出超千条高质量交互数据。

更多技术细节请查阅官方技术报告与开源代码库。

源码地址:点击下载

网友留言(0 条)

发表评论