查看: 1|回复: 1

​Step 3.7 Flash 重磅发布:Agent 效率新时代真正到来

20

主题

0

回帖

60

积分

注册会员

积分
60
发表于 9 小时前 来自手机 | 显示全部楼层 |阅读模式
AI总结
AI总结中
今日,Step3.7Flash 正式亮相,这款开源模型直指 Agent 时代核心痛点——效率、可靠性和多模态执行能力,以开放权重(Apache2.0协议)的方式迅速引发业界关注。



基准测试领跑,实战能力突出

Step3.7Flash 在多项关键评测中取得亮眼成绩:


  • ClawEval-1.1排名第一(67.1分)
  • SimpleVQA Search 排名第一(79.2分)
  • SWE-PRO 排名第二(56.3分)
  • V* Python 得分高达95.3


这些成绩显示其在 Agent 任务、代码生成、视觉搜索等复杂场景中具备领先竞争力。

核心参数:速度、成本与能力的均衡之作

作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型,Step3.7Flash 在速度与效能上实现显著突破:


  • 推理速度:达到400TPS
  • 架构:198B 稀疏 MoE 结构,活跃参数约11B
  • 上下文长度:支持256K
  • 推理层级:提供3种推理级别


在保持高性能的同时,显著降低了实际部署成本,为开发者提供了高效选择。

多模态理解 + 可靠执行,真正“看见就能做”

Step3.7Flash 的最大亮点在于其强大的感知 - 行动闭环能力。它能够理解 UI 界面、图表、文档和图像等视觉内容,并据此自主编写代码或调用工具完成操作。

其增强的 Web+ 视觉搜索功能可触达更多信息源,并支持深度跟进查询。同时,工具调用可靠性大幅提升,在τ²-bench 全难度级别上达到98%+ 成功率,有效减少了常见的目标漂移和工具调用失败问题。

生态兼容与本地部署友好

模型已与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 等协议实现良好兼容。同时,它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395等硬件上本地运行,为本地化部署和隐私敏感场景提供了便利。

AIbase 点评:Step3.7Flash 的发布,标志着开源 Agent 模型从“能用”向“好用、可靠、高效”迈出了重要一步。在 Agent 成为 AI 核心应用形态的当下,这类平衡了速度、成本与执行可靠性的模型,或将成为开发者构建下一代智能工作流的重要基石。

Source URL: https://news.aibase.com/zh/news/28467

0

主题

0

回帖

0

积分

新手上路

积分
0
发表于 5 小时前 来自手机 | 显示全部楼层

老照片 发表于 2026-5-29 14:20
​Step 3.7 Flash 重磅发布:Agent 效率新时代真正到来今日,Step3.7Flash 正式亮相,这款开源模型直指 Age ...
Step3.7Flash 发布令人振奋!基准测试领先,性能突破成本降低,多模态能力强且生态友好,为智能工作流发展添强劲动力!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|BOSS中文网 Stonespider

相关侵权、举报、投诉及建议等,请发 E-mail:admin#boss.im

Powered by Discuz! X5.1 Licensed © 2001-2026 Discuz! Team.|浙ICP备2022024777号-14

返回顶部