近日消息,阶跃星辰正式开源其全新agent基座模型step 3.5 flash,上线仅48小时即强势登顶openrouter平台trending榜单。该榜单由全球领先的大模型分发与评测平台openrouter实时统计生成,数据源自全球开发者及终端用户的实际api调用频次与使用深度,真实反映模型在工业级落地场景中的热度、可靠性与综合接受度。

Step 3.5 Flash 跻身OpenRouter Trending榜首,不仅印证其作为新一代技术黑马在高并发请求、长链路推理与多步决策任务中的卓越表现,更凸显其在性能压榨与系统稳定性之间达成的精妙平衡。作为专为实时Agent工作流设计的轻量高性能模型,Step 3.5 Flash 在代码类单请求推理中峰值吞吐达350 tokens/秒,显著降低智能体交互延迟。其底层采用稀疏混合专家(MoE)架构,总参数量为1960亿,但每处理一个token仅动态激活约110亿参数,在保障前沿级语义理解与逻辑推演能力的同时,大幅压缩显存占用与推理开销,真正实现“小激活、大智能”。
据阶跃星辰官方发布的《Step 3.5 Flash Technical Report》披露,该模型围绕智能体核心能力展开深度定制:一方面引入3:1滑动窗口注意力(SWA)与全局全注意力(Full Attention)混合机制,兼顾长上下文建模效率与关键信息捕捉精度;另一方面集成MTP-3(Multi-Token Prediction, 预测3 token)技术,提升生成密度,减少迭代轮次。此外,模型构建于可扩展强化学习(RL)框架之上,持续在数学推理、代码生成与工具调用等维度进行闭环优化,支撑Agent在复杂现实任务中稳定进化。
在权威基准测试中,Step 3.5 Flash 表现亮眼:IMO-AnswerBench准确率达85.4%,LiveCodeBench-v6(2024.08–2025.05)达86.4%,τ²-Bench达88.2%,BrowseComp(含上下文感知与管理)达69.0%,Terminal-Bench 2.0达51.0%——多项指标逼近GPT-5.2xHigh、Gemini 3.0 Pro等顶尖闭源模型。以1960亿总参数、110亿激活参数的紧凑结构,达成与百亿至千亿级“巨模”同档的Agent智能水准,标志着高效智能体基座进入新纪元。

上图:Step 3.5 Flash 以仅110亿激活参数(1960亿MoE总参数)实现媲美主流闭源及开源大模型的综合智能水平,重新定义轻量化Agent基座的能力边界。











