近日,阶跃星辰(StepFun)正式推出了全新的深度研究智能体模型——

与市面上常见的、主要针对短问题检索优化的 Web Agent 不同,
目前,该模型在 Scale AI 的研究评测指标中达到了61.42% 的依从率,表现足以媲美 OpenAI 和 Google 的同类深度研究系统。而在阶跃星辰自有的 ADR-Bench 中文基准测试中,这款32B 模型甚至超越了部分更大规模的开源模型,展现出极高的实用价值和成本优势。
论文:https://arxiv.org/pdf/2512.20491
划重点:
???? 单智能体架构:
权威索引中获取信息,生成严谨的结构化报告。 ???? 性能表现强劲:在多项深度研究评测中表现优异,其32B 的体量实现了可比肩大参数量闭源模型的专业研究水准。
发表评论取消回复