如果你有过以下惨痛经历:

吭哧吭哧肝了 200 小时文献综述,疯狂 Ctrl+C 和 Ctrl+V,最后导师却说「你这引用质量和百度百科有什么区别?」

被老板临时需求追杀到凌晨五点,打开 82 个网页看到眼冒金星,结果项目报告里的关键数据居然来自知乎匿名编故事大佬。

这时SurveyGO 闪亮登场,拯救你的发际线来了!

image.png

它是来自清华的面壁智能团队的新作品,科研党专属的“提效神器”!

SurveyGO 光看题目框架,就能提炼其中的逻辑能力。 并且还能轻松直出数万字综述!

image.png

因为 SurveyGO 写论文非常的卷,其中又用到了卷积的技术,所以大家给她取了个外号——卷姬

image.png

SurveyGO 产品也非常简洁易用,点击「开始综述」按钮后出现一个面板,按照需求有普通模式和专业模式可选,用户可以填写论文标题、描述,选择中英文语言;再点击「SurveyGO」按钮即可成功提交选题。

image.png

写作需求表」,还能围观大家风格各异的好奇心,为你感兴趣的研究点赞!

image.png

最近,特朗普政府发起的关税大战沸沸扬扬。我们让卷姬 SurveyGO、OpenAI-DeepResearch、AutoGLM-沉思和 Gemini DeepResearch 分别以《关税大战对普通人生活的影响》为题,撰写一篇详尽的综述报告。

一篇好的报告,可以从 4 个科学维度考量,我们将以这些维度进行横评:

1. 结构维度:结构清晰合理。

2. 内容维度:论据有支撑、内容和主题相关、语言风格良好、有拓展延伸的思考。

2. 观点维度:具有信息量的观点的数量和密度。

4. 引用维度:引用文献的准确率和召回率。

从结构维度看,SurveyGO 生成文章的目录层次分明。OpenAI DeepResearch 的目录结构较为简单,虽然能很好切题,但没有展现出很好的层级或者递进关系。AutoGLM-沉思的标题层级更接近于对现有信息的分点罗列,缺乏整合与深度思考。而 Gemini DeepResearch 的目录分点切题,但结构存在冗余,例如 3、4、5、6可能可以归类为 1 到 2 个章节。

至于内容维度,从导言和结论基本可见分晓。

SurveyGO 的导言部分从历史说起,逐渐切入时事,娓娓道来,是一个很有深度的分析。结尾分析更见功力,角度全面,丝滑缜密。

OpenAI DeepResearch 的导言部分有背景介绍和核心关注点,具备一定的「透过现象看本质」特征,而结论部分的递进关系写得较好,文采不错,有升华主旨。

AutoGLM-沉思的概况能够准确捕捉热点新闻信息,真实性可供验证,但概括性不足,无法让人从宏观视角理解全局事件。

Gemini DeepResearch 的导言的结构清晰,思路明确,解释了关税的定义、运作方式和关税大战的触发因素等,能够有助于读者了解事件的背景等,这部分的表现好于 OpenAI DeepResearch 和 AutoGLM-沉思。

image.png

去年 9 月,面壁小钢炮 MiniCPM 3.0 的「无限长文本」让人眼前一亮。背后的技术原理 LLMxMapReduce 长本文分帧处理技术堪称「大模型长文本上分神器」。

今天,让 SurveyGO 成为新晋「卷王」的 LLMxMapReduce-V2 长文本整合生成技术,正是它的进化版本。

为了进一步提升⼤语⾔模型长文本生成的内容质量,AI9Star、OpenBMB、和清华大学的小伙伴联合研发,提出 LLMxMapReduce-V2。这项技术的核⼼在于借助⽂本卷积算法实现多篇参考⽂献的聚合来代替现有⽅法中常⻅的检索,从⽽实现对全部参考⽂章的充分利⽤

image.png

实验数据显示,LLMxMapReduce-V2 在参考利⽤率上至少提⾼了 32.9%,在其他维度的表现也显著优于提取式基线⽅法。

技术论文:https://arxiv.org/abs/2504.05732

GitHub:https://github.com/thunlp/LLMxMapReduce/tree/main


点赞(223)

评论列表共有 0 条评论

立即
投稿
返回
顶部