通义深度研究:开源AI研究新范式

通义深度研究:开源AI研究新范式

Published on Sep 21
24分钟
Daily LLM Papers
0:00
0:00
<p><a href="https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/">通义 DeepResearch:开源 AI 智能体的新纪元</a></p><p><strong>阿里巴巴通义实验室</strong>在开发自主信息搜索和推理代理模型方面的进展,集中于三个相关的项目:<strong>Tongyi DeepResearch</strong>、<strong>WebDancer</strong> 和 <strong>WebSailor</strong>。这些研究的核心目标是构建能够执行复杂、多步骤任务的大型语言模型(LLMs),方法包括生成<strong>高质量、高不确定性的训练数据</strong>,例如通过构建知识图谱和模糊信息来合成问题(SailorFog-QA, CRAWLQA),以及使用如 <strong>ReAct 框架</strong>和<strong>强化学习(RL)等后训练方法。特别是,WebSailor 引入了 DUPO 算法来提高 RL 训练的效率和有效性,而 WebWatcher 则将代理的能力扩展到了多模态(Vision-Language, VL)推理任务</strong>,并在 BrowseComp-VL 和 HLE 等挑战性基准测试中展现出超越现有开源和专有系统的性能。</p>
通义深度研究:开源AI研究新范式 - Daily LLM Papers - 播刻岛