[春节特别版]刘杨|从"Deepseek"谈大模型的新范式与教育AI的未来

[春节特别版]刘杨|从"Deepseek"谈大模型的新范式与教育AI的未来

Published on Jan 29
52分钟
教育AI智造者
0:00
0:00
<p>本期节目临时加录,聚焦最近引发行业热议的开源大模型「Deepseek」。</p><p>我邀请到资深大模型研究员刘洋,深入探讨了该模型的独特之处、技术原理、以及其在教育领域和AI人才培养方面的潜在影响。我们还讨论了结合通用大模型的演进路径,探讨了对话式生成模型如何进一步在垂直领域(如教育)发挥作用,并对未来5—10年大模型的发展及其对人才需求的影响进行了预测。<br> <br> <br> <br> <strong>内容大纲</strong></p><p><strong>开场与嘉宾自我介绍</strong></p><ul> <li>「Deepseek」开源模型在近期媒体和行业内的热度与影响</li> <li>十年AI领域经验,主要研究对话系统、教育与AI的结合</li> <li>回顾深度学习从萌芽到大模型崛起的行业变迁</li></ul><p><strong>从Transformer到大语言模型的演进</strong></p><ul> <li>语言即智能:语言在AI中的地位与重要性</li> <li>「Next Token Prediction」与大模型涌现能力的关系</li> <li>GPT系列的发展与「语言+思维」的研究脉络</li></ul><p><strong>模型规模与推理能力的关系</strong></p><ul> <li>Knowledge(知识)与Reasoning(推理)的双向提升</li> <li>编程数据、数学数据对增强推理能力的帮助</li> <li>「语言+代码」如何训练出更强的综合处理与推理能力</li></ul><p><strong>聊「Deepseek」的核心思路</strong></p><ul> <li>纯强化学习(RL)路径与「高质量少量数据」的关键作用</li> <li>与AlphaGo/AlphaZero的类比:自我对弈、自我纠正的重要性</li> <li>下一阶段「Next Token Prediction」与「Chain of Thought」涌现的背后机制</li></ul><p><strong>大模型与行业应用的平衡</strong></p><ul> <li>如何看待API调用与自主训练小模型之间的抉择</li> <li>模型蒸馏(Distillation)与领域调优(Domain-spe...