94. 逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学”

94. 逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学”

Published on Feb 23
2小时36分钟
张小珺Jùn|商业访谈录
0:00
0:00
<figure><img src="https://image.xyzcdn.net/Flo18nNUSP7OUNlTf8UgCdHxio6O.jpg"/></figure><p>今天这集节目延续我们的论文系列。我邀请MIT计算机科学与人工智能实验室的在读博士松琳,来给大家解读<strong>上个星期DeepSeek和Kimi发布的全新技术报告</strong>。</p><p>DeepSeek和Kimi又一次技术对垒。在同一天发布论文,两篇集中在改进注意力机制以处理长文本任务上。而春节前,<strong>MiniMax也发布了一篇注意力机制相关的论文</strong>。</p><p>松琳将带领大家阅读这3篇注意力机制有关的文章,解析不同模型公司的技术哲学和路线选择。</p><p>我们希望能<strong>让更多人领略AI科技平权,体验技术之美。</strong></p><p>2025,我们和AI共同进步!</p><blockquote><em>(如果如果,你觉得光听还不够刺激,觉得一定要坐在电脑前看着投屏、拿起纸笔学习更有沉浸感…如果你实在是真心想要找虐的话…请前往:</em><a href="https://www.bilibili.com/video/BV1ZmAQekEMc/?vd_source=aa7c66a3d015be4b5bfcd520784f2790#reply255498135873">含投屏的视频版本</a><em>。预祝你学习顺利啦!)</em></blockquote><figure><img src="https://image.xyzcdn.net/Fm2F9n8vMm_n-xafqMi98xs3T3K8.png"/></figure><figure><img src="https://image.xyzcdn.net/Fq7qKupNr2NknLR13A1tECGH-Wkx.png"/></figure><blockquote>我们的播客节目在<a href="https://view.inews.qq.com/u/8QIf3n5c64Ucuzne7gI%3D?devid=FF4E49E6-9C89-4986-A413-04E856F31262&amp;qimei=766696f2cd8f313d744bc2c9000012918102...