被Stability AI赞助算力,被Open AI招募,这个大模型小团队是?

被Stability AI赞助算力,被Open AI招募,这个大模型小团队是?

Published on May 29
29分钟
先见未明
0:00
0:00
<p>本期嘉宾来自最近小有话题的一个大模型团队。<strong>非Transformer架构、作者非“AI正规军”出身、核心成员仅4人</strong>,这个叫RWKV的开源模型刚刚被Hugging Face收录入库,也在日前公开了首篇论文。</p><p>用嘉宾的话说,RWKV挑战了当下关于大模型的几个共识:Transformer是不是现在的唯一选择?小公司做不了大模型?AI的未来就是云服务?于是,我们的聊天,也从共识和非共识开始。</p><p>【本期嘉宾】</p><p>罗璇 &nbsp;智能联创兼CPO | 炬星科技联创 | 前阿里机器人产品总监</p><p>【时间轴】</p><p>03:08 RWKV是不同于TF的新架构,将算法复杂度从n²降到了n</p><p>03:50 TF和Open AI被“神话”,GPT成了衡量AI的唯一标准</p><p>05:02 TF复杂度不合理,大规模应用瓶颈明显,架构层需要创新</p><p>06:14 RWKV的正反面评价、测试结果,成为TF的补充/替代路还有多长?</p><p>09:38 未来AI不应是中央式云服务,将来的大模型可能跑在终端上</p><p>11:15 &nbsp;&nbsp;算法不做到极致就是在吃算力,现在还未形成好的芯片+OS互相迭代</p><p>12:09 小团队怎么做出大模型?大公司算力资源浪费在哪里?</p><p>14:22 与Open AI和Stability AI的交集</p><p>16:56 &nbsp;闭源是闭不住的,大模型真正的门槛不是源代码</p><p>19:30 &nbsp;RWKV希望成为Linux,元智能想成为安卓</p><p>22:30 过去的开源大模型缺乏强有力的主导方向,开源需要vision</p><p>相较于已经经过6年发展、也证明了自己独特价值的TF架构,RWKV无疑还是个小婴儿。但我觉得RWKV团队这种出于真实使用需求,去寻求更优解的精神,正是创新者的品质之一。期待看到RWKV后续scale up的发展,以及商用方面的案例。</p><p>【很高兴认识你】</p><p>散装智能,一档有人情味的科技播客。我们希望探索科技演变所辐射的所有面向,在这里,没有冰冷的技术,只有闪光的人和故事。</p><p>想交流?想表达?微信添加ziyuanao,或关注公号:散装智能</p>