
0:000:00
<p>🌐 <strong>字节跳动与香港大学合作:HybridFlow框架大幅提升强化学习效率</strong><br>字节跳动豆包大模型团队与香港大学共同开发的HybridFlow框架,通过混合编程模型和分布式计算技术,将强化学习训练吞吐量提升至20倍,解决了大模型训练中的灵活性和性能问题。</p><p>💊 <strong>中国科学院与华西医院合作:PRnet模型助力药物发现</strong><br>中国科学院与四川大学华西医院开发的PRnet深度生成模型,成功预测转录对新型化学扰动的反应,推荐了233种疾病的候选药物,研究成果发表于《Nature Communications》。</p><p>🏆 <strong>Richard Sutton团队提出“奖励聚中”新思想,强化学习性能大幅提升</strong><br>Richard Sutton教授团队提出的“奖励聚中”新思想,通过减去平均奖励显著提升了几乎所有强化学习算法的性能,该研究入选首届强化学习会议(RLC 2024)。</p><p>🔍 <strong>OpenAI宣布ChatGPT成为AI搜索引擎,实时信息能力全面开放</strong><br>OpenAI宣布ChatGPT正式成为AI搜索引擎,消除了即时信息的最后短板,付费订阅者和候补名单用户可立即使用联网的实时对话信息能力。</p><p>🧠 <strong>MIT研究发现LLM几何结构与大脑功能性脑叶相似</strong><br>MIT研究团队发现大型语言模型(LLM)在学习概念时形成的几何结构与大脑功能性脑叶的相似性,揭示了AI系统在处理信息时自然地发展出与生物大脑相似的几何和分形结构。</p><p>🤖 <strong>中山大学与华为诺亚合作:PIVOT-R模型提升机器人复杂任务表现</strong><br>中山大学和华为诺亚等单位的研究团队提出的PIVOT-R模型,通过视觉-语言模型解析用户指令,指导机器人执行任务,成功率超过谷歌的RT-1模型26.6%。</p><p>🚀 <strong>清华大学交叉信息院发现data scaling laws,机器人零样本泛化能力突破</strong><br>清华大学交叉信息院的研究团队在具身智能领域取得突破性进展,发现了data scaling laws,使得机器人能够在零样本情况下泛化到全新场景和...