2024.11.02 | AI 新闻速递 - AIContext | AI每日播报

🌐 字节跳动与香港大学合作：HybridFlow框架大幅提升强化学习效率 字节跳动豆包大模型团队与香港大学共同开发的HybridFlow框架，通过混合编程模型和分布式计算技术，将强化学习训练吞吐量提升至20倍，解决了大模型训练中的灵活性和性能问题。💊 中国科学院与华西医院合作：PRnet模型助力药物发现 中国科学院与四川大学华西医院开发的PRnet深度生成模型，成功预测转录对新型化学扰动的反应，推荐了233种疾病的候选药物，研究成果发表于《Nature Communications》。🏆 Richard Sutton团队提出“奖励聚中”新思想，强化学习性能大幅提升 Richard Sutton教授团队提出的“奖励聚中”新思想，通过减去平均奖励显著提升了几乎所有强化学习算法的性能，该研究入选首届强化学习会议（RLC 2024）。🔍 OpenAI宣布ChatGPT成为AI搜索引擎，实时信息能力全面开放 OpenAI宣布ChatGPT正式成为AI搜索引擎，消除了即时信息的最后短板，付费订阅者和候补名单用户可立即使用联网的实时对话信息能力。🧠 MIT研究发现LLM几何结构与大脑功能性脑叶相似 MIT研究团队发现大型语言模型（LLM）在学习概念时形成的几何结构与大脑功能性脑叶的相似性，揭示了AI系统在处理信息时自然地发展出与生物大脑相似的几何和分形结构。🤖 中山大学与华为诺亚合作：PIVOT-R模型提升机器人复杂任务表现 中山大学和华为诺亚等单位的研究团队提出的PIVOT-R模型，通过视觉-语言模型解析用户指令，指导机器人执行任务，成功率超过谷歌的RT-1模型26.6%。🚀 清华大学交叉信息院发现data scaling laws，机器人零样本泛化能力突破 清华大学交叉信息院的研究团队在具身智能领域取得突破性进展，发现了data scaling laws，使得机器人能够在零样本情况下泛化到全新场景和...