
0:000:00
<p>本期播客基于 Google I/O 大会主题演讲的精彩片段,深入探讨了谷歌在人工智能领域的最新进展和未来愿景。大会宣布了 Gemini 模型的显著提升,AI 在 Google 搜索中的集成与创新应用,以及构建更个人化、主动和强大的 AI 助手的路线图。</p><p>收听本期,你将了解:</p><ul> <li><strong>Gemini 模型进展</strong>: Gemini 2.5 Pro 在 ELO 评分和基准测试中取得领先,Gemini 2.5 Flash 提升效率和性能,以及实验性的 Gemini Diffusion 模型带来的低延迟文本生成。了解 Deep Think 模式如何推动模型性能极限。</li> <li><strong>搜索的AI转型</strong>: Google 搜索引入 AI 概览,并推出全新的 AI 模式,支持更长、更复杂的查询和多轮对话。探索查询扇出 (query fanout) 和深度搜索 (deep search) 技术如何实现更全面的网络信息分析。</li> <li><strong>Gemini App 的新能力</strong>: Gemini App 旨在成为个人化、主动和强大的通用 AI 助手。新增功能包括通过 Project Astra 实现的相机和屏幕共享功能 (Gemini Live),以及利用个人上下文 (personal context) 提供更相关的帮助。了解代理模式 (agent mode) 如何自动完成多步骤任务,以及 Canvas 在深度研究和内容创作中的应用。</li> <li><strong>AI在创意领域的突破</strong>: 介绍全新的图像生成模型 Imagine 4,其图像质量更高、文本处理更佳。发布视频生成模型 V3,首次实现原生音频生成。了解 AI 电影制作工具 Flow 和音乐生成模型 Lyria 2,以及内容水印技术 Synth ID。</li> <li><strong>Android XR 与物理世界</strong>: 探讨 Android XR 平台如何将 AI 助手带入头显和眼镜等新兴设备,实现实时视觉和音频交互。</li> <li><strong>基础设施与未来愿景</strong>: 提及第七代 TPU Ironwood 对模型性能的提升。展望将 ...