
0:000:00
<p>适逢Sora2问世不到一个月,我快速地尝试了使用Sora2“搓” 了100多个视频,分享一些所思所想给大家,文末放了邀请码,欢迎一起来玩。</p><p>节目时间线:</p><p>00:00 欢迎与开场:Sora 2 远超预期的使用体验与低失败率</p><p>02:00 限制性研究:探索 Sora 2 在资讯内容生成中的限制和失败案例</p><p>02:40 限制点1:规避知名的公众人物和名人</p><p>03:30 限制点2:国际政治话题被限制</p><p>04:00 限制点3, 4:未经授权的“共创”内容及涉及儿童的不安全因素</p><p>05:00 Sora 2 高点赞视频类型分析:体育赛事赛点、温馨场景</p><p>06:45 高赞视频类型(续):数字虚拟人主播(上半身动作可控)与电影极致质感的自然环境报道(如沙漠、宇宙)</p><p>08:30 视频生成流程:需邀请码、使用大模型完善 Prompt(构图、节奏、角色、背景音乐)与每日生产限额(最多30个视频)</p><p>10:30 视角对比:国内(中国)对广告和日常 Vlog(如爬金字塔、冲浪)效果的积极评价与内容局限</p><p>12:50 视角对比:海外(Reddit)的负面声音——不符**物理规律**的挑战(如滑板技法错误、双马物理)</p><p>15:00 国际担忧:“失控感”(Out of Control)与无法辨别 AI 视频真伪的焦虑</p><p>17:00 法律与社会应用担忧:在抚养权案件或政治选举中滥用 AI 视频的风险</p><p>19:30 个人总结与未来思考:从业者的谨慎乐观态度、监管难度(AI 内容标识)与技术发展的未知性</p><p>21:50 核心探讨:大型公司发展视觉生成的终极目标——通过视觉落地(Visual Grounding)提升文本理解力</p><p>22:30 Visual Grounding 对文本理解的三大积极影响:深入理解(具象化)、模仿人类学习模式(基于物理世界感知)及技能转移</p><p>💡Sora2邀请码:8G5MJH (再次感谢秋芝2046的介绍和分享 她的<a href="https://www.youtube.com/@qiuzhi2046">Youtube channel</a>)</p><p>💡论文:Vokenization: Imp...