
0:000:00
<p>hi,这里是<strong>硅基觉醒</strong>。<br>这是一档围绕<strong>AI前沿技术和商业变革</strong>的节目,汇聚了AI创业者、投资人、以及大厂一线的实践和观察。我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。欢迎大家在小宇宙平台和微信公众号关注我们!</p><p><strong>GPT-4o</strong>正式发布图片生成功能,经过硅基觉醒团队测试,相比原有的Stable Diffusion等方案在文字可控性、一致性、交互性方面实现了<strong>质的突破</strong>。有自媒体惊呼,AI大模型的一次迭代又干翻了很多创业公司的努力。AI图像生成领域是否迎来大变天?SD,Midjourney,以及过去<strong>围绕AI生图创业的团队该何去何从</strong>?GPT-4o所代表的<strong>原生多模态大模型</strong>路线将产生什么样的变革?追赶这一技术路线又需要怎样的投入?</p><p>本期我们将围绕GPT-4o和它所代表的原生多模态大模型深入聊聊。</p><p><strong>【本期嘉宾】</strong></p><p>Harry,7年一级市场投资经验,2年互联网战略经验,AGI信徒。</p><p>史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。</p><p>小苏同学,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。</p><blockquote>提示词:请创建一幅图像:在森林中用树木排列成"你好!"三个字符。</blockquote><figure><img src="https://image.xyzcdn.net/FvnraCO3IsDRhE5Lxe_boFzaQ-Je.png"/></figure><blockquote>提示词:请帮我给我的AI播客设计一个头像LOGO,希望具备科技范,未来感,符合AI的主题,同时图片里需要包含醒目的四个中文字,硅基觉醒</blockquote><figure><img src="https://image.xyzcdn.net/FmwMi5FnB6ylPnZpWKE7MkPpD6yv.png"/></figure><blockquote>(GPT-4o连续故事情节...