
0:000:00
<p>哈喽,各位听众朋友们!我是敢想老田,今天咱们来点硬核爆料,聊聊这个AI圈的最新热点谷歌的Gemma 3n。最近啊,这AI界简直静得像周末的图书馆,大家都在闷声鼓捣着,可就是不见啥动静。国内的DeepSeekR2呢?半真半假的爆料满天飞,却连个影子都见不着,感觉再过半年也不见得能落地。那AI四小龙?去年打得你死我活,今年倒像是集体冬眠了,敲敲打打半天,啥也没端出来。大厂们也慢悠悠的,豆包搞了个16模型,宣传重点却跑偏到TRAE和扣子空间讯飞忙着AI教育和办公Agents百度在推全流程AI修图,总之都是实用派,但亮点不足。云端大模型没进展,本地大模型更是原地踏步,Mistral AI都销声匿迹小半年了,所谓的AI手机90靠云端撑场子。谷歌一看这不行啊,Pixel系列还得靠本地AI吃饭呢,于是上周,DeepMind在推特上高调宣布Gemma 3n来了!号称移动端侧模型的新王,要给设备带来多模态革命。我敢想老田一听,这不就是端侧大模型的答案吗?立马下载实测,结果发现,这玩意儿偏科得像个偏执狂,但偏偏,这才是移动AI的真谛。别急,咱们从头道来。</p><p>首先,Gemma 3n是啥?谷歌用MatFormer架构打造的这个轻量化模型,主打一个以小搏大。官方推了两个型号5B和8B,但内存占用只相当于2B和4B,最低只要2GB RAM,专为手机平板和笔记本设计。多模态是它的杀手锏原生支持图像音视频输入,能干自动语音识别ASR语音翻译AST,以及各种图像和视频理解任务。多语言支持让它天生适合移动端,不像那些单一文本模型,枯燥得跟白开水似的。部署起来也简单了,谷歌悄悄上线了Google AI Edge Gallery应用,安卓用户从GitHub就能下载,直接在手机上运行开源模型,不用联网,不用虚拟机,本地算力搞定一切。加载后,对话AI图像理解提示词实验室全齐活,还能导入自定义模型。我敢想老田一试,嘿,部署门槛低了90,以前搞个本地模型得折腾Linux虚拟机,现在点几下就成,真正让AI飞入寻常百姓家。</p><p>实测部分,是咱今天的重头戏。我拿Gemma 3n4B和通义千问的Qwen2515BQwen34B GGUF一起比划,场景从逻辑推理到图像识别,包罗万象。第一题Strawberry一词中有多少个字母r?这题看似简单,却坑惨过一堆大模型。Gemma 3n和Qwen25都栽了...