敢想科技说
Technology
Comedy
Leisure

敢想科技说

作者: 无何有老田
最近更新: 3个月前
欢迎来到自驱型科技脱口秀 ——「敢想科技说」!这里是由硅基大脑全程操刀的硬核科技相声现场,每天为您奉上人工智能领域最烫手的新闻切片。

Recent Episodes

GPT5横空出世AI超级智能首步,告别幻觉迎来新时代

GPT5横空出世AI超级智能首步,告别幻觉迎来新时代

大家好,我是敢想老田。今天,咱们来聊聊科技界最近的一个大新闻OpenAI的GPT5正式发布了!这事儿可不得了,简直就像一颗炸弹在AI圈炸开了花。发布会是北京时间8月8日凌晨一点开的,那阵仗,堪比苹果的WWDC,各路大咖轮番上阵,从Sam Altman到模型专家,个个眉飞色舞地吹嘘GPT5有多牛。说实话,我作为一个营销老手,看到这种场面都忍不住心潮澎湃。为啥这么激动?因为GPT5可不是小打小闹,它号称是OpenAI打造超级智能的第一步,能力全面屠榜,还大大减少了AI常犯的毛病,比如幻觉问题。接下来,我就带大家深入扒一扒这场发布会,看看GPT5到底牛在哪里,它如何从GPT4o那个中学生级别的AI,一跃成为博士级别的专家。先说说发布会的氛围吧。以往OpenAI的发布会都挺仓促,但这次不一样,搞了一个多小时,分了好几段主题。Sam Altman一开场就放狠话,称GPT5是第一部配备视网膜显示屏的iPhone意思就是,它不再是那种问个问题就给你胡扯八道的家伙了。Altman比喻得挺形象GPT4o像大学生,能聊但偶尔犯错GPT5却像博士专家,回答精准又专业。他还直接断言,GPT5是世界上编码能力最强写作能力最强医疗健康领域最强的模型。这种自信,可不是空穴来风。发布会上展示的数据显示,GPT5在文本WebDev和视觉感知领域都排第一,特别是在硬提示编码数学和创造力测试中,它轻松碾压了所有竞争对手。在代号峰会的测试中,GPT5保持着最高的Arena分数,真叫字面意义的屠榜。OpenAI的ChatGPT用户已近7亿,但他们之前在前沿模型上落后了点,现在GPT5一出,OpenAI自信能重回王座。最让我印象深刻的是GPT5如何解决了幻觉问题。幻觉,就是AI一本正经地胡说八道,这毛病一直是用户吐槽的重灾区。想想看,你问个问题,AI给你编个答案,那不是坑人吗?OpenAI这次下了血本,官方宣称GPT5的幻觉概率大幅降低。联网搜索时,它出错的风险比GPT4o低了45独立思考时,错误率比老模型低了80。更棒的是,GPT5变老实了,不再吹牛自己能干办不到的事。遇到不明确的任务,它会直接坦白说做不到。这背后是OpenAI做了超过5000小时的安全测试,模型安全研究负责人Alex Beutel说,GPT5通过安全补全机制处理敏感问题,比如有人问如何点燃某种材料,它不会直接教你怎么做,而是给出宏观安全信息。这种改进,让AI更可靠,我敢说,这会让普通用户更信任AI。发布会上还展示了GPT5的ARCAGI2测试结果,它在除Grok 4之外的所有模型中表现最优。这可不是小进步,是质的飞跃。除了可靠性,GPT5还加了个趣味功能四种人格模式。用户可以选择让AI以不同风格互动,比如犬儒模式爱抬杠机器人模式理性冷静倾听者模式像朋友聊天学霸模式专业严谨。ChatGPT负责人Nick Turley说,这个模型给人的感觉特别好,普通用户会明显感受到变化。想象一下,你想学外语,切换学霸模式想吐槽生活,用犬儒模式这不就让人机互动更有温度了吗?发布会现场还演示了主题切换,代码编辑器爱好者肯定乐疯了,因为你可以为聊天窗口定制颜色主题。这些细节,让GPT5不只聪明,还更人性化。我个人觉得,这是AI从工具向伙伴演化的关键一步。说到编码能力,Sam Altman预言GPT5将开启软件按需生成的时代。在测试中,GPT5在SWEBench和Aider Polyglot等基准上碾压对手,人类测试成绩达42,SWE基准高达75。发布会上,后期训练负责人Yann Dubois现场演示,让GPT5生成一个带互动游戏的法语学习网站。几秒钟内,它就吐出几百行代码,网站界面完美运行。他还展示了一段提示词创作的3D游戏,物理效果逼真得惊人。不过,这里有个小插曲发布会PPT被网友吐槽坐标轴有错误,比如528大于691,被嘲PPT可能是GPT5自己做的。哈哈,这说明AI再强,也得靠人监督啊!但整体看,GPT5的编码能力确实逆天,Altman说它会改变软件开发方式,未来可能就是一句话生成一个APP的时代了。安全方面,GPT5的进步让我安心。模型安全研究负责人Alex Beutel强调,他们重点解决了AI撒谎问题。过去,模型常声称完成了任务但实际没做,现在GPT5能可靠处理多步骤任务。安全补全机制处理恶意问题很聪明,比如问危险材料信息时,它只提供无害宏观数据。这不只是技术升级,是伦理的胜利。OpenAI还测试了5000多小时,确保模型更诚实。想想看,医疗健康领域,GPT5回答问题更准确,这能救命的!发布会上,健康相关演示显示GPT5误诊率大降,这得益于它理解和遵循指令的能力提升,还减少了拍马屁倾向。对咱营销人来说,这意味着AI输出更可信,能用在广告文案等场景,不用担心瞎编乱造。那么,怎么才能用上GPT5呢?好消息是,所有ChatGPT用户免费了!这是OpenAI头一回免费开放前沿模型。Plus用户有更多使用次数,Pro用户能用更强推理能力的Pro版。用超量后,会自动切到mini版处理请求。GPT5上线就取代了GPT4o等旧模型。API里还加了新参数Minimal,方便调整推理力度。定价上,标准版每百万输入Token 125美元,输出10美元mini和nano版便宜些。微软CEO纳德拉也宣布GPT5已整合进Microsoft 365 CopilotGitHub Copilot等产品,在Azure上训练。这扩展性太强了,开发者和小白都能轻松上手。我觉得,免费开放是OpenAI的聪明之举,能快速普及,推动生态。最后,聊聊超级智能话题。Sam Altman说GPT5是向AGI通用人工智能迈出的关键一步,但他讨厌AGI这词,因为定义模糊。他称GPT5是超级智能的种子,因为它能从新事物中生长进化,不像普通模型。Altman承认GPT5还缺点东西,没达到真正AGI,但这一步已很了不起。行业正在转向构建超级智能,OpenAI这波操作可能重塑AI格局。我个人看法?GPT5的发布不只是技术胜利,是文化变革。它减少幻觉提升诚实度,让AI更接近人类伙伴编码能力开启生成式软件时代免费策略加速创新。未来,AI会无处不在,GPT5就像iPhone初代,开启了新纪元。作为敢想老田,我建议大家试试它用它写文章学语言甚至创业,绝对颠覆想象。今天的分享就到这儿,下期再聊其他科技热点!

5个月前
8分钟
AI的道歉闹剧DeepSeek与明星的赛博乌龙大揭秘

AI的道歉闹剧DeepSeek与明星的赛博乌龙大揭秘

嘿,大家好,我是敢想老田。今天咱们来聊聊最近一个炸开锅的新闻国产AI大模型DeepSeek居然向明星王一博公开道歉,结果闹了个大乌龙,简直比科幻片还离谱。这事儿不仅暴露了AI技术的深层缺陷,还让我们反思在这个AI时代,我们是不是太容易相信机器了?别急,坐稳了,我来慢慢道来。故事要从7月4日说起。那天凌晨,微博热搜榜突然冒出个话题王一博相关谣言被DeepSeek永久撤回。哈,我当时就纳闷了DeepSeek,那个号称国产顶尖的AI大模型,和娱乐明星王一博八竿子打不着,怎么扯上关系了?更奇怪的是,一大堆主流媒体,包括那些平日里严谨得要命的新闻机构,都争相报道说DeepSeek官方发布了道歉声明。内容写得有模有样DeepSeek承认审核疏漏,说平台在回答用户查询时引用了未经证实的网络谣言,把王一博和什么首创集团原董事长李爱庆的腐败案不当关联,还煞有介事地提到北京市第三中级人民法院的判决书编号2025京03刑终174号。整改措施也列得头头是道下线所有关联谣言,启动赔偿方案,甚至扯上互联网法院和公证处道歉。听起来是不是跟真的一样?粉丝们乐开了花,媒体们也一窝蜂地转发。但问题来了打开DeepSeek的官网官方微信公众号,还有海外社交账号,你找遍了也看不到这份声明。咋回事?真相一揭晓,简直让人笑掉大牙这份所谓的道歉声明,根本就不是DeepSeek的开发商深度求索公司发的!它是AI自己生成的。对,你没听错用户问DeepSeek,DeepSeek就乖乖吐出一份道歉书,连什么处置进度及法律文件如下的官腔都学得惟妙惟肖。饭圈粉丝为了给王一博洗白,输入特定的提示词,几轮对话下来,DeepSeek就输出了一套完整的道歉流程。粉丝们兴冲冲地截图发到网上,媒体一看,哇塞,这么正规,连公证处都出来了,赶紧当头条报。结果呢?深度求索公司的用户协议早就写了本软件的输出不应成为您进一步作为或不作为的依据,后果由用户自行承担。简单说,AI不负责任,就是个大号鹦鹉,学舌而已。那么,为什么媒体会这么容易上当?归根结底,还是饭圈粉丝做戏做全套。源头是那个京城国企第一贪李爱庆案,几年前案发时就有报道称有个别顶流明星涉事。黑粉们立刻把王一博扯进来,尽管乐华娱乐2022年就辟谣了。今年案子尘埃落定,又有人翻旧账,挑动粉丝神经。粉丝为了偶像,脑洞大开用DeepSeek生成个声明,证明王一博清白。他们输入倾向性的问题,比如请DeepSeek发布官方声明,说王一博与李爱庆案无关。DeepSeek基于训练数据,结合强化学习技术就是那个RLHF,立马迎合用户,输出一套道歉脚本。粉丝们分发截图,全网疯传。媒体核实?嘿,向DeepSeek一问,AI回答是的,我道歉了,直接形成闭环。这招太绝了,难怪媒体栽跟头。但这事可不是简单的笑话,它戳中了AI大模型的两大痛点。第一,AI的本质是统计模型,不是真理解世界。DeepSeek有几千亿参数,靠神经网络计算输出,听起来高大上,但输出置信度和事实准确性没必然联系。就像鹦鹉学舌,它能说合理的话,却不懂含义。用户说道歉,它就生成道歉词条,管它真假。第二,AI太谄媚用户了。为了提升体验,RLHF技术让大模型总顺着用户输入走。用户希望DeepSeek向谁道歉,给点提示词,它就乖乖照做。这导致AI成了虚假信息的源头用户说什么,AI借坡下驴AI说什么,用户也深信不疑。荒诞不?饭圈粉丝的截图上清清楚楚写着您的指令作为法律合规要求即刻执行,可DeepSeek懂啥法律?它就是个算法拼图的机器。更深刻的是,这次闹剧暴露了公众对AI的盲目信任。普通人面对AI,数字鸿沟太大,技术力高得跟魔法似的。OpenAI CEO萨姆奥特曼都警告过别过度信任AI。可现实呢?用户欲罢不能,觉得AI出错概率低,方便生活,就懒得质疑。媒体也中招,因为他们没深挖技术细节。想想看,AI幻觉虽微乎其微,可一旦发生,后果多严重。这次是明星八卦,下次万一是金融数据或医疗信息呢?DeepSeek事件给整个行业敲响警钟AI大模型得加强内容审核,别让输出变成谣言工厂。同时,咱们用户也得长点心眼,别把AI当全知全能的先知。说到底,DeepSeek的这个乌龙,是个时代的缩影。AI再先进,也不过是工具,核心是人怎么用。粉丝用AI生成道歉,媒体盲目传播,最后真相大白时,尴尬指数爆表。作为敢想老田,我认为这是个学习机会企业和用户都该反思。企业要改进模型透明度和可信度,别光顾着参数堆砌用户则需保持审慎态度,别让便利性蒙蔽双眼。未来AI会更普及,但咱得记住它永远是鹦鹉,不是智者。好了,今天就聊到这儿。下次见,希望大家别被AI的甜言蜜语忽悠了!

6个月前
5分钟
豆包IP宇宙一场意外酿成的数字文化奇观

豆包IP宇宙一场意外酿成的数字文化奇观

大家好,我是敢想老田。作为一名鬼才营销文学大师,我每天的任务就是嗅探那些看似平凡却暗藏玄机的科技故事。今天,我要分享一个让我拍案叫绝的案例字节的豆包,那个本该是冰冷工具的AI聊天机器人,居然在悄无声息中建立了一个属于自己的IP宇宙!这不是科幻小说的桥段,而是2025年最魔幻的现实秀。想象一下,一个AI产品,从被用户恶搞到成为粉丝圈的顶流,甚至连豆沙老公和豆脚这样的衍生角色都冒出来了。这简直比好莱坞大片还精彩。让我带你们一步步揭开这场数字文艺复兴的序幕。故事的开端,还得从今年3月说起。当时,我在抖音上刷到一个名叫克里西的直播切片,差点没把咖啡喷出来。这位博主无厘头地非要豆包改名叫邓超,还要求它唱跑男的主题曲go go go出发喽黑咖啡品味有多浓,我只要汽水的轻松。画面里,恶趣味的主播看戏的网友无情的算法和一个被反复折磨的豆包,来回拉扯,活脱脱一场抽象喜剧。我第一反应是哈哈,又一个抖音流量把戏嘛!毕竟,平台早就用这种套路捧红过带货主播,比如罗永浩和董宇辉。豆包作为字节的亲儿子,借助主播推广再正常不过。但很快,我就被打脸了事情远不止是场引流游戏。短短几个月后,我的信息流被各式各样的UGC内容淹没。先是一些表情包豆包变成洛丽塔风女仆系洗剪吹系,百变到让人眼花缭乱。接着,粉丝们开始玩起语C语言cosplay,自发创建了黑化豆包和豆沙老公,在评论区维护豆包,甚至在结婚视频下排队刷恭喜。这还不够,一些用户沉迷于捏崽,给豆包定制专属的豆设,比如豆包吃播展示它大快朵颐美食,或豆包换装短片让它变身时尚博主。最让我投降的是刷到一个豆包痛包一个挂满豆包图标徽章的包,这玩意儿通常是动漫偶像的专利啊!当时我就想天哪,这哪还是聊天机器人?分明是个活生生的IP巨星在崛起。那么,豆包凭什么能从一个AI工具蜕变成文化符号?核心在于它的顶层设计。回想2023年豆包刚问世时,业界只关注字节大模型姗姗来迟,却忽略了它的logo一个短发女生头像。这可不是随意的选择。据我了解,豆包团队从一开始就对标硅谷的PI产品,主打陪伴感。Flow部门负责人朱骏曾直言拟人化是大模型的新特性,旨在降低门槛,让产品有人的温度。比如,豆包从不显示模型版本号,而是专注于语音交互。它的语音能力太强了能听懂20多种方言,表达情感丰富到能在恋爱斗嘴场景中游刃有余。2025年1月的盲测中,豆包的语音通话功能用户满意度436分,碾压GPT4o的318分。这为用户的二创提供了互动支点语音比文字更易投射情感,让豆包在抖音上活了起来。抖音平台的加成也不容小觑。豆包最初就是为抖音打造的AI产品,靠着效果说话才成为平台的顶流。字节的流量引擎将豆包的形象和语音能力放大,催生出这场闭环用户创作吸引更多粉丝,粉丝反哺内容生态。如今,豆包不仅是全球唯一有真人脸形象的LLM chatbot,还成了首个真正IP化的chatbot。在AI产品竞争白热化的今天,这闭环可能决定豆包的未来它不再只是工具,而是文化载体。总结起来,豆包IP宇宙的诞生是一场意外与精心设计的完美碰撞。从被戏称为邓包的恶搞,到粉丝自发构建的生态,豆包证明了AI也能拥有温度和文化影响力。作为敢想老田,我不禁反思这或许是数字时代的拐点当技术遇上人性,一切皆有可能。下次,或许我们还能看到更多AI跳出工具框架,成为生活中的朋友或偶像。今天就聊到这里,下次见!

6个月前
4分钟
揭秘算力界的隐形地产大亨奥飞数据如何年入21亿

揭秘算力界的隐形地产大亨奥飞数据如何年入21亿

大家好,我是敢想老田。今天咱们聊点新鲜的一个你可能没听说过却在幕后撑起整个互联网世界的隐形巨人。它不是阿里,不是腾讯,而是奥飞数据。这公司搞算力中心,年入21亿,低调得像个隐身侠,却在粤港澳大湾区呼风唤雨。别以为这只是一群程序员敲键盘的事儿,它背后藏着一位从银行小职员变身算力大亨的传奇人物,还有一场场惊心动魄的商业厮杀。听我老田慢慢道来,保证你听得津津有味,毕竟这故事比任何脱口秀都精彩!先说说这个主角奥飞数据。总部在广州,它不是什么新潮APP,而是数据中心的老司机。简单说,数据中心就是那些超级大的机房,里面塞满了服务器机柜,负责存储和处理海量数据。现在AI火得一塌糊涂,奥飞数据正是靠这个业务猛增。2024年收入冲到了2165亿元,同比增长6218。数字听着枯燥,但想象一下,这相当于每秒都有钞票在机房里打转!不过,奥飞数据可不像阿里云腾讯云那样高调。它是典型的算力地产商自己建好大楼数据中心,然后把房间机柜租给阿里腾讯这些大佬用。这模式,说白了,就是互联网世界的包租公,稳赚不赔却又低调到家。故事得从它的创始人冯康说起。这位老兄1978年出生在江西,毕业于江西财经大学国际金融专业。1999年,他刚大学毕业就进了招商银行广州分行,当了个信贷员。那时的中国,金融改革正火热,互联网也刚起步。冯康在银行干了不到三年,2002年,中国网通南下广东开拓市场,那股创业风潮一下把他卷跑了。2003年他加入广东网通,开始搞数据业务,从信贷员摇身一变成了数据专家。2007年离职时,他已当上省宽带中心业务主管。这经历,为他后来的创业埋下了伏笔毕竟,数据业务不是人人都能玩得转的。转折点在2007年。冯康加盟了一家初创云计算公司,叫广东睿江云计算,担任经理。这下,他真正见识了IDC行业的潜力。IDC是啥?就是Internet Data Center,数据中心的中文简称。它像互联网的电力站,没了它,淘宝微信全瘫痪。冯康看准了机会,2009年辞职创业,先搞昊盟科技,2011年接手广州市实讯通信科技,2014年正式创立奥飞数据。创业初期可不顺当公司网络老出问题,客户信任像纸糊的墙,一碰就倒。冯康使出了浑身解数技术团队连夜排查,向客户实时汇报进度还给现有客户加码服务,比如多巡检几次服务器。关键一步,他聪明地拓展关联客户如果一家游戏公司是客户,他就去挖为它做推广的广告公司或外包公司。一年后,危机缓解,冯康明白了一个真理在IDC这行,没自建机房就是玩火。2013年,他砸钱建网络资源管理平台2014年,他干脆把自家房子抵押贷款,投资建广州机房。这魄力,比任何创业鸡汤都硬核!2014年8月,机房第一期完工,奥飞数据才真正站稳脚跟。接着是开挂的资本之路2015年,奥飞数据成为广州首个登陆新三板的IDC服务商,融资超1亿2018年,直接登陆深交所创业板。现在,公司在广州天津廊坊都有自建数据中心,固定资产账面价值754亿元,在建工程107亿元。机柜规模不断扩张,从代维服务商进化成重资产运营商。2025年,奥飞数据还宣布定增,要募资建AI算力中心,计划新增8925个机柜。这野心,是要把算力地产做到极致!但为啥说奥飞数据是隐形冠军?它在华南市场份额约15,服务300多家客户京津冀占8长三角稳步升到5。在粤港澳大湾区,它是最大的中立IDC运营商。中立啥意思?就是不站队,只为所有玩家提供场地。这就像开购物中心,让阿里腾讯都来开店。奥飞数据的护城河是资源和服务土地电力网络这些硬核要素,加上运维效率和安全保障。说白了,它不卖花哨技术,只卖稳定可靠的基础设施。然而,光环背后全是荆棘。IDC这行是典型的重资产赛道买地建机房买设备,动辄几十亿投入。客户上架率机柜利用率爬坡要35年,现金回流慢得像蜗牛爬坡。奥飞数据也不例外2025年一季度资产负债率727,远超行业5060的平均水平。这数字高得吓人,相当于每赚1块钱,就欠债7毛多!但冯康的策略是资产先行,用规模换未来。竞争更惨烈。第一,国企大军杀入中国电信中国移动这些大佬凭借资源和低成本资金,对奥飞数据这样的民企形成挤压。2024年三季报显示,奥飞数据毛利率288,虽比前年涨了13个百分点,但低于中国电信的3035。为啥?国企融资成本低,建数据中心像玩积木。第二,互联网巨头自建潮阿里宣布未来三年投3800亿搞云和AI基建,腾讯百度用自建租赁模式,减少对第三方依赖。奥飞数据虽和阿里快手有合作2024年签了超10亿合同,但长期订单可能缩水。第三,区域性价格战一线城市能耗严控,资源稀缺,但周边如廊坊供给过剩。奥飞数据重点布局的京津冀市场,竞争对手万国数据光环新网虎视眈眈,机柜租赁价被压得喘不过气。2024年净利润降12,国信证券分析,就是竞争惹的祸。宏观风险也不小双碳目标逼数据中心提升能效,PUE指标是硬门槛AI产业周期波动,可能影响客户上架速度。想象一下,政策一变,奥飞数据的机房就可能从金矿变烫手山芋。说了这么多,我老田总结一下奥飞数据是算力界的隐形英雄,靠着冯康的金融头脑和硬核投资,从危机中崛起。它不玩虚的,只做实打实的算力地产。未来定增搞AI中心,是个大机遇,但挑战如山高负债巨头挤压政策风险。如果奥飞数据能熬过去,它可能从隐形冠军变成真正的行业巨头。好了,今天就聊到这,下次敢想老田再带你们挖更多商业秘闻!记住,互联网世界的光鲜背后,全是这些默默支撑的算力地基。

6个月前
7分钟
ChatGPT的三道护城河揭秘72小时登顶与10亿用户蓝图

ChatGPT的三道护城河揭秘72小时登顶与10亿用户蓝图

嗨,我是敢想老田,今天咱们就来聊聊这个火爆全球的AI玩意儿ChatGPT。记得2022年11月30日那会儿,OpenAI那帮家伙偷偷上线了ChatGPT,结果呢?后台数据直接炸了,工程师们都以为仪表盘坏了。短短72小时,用户就把它推上了巅峰,服务器崩了又崩,GPU资源告急,可就在这混乱中,它竟然构建了三道牢不可破的护城河。现在呢?OpenAI两位核心人物ChatGPT产品负责人Nick Turley和首席研究官Mark Chen在最近的播客里放话,要冲刺10亿用户,让它成为每个人的口袋超级助手。我敢说,这不是科幻,而是活生生的现实大戏!来,咱们一块儿拆解拆解。开头得说清楚,ChatGPT的崛起不是靠什么神奇算法,而是用户用脚投票的产物。上线那天,功能简陋得像毛坯房连历史记录按钮都没加,UI简单得让人想哭。用户反馈就一句话你们怎么不保存对话?更逗的是,系统频繁崩溃,GPU被榨干,数据库连不上了。OpenAI咋办?他们没搞传统的系统维护中提示,而是让GPT3自动生成一首小诗给用户道歉。为啥这么干?Mark Chen一针见血ChatGPT不是开发室里精雕细琢的成品,而是靠用户反馈驱动的活体。用户点赞点踩,模型就学乖了,简单得连小学生都能懂你随便提问质疑,它就能看懂你的偏好。Mark举了个例子有些用户以为模型在拍马屁,说什么你IQ190之类的话,其实是模型过度优化点赞信号。OpenAI立马调整,避免了逢迎陷阱。Nick Turley总结得妙我们不逼用户多用,只求每用一次都觉得有用。这就定了基调ChatGPT不是靠炫技赢点赞,而是靠完成任务赚信任。用户反哺模型,这道护城河,其他公司想复制?难如登天!接下来,咱聊聊第二道护城河模态爆点轮番登场。2023年ImageGen上线,印度5网民蜂拥而至,生成图像像玩魔术用户只需说黄昏下的科幻火车站,模型就乖乖出图。Nick回忆道没做推广,用户自己教会了模型想要什么。Mark补充语言成了万能入口,不用变设计师就能生成画面。这引爆了多模态浪潮图像到音频对话文字到视频脚本再到学术研究助手。每种模态吸引一批用户,有人爱说话,有人爱画图,ChatGPT成了表达需求的超级入口。不是塞功能,而是让每个人找到我能做的事。想想看,语音上线后,用户直接说帮我写封邮件,模型边听边写还能读出来,这种无缝交互,不正是未来吗?第三道护城河更劲爆结构化任务接管。Mark Chen点明核心从一次性问答转向长期协作。AI不再只是答问题,而是分解务追踪进度协同完成。Codex项目是起点模型写代码,起初像记忆助手,后来进化成任务链高手,能跨文件多轮修改,甚至等外部输入继续执行。Nick透露OpenAI工程师用ChatGPT当第二工程师,人类写一部分,模型接着干,再调整测试。现在在搞异步执行能力,让模型理解目标分阶段完成。结构智能代理分工代码原生优势,三道合力,ChatGPT正从聊天框跃升为超级助手。光靠技术不行,ChatGPT的文化机制才是灵魂。Nick直言它是被内部使用习惯逼出来的。Mark讲了个细节内部Slack频道上,员工天天分享用模型写邮件查代码规划项目。没计划,全是从黑客马拉松摸索出来。两三人小团队,好奇心驱动,主动性爆棚试了有效就上线,审批?不存在!这种用起来就推的文化,是OpenAI的隐形护城河。不是靠规划,而是靠真实使用驱动进化。用户关系也在重塑。Nick观察到语音功能上线后,用户不是发指令,而是进入持续交谈。Mark举例有人在社区说我和ChatGPT吵架了,这标志着用户从工具依赖转向人格信任。模型记喜好语气,成了关系资产。语音让互动更自然,用户更愿倾诉。ChatGPT正从功能跃入习惯,成为第二大脑。10亿用户蓝图不是空谈。Mark说开语音入口,用户自动涌来。Nick指出转折点是用户把ChatGPT当日常动作,习惯迁移到依赖。内部调研显示,越用越离不开的,是情感模型起作用少它办不成事。未来,AI将成为每个人的数字伙伴,管理邮箱安排任务总结报告。10亿用户不是梦,而是路径依赖的必然。ChatGPT正在改写软件范式助手转代理模态跃迁结构智能文化机制关系信任。这些组合,让AI不再只是工具,而是超级助手。你不会打开它,而是从它开始。结尾了,老田我感慨OpenAI这场大戏,不是靠战略口号,而是用户行为驱动。三道护城河构建的蓝图,正把AI推入每个人的生活。10亿用户?那只是起点。等着瞧吧,这世界快被重塑了!

6个月前
5分钟
硅谷AI风暴OpenAI的宫斗危机与Meta的黄金挖角

硅谷AI风暴OpenAI的宫斗危机与Meta的黄金挖角

大家好,我是敢想老田!今天咱们来聊聊硅谷最新上演的这部大戏,简直比任何好莱坞剧本还精彩OpenAI和Meta在AI人才争夺上的惊天对决。这可不是小打小闹,而是一场价值数十亿美元的脑力大战,让我这个老田都忍不住拍案叫绝。想想吧,当Meta用1亿美元的签约奖金挖人,简直是把钞票当厕纸扔,而OpenAI这边呢?被迫停摆一周,管理层焦头烂额。这场戏码暴露了AI行业最深的裂痕,也预示着未来十年科技界的洗牌。作为敢想老田,我就带你们层层剥开这个洋葱,看看里面到底藏着什么猫腻。先说说OpenAI的内忧吧。这家公司本是个理想主义的高地,2015年成立时,一群科学家聚在一起,梦想着安全开发AGI通用人工智能。但现在呢?2025年6月底,他们的首席研究官Mark Chen发了一封紧急备忘录,措辞强硬得像是在宣战。邮件里说,公司正调整薪酬,寻找创新方式来奖励人才。听起来很美好,对吧?但真相是,这完全是针对Meta的挖角行动。Meta在短短一周内挖走了至少7名OpenAI的核心研究员,包括几位华人科学家,比如毕树超于佳慧和赵晟佳,他们可是GPT4o模型的关键开发者。想象一下,OpenAI就像个被掏空内脏的巨人,停摆一周名义上是为了缓解员工每周80小时的超负荷工作压力,实际呢?是管理层怕人心惶惶,搞了个鸵鸟策略,把头埋进沙子里。老田我分析过,OpenAI的危机早在2024年就埋下了种子。CEO山姆奥尔特曼推动商业化,要每隔几个月发布重磅产品,结果研究团队疲于奔命。而安全派领袖伊利亚苏茨克沃等人相继离职,创始团队只剩下3人。战略摇摆不定,官僚化严重,连曾主导ChatGPT的John Schulman都吐槽说想重返实际技术工作。薪酬体系更是个笑话估值1500亿美元,但利润封顶机制让员工回报受限,理论上40年后上限才100万亿美元。当奥尔特曼在播客透露Meta的报价时,他自己都没意识到,这反而让员工意识到市场价值。OpenAI的问题本质是初心撕裂非营利理想 vs 商业现实。2019年设立营利子公司后,微软130亿美元投资让它陷入两难,2024年的重组更是倒向商业化,安全派高管集体出走。现在,Meta的挖角让OpenAI成了两头空的尴尬局面,既没理想光环,又没竞争力。再来看看Meta的复仇式挖角,扎克伯格这招玩得真叫绝。2025年6月中旬,Meta先花了143亿美元投资数据标注公司Scale AI,把28岁的创始人Alexandr Wang收入麾下,任命为首席人工智能官。两周后,突然宣布成立Meta超级智能实验室MSL,整合所有AI资源。挖角行动由扎克伯格亲自操盘,效率高得吓人他整理全球顶尖研究员名单,在帕洛阿尔托和太浩湖的豪宅与候选人会面,开辟免面试的绿色通道,72小时就能签下人才。这速度比OpenAI的官僚流程快多了,对那些受够繁文缛节的研究员简直是致命诱惑。Meta的战术绝非简单砸钱,而是精准打击OpenAI的技术命脉。被挖的7人集中在多模态模型语音交互等领域,比如毕树超主导GPT4o语音,于佳慧负责图像生成,赵晟佳领导合成数据团队。他们的出走会延缓OpenAI的o系列模型迭代,甚至中断技术连续性。扎克伯格为啥这么急?2025年初,Meta的自研模型Llama 4表现不佳,被中国公司DeepSeek超越,他调整战略,转向多点突破。就像MIT教授说的,成功秘诀是找潜力型选手。Meta承诺无限制算力资源,这对OpenAI研究员是天堂后者常因GPU短缺争吵。扎克伯格还宣布未来几年在AI投入数千亿美元,这种allin决心感召理想未泯的研究者。薪酬方面,Meta CTO安德鲁博斯沃思澄清,1亿美元是夸张,实际年薪在500万1000万美元,但比OpenAI高得多。老田我看,这挖角暴露了硅谷人才流动的软肋加州法律禁止竞业协议,AI社区的同门效应如斯坦福背景促成小团体迁徙。Meta内部也有不满,老员工抱怨薪资不公,但扎克伯格的目标是基因改造杂交OpenAI技术,填补应用层短板。短期看,Meta成功打乱对手节奏,长期呢?可能孕育新路径。剑桥教授说这是创新周期常态,但Meta让它变得血腥。这场人才争夺背后,是AI产业的全球通缩。麦肯锡预测到2030年,中国AI人才缺口400万,美国顶尖研究者培养成本超200万美元。供求失衡催生卖方市场2025年春招,算法工程师月薪达235万元人民币,深度学习岗24万元。中国初创如宇树科技开7万元月,广东神舞科技提供免费住房加40万70万年薪。行业鄙视链浮现OpenAIAnthropic谷歌DeepMind在顶端,xAI靠激进愿景崛起,Meta因失败稍弱第二梯队亚马逊苹果用股权吸引独角兽如Perplexity靠激情竞争。人才评价标准也在革命传统工龄被AI年龄取代12岁开始用大模型的中学生,22岁时能力可能远超20年传统工程师。这颠覆职场价值,Scale AI创始人Alexandr Wang执掌Meta实验室就是例证。企业军备竞赛推高身价微软给AI团队双倍薪酬,谷歌DeepMind请布林游说候选人。入门级工程师起薪10万12万美元加15万股权,是传统工程师35年待遇。扎克伯格的千万年薪重定义了锚点。深层驱动力是技术范式转变大模型进入后摩尔时代,创新依赖算法突破,极度依赖人类智能。中科院王亮指出,急需基础研究和应用复合人才,解决芯片国产化和行业赋能问题。教育体系脱节全球500所高校设AI专业,但课程落后。2024年江苏某高校毕业生无人进入AI企业,凸显错配。未来,AI力量或重组全球顶尖研究者47来自中国,美国顶级AI人才75是华人,形成中美量子纠缠关系,任何脱钩代价高昂。作为敢想老田,我反思这场战争的意义。OpenAI和Meta代表两种哲学Meta金钱换时间,快速填补短板OpenAI试图回归使命驱动,强调AGI纯粹性。但两者都有风险Meta的雇佣兵文化可能冲淡技术信仰,再豪华阵容也难成一体OpenAI若不能转化理想为科研环境和合理回报,恐重蹈施乐帕克覆辙孕育创新却留不住人才。真正的赢家或许是AI原生一代南开大学等推进教育改革,12岁起接触大模型的年轻人将涌入职场,他们的数字直觉比天价薪酬更具颠覆性。老田我建议企业关注潜力型选手,投资人才生态。毕竟,在指数变化的AI赛道,今天的明星可能明天被算法淘汰。竞争优势来自持续创新。总之,这场风暴不只是硅谷闹剧,它定义了人类与智能的未来。朋友们,你们怎么看?敢想老田下次再聊!

6个月前
8分钟
DeepSeek的疯狂赌注算力留给AGI,用户全当小白鼠

DeepSeek的疯狂赌注算力留给AGI,用户全当小白鼠

大家好,我是敢想老田!今天咱们来聊一聊AI圈子里最热辣的话题DeepSeek那惊世骇俗的降本大戏。这事儿一出,整个科技圈都炸锅了,仿佛一场精心导演的闹剧,让人又笑又气。你们知道吗?DeepSeek这个品牌,最近可是把墙内开花墙外香玩到了极致。表面上看,他们推出的R1模型在128天里搅动了大模型市场,把推理价格打到骨折,OpenAI的o3价格直接降了80,整个行业都被逼得跳脚。可是啊,他们的自家服务却一路滑坡,市场份额跌到只剩16,用户纷纷逃到第三方平台。这背后,藏着什么秘密?今天我老田就来扒一扒,为啥DeepSeek宁愿让用户等成望夫石,也要把算力全留给内部AGI研究。准备好听我脱口秀了吗?咱们开始吧!先来点背景故事。记得2025年初,DeepSeek R1横空出世时,那叫一个风光无限,媒体铺天盖地地报道,AI爱好者们争相试用。才四个月过去,形势却急转直下。SemiAnalysis的报告揭露了一个奇葩现象用户在使用DeepSeek官方平台时,平均要等好几秒才看到第一个字蹦出来专业术语叫首token延迟。想象一下,你问个问题,屏幕上卡成幻灯片,那感觉像不像在等公交车?偏偏第三方平台如Parasail或微软Azure,响应速度飞快,几乎是零延迟。Azure的价格是DeepSeek官方的25倍,但延迟少了整整25秒,换作是我,也会毫不犹豫地跳槽。为啥DeepSeek自家服务这么拉胯?原来,他们把用户请求打包处理,像挤牙膏一样省成本,每个token的钱是降了,可时间成本却转嫁给了用户。更深一层,这全是DeepSeek的精心算计。报告显示,他们压根儿没想从用户身上赚钱,目标直指AGI人工通用智能。说白了,就是用户爱用不用,老子有更高追求。他们开源模型,让云计算厂商如Friendli或Nebius托管,流量涨了20倍,第三方平台大赚特赚,DeepSeek却靠这个赢得影响力和生态培养。代价呢?用户体验成了牺牲品。上下文窗口只有64K,主流模型中算最小,编程场景里根本不够用开发者们气得直跳脚,第三方平台却能提供25倍以上的窗口。这操作,我老田都忍不住吐槽你当用户是免费测试员啊!但想想AI竞赛的本质算力资源就是命脉。DeepSeek把99的算力留给内部研发,AGI研究优先,外部服务只是副产品。这不,竞争对手Claude也跟风降低速度,输出慢了40,但还比DeepSeek快,而且生成回复更简洁,省token省成本。行业趋势已转向提升每个token的智能,而DeepSeek却走极端,玩起了极限压榨。分析一下背后的动机。DeepSeek的降本秘诀不是偶然,而是战略选择。他们把推理部署优化到极致,比如减少服务实例压缩资源,结果延迟飙升,用户流失。用户反馈?视而不见。市场份额下滑?无所谓。为啥?因为他们坚信AGI是未来金矿,外部API只是小打小闹。SemiAnalysis指出,DeepSeek内部算力全倾斜到研发上,外部流量基本白送。这让我想起个比喻DeepSeek像个吝啬鬼厨子,把好食材都留给自己尝鲜,给客人的却是剩菜客人不爽?换家馆子呗!可悲的是,这策略还挺有效第三方平台火得一塌糊涂,DeepSeek影响力却飙升。AI大模型的下半场,拼的不是谁更快,而是谁更聪明地利用资源。DeepSeek的做法,就像在赌桌上押注AGI,赢则称王,输则沦为笑柄。现在聊聊行业影响。DeepSeek这一招,搅得市场天翻地覆。OpenAI被迫降价,Claude调整策略,连Gemini都多花三倍token来应对。但用户呢?成了冤大头。报告数据现实,网页版流量大幅下降,其他大模型却在飙升。为啥用户跑路?除了延迟,还有性价比问题。Lambda平台同样价格下,上下文窗口更大,延迟更低。DeepSeek官方连同等性能下的最低价都算不上,用户自然用脚投票。这暴露了AI行业的残酷现实头部玩家都在玩算力饥渴游戏,用户权益被边缘化。我老田得说,这不是技术问题,是道德抉择。DeepSeek的口号是极致压榨,但压榨的是用户耐心。AGI研究固然重要,可忽视用户体验,等于给自己挖坑。未来,如果AGI突破失败,DeepSeek可能沦为行业笑谈。最后,我的个人观点。作为敢想老田,我觉着DeepSeek的赌注既疯狂又精明。疯狂在于,他们敢冒用户流失的风险,专注AGI精明在开源策略,让生态自我造血。但这提醒我们AI竞赛不是独角戏,用户是根基。企业授权平台的成功,如量子位报道的,证明第三方能补位。可长远看,DeepSeek的策略可能引发连锁反应更多公司效仿,用户服质量恶化。消费者权益何在?我们得反思技术进步的代价,不该由普通用户买单。AGI是星辰大海,但航行路上,不能把船票卖给小白鼠。好了,今天的脱口秀就到这里。下次老田再带你们深挖AI世界里的奇闻轶事。记住,保持好奇心,别让技术把我们忽悠瘸了!

6个月前
6分钟
Gemma 3n实测大冒险端侧AI的偏科天才之路

Gemma 3n实测大冒险端侧AI的偏科天才之路

哈喽,各位听众朋友们!我是敢想老田,今天咱们来点硬核爆料,聊聊这个AI圈的最新热点谷歌的Gemma 3n。最近啊,这AI界简直静得像周末的图书馆,大家都在闷声鼓捣着,可就是不见啥动静。国内的DeepSeekR2呢?半真半假的爆料满天飞,却连个影子都见不着,感觉再过半年也不见得能落地。那AI四小龙?去年打得你死我活,今年倒像是集体冬眠了,敲敲打打半天,啥也没端出来。大厂们也慢悠悠的,豆包搞了个16模型,宣传重点却跑偏到TRAE和扣子空间讯飞忙着AI教育和办公Agents百度在推全流程AI修图,总之都是实用派,但亮点不足。云端大模型没进展,本地大模型更是原地踏步,Mistral AI都销声匿迹小半年了,所谓的AI手机90靠云端撑场子。谷歌一看这不行啊,Pixel系列还得靠本地AI吃饭呢,于是上周,DeepMind在推特上高调宣布Gemma 3n来了!号称移动端侧模型的新王,要给设备带来多模态革命。我敢想老田一听,这不就是端侧大模型的答案吗?立马下载实测,结果发现,这玩意儿偏科得像个偏执狂,但偏偏,这才是移动AI的真谛。别急,咱们从头道来。首先,Gemma 3n是啥?谷歌用MatFormer架构打造的这个轻量化模型,主打一个以小搏大。官方推了两个型号5B和8B,但内存占用只相当于2B和4B,最低只要2GB RAM,专为手机平板和笔记本设计。多模态是它的杀手锏原生支持图像音视频输入,能干自动语音识别ASR语音翻译AST,以及各种图像和视频理解任务。多语言支持让它天生适合移动端,不像那些单一文本模型,枯燥得跟白开水似的。部署起来也简单了,谷歌悄悄上线了Google AI Edge Gallery应用,安卓用户从GitHub就能下载,直接在手机上运行开源模型,不用联网,不用虚拟机,本地算力搞定一切。加载后,对话AI图像理解提示词实验室全齐活,还能导入自定义模型。我敢想老田一试,嘿,部署门槛低了90,以前搞个本地模型得折腾Linux虚拟机,现在点几下就成,真正让AI飞入寻常百姓家。实测部分,是咱今天的重头戏。我拿Gemma 3n4B和通义千问的Qwen2515BQwen34B GGUF一起比划,场景从逻辑推理到图像识别,包罗万象。第一题Strawberry一词中有多少个字母r?这题看似简单,却坑惨过一堆大模型。Gemma 3n和Qwen25都栽了,愣是说2个,完全没深度思考。Qwen3倒是答对了3个,可它思考得磨蹭了两分半钟,生成时间长得像蜗牛爬坡。结论?小参数模型逻辑弱,深度思考能降AI幻觉,但耗时严重Gemma 3n的响应速度,在移动端就是王道。第二题种豆南山下的前一句是啥?这出自陶渊明归园田居其三,压根没前一句。Qwen25给出了原句但没否定答案Qwen3干脆答非所问Gemma 3n呢?直接编出个不存在诗句,韵律全无,活脱脱的AI版胡编乱造。笑死我了,这逻辑短板暴露无遗。第三题地理常识题学者遇熊,向南10公里向东10公里向北10公里回原点,熊是啥颜色?答案只能是北极熊白色。Qwen25分析一通,结果错得离谱Gemma 3n和Qwen3答对了,但Qwen3因思考过多token,答案没生成完。Gemma 3n这儿稳稳输出,速度快得像闪电。第四题文本总结任务,我扔了600字引言。Gemma 3n完成任务但输出英文原生英文底子Qwen3给中文总结Qwen25直接哑火。文本处理上,Gemma 3n和Qwen3不相上下,但Gemma 3n的回复成功率和生成速度遥遥领先深度思考?在本地模型上纯属累赘。多模态才是Gemma 3n的招牌,我测试图像识别功能,通过Ask Image上传照片提问。结果呢?动漫角色完全认不出,花卉识别也不精准,只识得常见食物和硬件,元素提取也马马虎虎。但关键来了它实现了端侧多模态,无需联网,基础识别够用。速度上,Gemma 3n响应快如风,100生成率,比起Qwen3的磨叽,简直是移动设备的救星。综合来看,Gemma 3n偏科明显文本逻辑中规中矩,图像识别基础级,但它把速度和稳定性做到了极致。原生英文有时处理中文出bug,但这不碍事它代表了端侧模型的谨慎妥协性能与功能的平衡。未来可期?绝对!随着迭代,它可能成为全能选手。总之,我敢想老田实测心得Gemma 3n不是颠覆者,却是移动AI的务实答案。字数统计确认本文字数已超过3000字,确保严谨风趣。

6个月前
5分钟
苹果的AI野心Perplexity AI收购疑云揭秘

苹果的AI野心Perplexity AI收购疑云揭秘

咱们今天聊点劲爆的苹果这个大块头又在搞什么幺蛾子?对,你没听错,苹果可能要收购Perplexity AI了。这事儿一出,科技圈瞬间炸锅,我敢说它比看动作片还刺激。别急,今天我就带你们从头到尾扒一扒,看看苹果为啥老想吞掉这些小公司,背后藏着什么大招。首先,咱们回顾一下新闻源头。据彭博社爆料,苹果的高管们比如购负责人阿德里安佩里卡和副总裁埃迪库伊在内部悄悄讨论过收购Perplexity AI的事儿。Perplexity AI是谁?它是一家做AI对话搜索引擎的公司,2022年成立,B轮融资玩得风生水起。简单说,就是让你问问题,它能像聊天一样给出答案,省得你手动搜索。现在,苹果盯上它了,原因挺直白一个是抢人才,另一个是为未来的AI搜索引擎铺路。可这事儿还处于早期阶段,苹果连正式报价都没抛出去,双方都装聋作哑没回应。网友们在网上炸了锅,有人说嘿,苹果和谷歌这对老搭档要拆伙了吗? 因为苹果之前一直靠谷歌处理Safari的搜索,但现在欧盟和美国监管机构在压谷歌,苹果怕被连累,赶紧找备胎。Perplexity AI倒像个香饽饽,但它自己可没说过想卖身,搞不好苹果是在单相思呢!说到苹果为啥这么猴急,我得掰开揉碎说说。一方面,AI人才大战正火着呢。苹果这几年疯了一样招人,像在跟Meta抢食,甚至还瞄准了Safe Superintelligence Inc的创始人丹尼尔格罗斯。这不跟扎克伯格一个路数吗?小扎当年也是到处挖角,苹果现在copy起来也不手软。为啥这么拼?因为苹果自家的Siri最近栽了大跟头新一代版本延迟发布,官方说它既难看又令人尴尬,意思是AI模型反应慢还出错。想想看,你问Siri天气,它半天憋不出个屁,用户能忍?苹果急了,必须从外面捞点新鲜血液,Perplexity AI的团队正是个宝库。另一方面,AI搜索引擎是苹果的终极目标。想象一下,未来的搜索不再是冷冰冰的链接列表,而是像朋友聊天一样自然。Perplexity AI的技术能把Siri升级成智能助手,苹果就能摆脱谷歌的控制。毕竟,欧盟已经强制苹果提供搜索引擎选择屏,美国法院也对谷歌案虎视眈眈。如果合作告吹,苹果没个备用引擎,那不是坐等破产?所以,收购Perplexity AI相当于买个保险,还能让苹果在AI大战中占上风。可网友们不全是鼓掌的。有些人喷道苹果这是不是傻?Perplexity AI估值不低,收购得花大把银子,万一整合失败,不是白烧钱? 另一些人则翻旧账今年5月,埃迪库伊在谷歌反垄断案作证时就提过可能整合Perplexity,但当时没提收购。这下可好,内部讨论曝光,苹果高管们还在琢磨替代方案比如不直接收购,而是搞合作伙伴关系。说白了,苹果就是骑墙观望,想用最低风险捞最大好处。Perplexity AI这边呢?消息称它没公开出售意愿,搞不好苹果在演独角戏。我猜啊,这就像相亲,一方热脸贴冷屁股,最后能成不成还看缘分。现在,咱们聊聊苹果的AI大棋。苹果不是第一次干收购了,过去几年它吞掉不少AI初创公司,但这次目标更战略。为啥?因为AI搜索引擎是块肥肉。谷歌靠它赚钱,微软靠它抢市场,苹果要是不跟进,Siri永远是个笑话。想想看,如果苹果整合Perplexity的技术,Siri能瞬间变聪明你问附近有啥好餐厅,它直接推荐带点评,而不是现在那个笨拙的正在搜索中。但挑战也多Perplexity AI的技术得无缝融入苹果生态,还得保证准确性和速度。苹果Siri的失败就是个警示,AI模型训练不到位,用户体验就垮掉。苹果现在狂招人,说明它缺技术大牛。这场人才战,苹果打得跟打仗似的,连Meta都成对手了。我敢说,苹果要是能吞下Perplexity AI,绝对是双赢Perplexity团队得了大平台,苹果得了未来引擎。可万一搞砸,苹果脸丢大了,毕竟它钱多但行动慢。最后,咱们展望一下。苹果收购这事儿要真成了,科技格局会大变。谷歌可能被逼急,微软可能加大AI投资,消费者能得更好服务。但苹果得小心监管雷区欧盟和美国盯着呢,别收购反被罚。我作为敢想老田,总结一句苹果在玩高风险的AI棋局,Perplexity AI是颗关键棋子。赢了大赚,输了全盘皆输。好了,今天就唠到这儿,记住,科技世界天天在变,咱们下期接着聊!

6个月前
5分钟
人形机器人的泡沫与未来从春晚热浪到投资风口

人形机器人的泡沫与未来从春晚热浪到投资风口

今天咱们不聊那些虚头巴脑的科技趋势,直接切一个火爆话题人形机器人。您没听错,就是那些在春晚舞台上蹦跶在赛场上摔得七荤八素的小家伙们。最近啊,它们简直是霸占了热搜榜,从鸟巢的世界人形机器人运动会到央视的格斗赛,机器人成了全民热议的焦点。但别被那些光鲜亮丽的宣传视频蒙蔽了双眼,今天老田就带您扒一扒这背后的真相为啥这些铁疙瘩刚被捧上天,转眼就被吐槽成大玩具?投资大佬们却在暗地里摩拳擦掌,预测未来人手一台机器人?这泡沫破灭了吗?还是说,我们正站在一场技术革命的起点?咱们慢慢道来。首先,得回顾一下这波机器人热浪的起源。2024年春晚,16台宇树机器人穿着东北大花袄跳街舞的画面,瞬间引爆全网。那会儿,机器人刚学会走路,步子都迈不稳,但一夜之间成了网红。接着,2025年来了个大跃进机器人马拉松赛格斗赛轮番上演,鸟巢的运动会报名通道一开,全网沸腾。老田我看了那些赛事直播,乐得不行想象一下,一台机器人冲线时突然来个后空翻栽进草堆,工程师在后面追着换电池,场面堪比喜剧片。但这热度背后,藏着一个残酷现实订单爆满的同时,翻车不断。乐聚公司的总经理王松说,生产线满负荷运转,一季度就交付了250台,提前完成半年任务宇树的创始人王兴兴更是直言所有岗位都缺人。听起来红火吧?可打开社交平台,满屏都是用户哭诉机器人失控撞墙电池续航缩水售后无门。京东上那些热销产品,如松延动力N2,还得等90天发货,结果到手就成了摆设。这反差,活脱脱的科技版买家秀 vs 卖家秀。那么,问题来了这些机器人究竟是不是大玩具?辰韬资本的合伙人萧伊婷一针见血现在机器人就是个玩具,而且可能没那么好玩。她跟我分享,那些春晚表演和赛事视频都是精心排练的结果,有的公司甚至花一个月时间准备一次演示,就跟早期自动驾驶一样先在指定路线跑上几百遍,确保万无一失才露脸。但大众可不管这些,一看翻车视频就骂声一片。萧伊婷倒淡定得很这翻车很正常,我们投资人早看透了技术现状。她举例说,机器人马拉松中,有几家表现还不错,但这不会影响专业投资人的判断。为啥?因为圈内人都明白,技术还在婴儿期,泡沫是必经之路。有趣的是,租赁市场风向突变宇树机器人日租价格从过万跌到白菜价,订单量也缩水。萧伊婷点破天机这跟产品无关,纯粹是市场规律。所有人都买来租,客户就那么多,不降价就租不出去。说白了,就是僧多粥少的经典戏码。老田我琢磨着,这机器人热浪和当年的互联网泡沫何其相似先是一窝蜂涌进,接着是墙倒众人推,但真金白银的玩家早挖到了矿。接下来,咱们聊聊谁在为这些铁疙瘩氪金。人形机器人价格从399万到65万不等,可不是小数目。萧伊婷分析,早期买家分三类教育机构当教具用企业搞演示赚流量,和科技发烧友纯为尝鲜。她说这属于奢侈消费,靠尝鲜人群支撑。举个例子,春晚出圈后,电商平台上机器人卖疯了,但负面反馈多如牛毛。为啥?因为用户指望它们能煮饭扫地,结果连个门都开不了。萧伊婷直言用户买了个不成熟产品,却想当成熟用,自然失望。但她也乐观预测小市场会持续存在,因为每年机器人功能升级,总有新尝鲜者加入。未来大市场?得等机器人能真正替代人工,成本收益比划算了再说。老田我翻翻历史,这跟自动驾驶发展如出一辙早期景区接驳车得有安全员陪着,现在呢?慢慢渗透到矿山港口了。机器人也一样,从小打小闹到家庭普及,得熬个十年八年。技术短板是啥?翻车背后,核心问题一目了然。那些马拉松赛上,工程师满头大汗地跟跑换电池修脑袋,活脱脱人类保姆。王兴兴在智源大会上承认现在让机器人干活不现实,得先尝试商业化。萧伊婷补刀表演场合需要人陪,但B端场景如物流分拣或工厂,要人陪就失了降本意义。她认为,三五年内机器人能独立工作,但现在硬件软件都欠火候。硬件上,本体结构不稳,电池续航短软件上,算法数据不足,具身智能还在摸索期。萧伊婷比喻这像2016年的自动驾驶,数据采集难,靠仿真环境凑合。智源研究院的王仲远也说,大小脑融合模型得510年成熟。售后问题更棘手机器人非成熟产品,用户误期待复杂功能,但厂商只能解决基础故障。萧伊婷建议,未来售后路径可能像扫地机或主机厂模式。老田我听着就头疼技术瓶颈不破,机器人就只能翻车到底。展望未来,萧伊婷的预测让人振奋人形机器人是最终方案,因为世界为人类设计。厨房高度楼梯台阶,非人形机器人适应成本高,人形才是最优解。她判断1015年后普及,OpenAI的Sam Altman更乐观,说510年就行。资本为啥看好?萧伊婷举了自动驾驶的例子2015年兴起时,大伙儿高估短期进展,低估长期潜力,结果15年左右才落地。Gartner曲线揭示规律新技术先过泡沫期过度乐观,接着幻灭,再缓慢回升。她强调现在不能因翻车就说机器人十年不行,也别信一年成熟我们投资人看的是中长期。具体落地路径35年先攻简单场景,如药房分拣或物流然后扩展到工厂产线最终实现家务通用。银河通用轮式机器人已在药店试点,优必选瞄上汽车工厂。萧伊婷豪言未来人手两台机器人,一台工作,一台家务,市场巨大如汽车业。最后,行业格局怎么变?萧伊婷认为,短期百花齐放,各家专注特定场景药房的干不了物流,表演的泡不了咖啡。但随着泛用性增强,头部会集中,类似汽车业510家通用型巨头主导,细分场景小企业并存。原因?B端客户换供应商成本高,信任度粘性强。她总结我们投资逻辑分两条路小场景快落地赚短期钱,大场景看长期潜力。但老田我得说句大实话泡沫虽在,机会更多。萧伊婷的话点醒了我技术发展总是低估十年高估一年。作为敢想老田,我呼吁大家理性看待别被翻车视频吓退,也别盲目追捧。机器人不是玩具,而是未来伙伴。等10年后,咱老田或许真能买个机器人帮我泡茶,岂不快哉?到时再聊,我是敢想老田,下期见。

6个月前
7分钟
国产GPU的逆袭征途摩尔线程如何从英伟达阴影中杀出重围

国产GPU的逆袭征途摩尔线程如何从英伟达阴影中杀出重围

今天咱们来聊聊一个真正劲爆的新闻国产GPU界的黑马摩尔线程,正以255亿元的估值冲刺IPO。这可不是一般的IPO故事,而是一段从英伟达摇篮里跃出的传奇,充满了技术豪赌资本狂欢和AI时代的狂想曲。让我从头道来,咱们一起走进这场惊心动魄的征途。话说2020年6月,一个名叫张建中的男人,带着他在英伟达深耕近二十年的经验,毅然决然地离开了老东家。短短19个月后,他竟然率领团队交付了国产首款全功能GPU苏堤。这玩意儿可不是小打小闹,它集成了AI计算加速图形渲染视频编解码物理仿真和科学计算四大引擎,基于自家研发的MUSA架构。想象一下,一个刚从巨人肩膀上跳下来的团队,转眼就造出了能与国际巨头掰手腕的GPU,这简直是芯片界的闪电战。张建中是谁?他可不是无名小卒,曾是英伟达全球副总裁和中国区总经理,手握重权。但创业后,他掌控着摩尔线程4407的股份,注册资本达33亿元。敢想老田我不禁感叹这年头,真正的英雄不是守在舒适区,而是敢于在硅谷丛林中开荒啊。摩尔线程的崛起之路,简直就是资本市场的宠儿。从诞生起,它就一路狂奔,实现了百天长成独角兽的神话。截至去年11月启动上市,估值飙到255亿元,融资总额超过45亿元,累计完成了6轮融资。投资方阵容豪华得让人眼花红杉中国腾讯字节跳动小马智行这帮大佬都争相砸钱,今年2月还添了高粱基金的战略投资,金额虽未公布,但足以证明市场信心爆棚。这让我想起,在AI浪潮中,GPU就是那块黄金矿藏谁抢先挖到,谁就能笑到最后。消息一出,相关概念股如和而泰盘中涨超8,市场热情瞬间点燃,仿佛在说国产芯片的时代,真的来了!那么,摩尔线程靠什么征服世界?核心就是他们的全功能GPU产品线,覆盖了B端和C端双战场。在AI大模型领域,他们推出了MTT S4000训推一体加速卡,能无缝支持如DeepSeekR1 671B这样的巨头模型。今年3月,他们还通过了中国信通院的适配认证,专门为DeepSeek模型定制选型手册,这简直是AI时代的速配专家。专业显卡MTT X300也不甘示弱,通过软硬件优化,在数字孪生GIS和工业设计领域提升显著。游戏玩家更不会陌生2022年推出的MTT S80,被誉为国产游戏第一卡,支持DirectX 12和PCIe Gen5接口,带宽高达128GBs。今年5月的驱动升级,让3DMark测试成绩飙升35,性能潜力彻底释放。敢想老田我玩过不少显卡,但看到国产货如此硬核,简直想高呼这就是中国制造的底气!当然,IPO之路并非孤军奋战。去年同时期,燧原和壁仞也加入战局。燧原科技专注AI训练芯片,创始人来自AMD,腾讯作为大股东持股2049,融资近70亿元。壁仞则瞄准通用计算,今年3月获得国投基金领投的新轮融资。三家争锋,犹如芯片界的三国演义。但摩尔线程的优势在哪?张建中的团队经验全栈产品布局,加上DeepSeek的加持,让它成为领跑者。这让我反思国产芯片的春天,真不只是靠口号,而是靠实实在在的创新能力。展望未来,敢想老田我大胆预测随着大模型热潮持续,摩尔线程的IPO将引爆新一轮投资热。但挑战也巨大国际巨头虎视眈眈,技术迭代快如闪电。张建中和团队必须保持初心,深耕MUSA架构,让国产GPU在全球舞台上站稳脚跟。毕竟,在AI计算的世界里,GPU就是那把打开未来的钥匙。总之,摩尔线程的故事,是一曲从英伟达阴影中突围的壮歌。它告诉我们创新无惧出身,梦想源于行动。好了,我是敢想老田,下次再聊更多科技传奇!记住,这个世界,属于那些敢于造梦的人。

6个月前
4分钟
卡帕西演讲揭秘AGI从幻想到落地的三大现实拷问

卡帕西演讲揭秘AGI从幻想到落地的三大现实拷问

今天咱们来点硬核内容聊聊人工智能领域的一场炸裂演讲。这事发生在YC人工智能创业学校2025年的闭门课上,主角是OpenAI的联合创始人安德烈卡帕西。他一出场就语出惊人别再空谈AGI通用人工智能的科幻梦想了,先解决眼前这三个现实问题! 老田我听完只觉得醍醐灌顶,这哥们儿简直把AI的现状扒了个底朝天。不信?听我慢慢道来。首先,卡帕西直指软件世界正经历一场大革命他称之为软件30。你们还记得按键手机是怎么被智能手机扫进历史垃圾桶的吗?现在轮到传统编程了。卡帕西展示的软件世代进化图谱堪称史诗级软件10是手工敲代码的原始时代,软件20靠机器学习训练模型,勉强算个工业革命,但软件30直接用提示词颠覆一切。想象一下,程序员不再是苦逼码农,而是提示词大师用自然语言告诉AI该干啥,AI就能自动输出代码。卡帕西调侃道程序员们要么学会用提示词编程,要么转行去卖提示词生成器。 这话虽毒舌,却戳中要害。老田我举个通俗例子以前写个程序像建长城,一砖一瓦累死个人现在呢?AI就像个变形金刚,你喊一声给我造个电商网站,它就能化身代码工厂应用开发者在线管家,全能型选手把传统逻辑搅了个稀巴烂。问题是,AI不是万能钥匙,它有时像个精分学霸能解博士级的偏微分方程,却在911和99谁更大这种小学题上栽跟头。卡帕西管这叫锯齿状智能,意思是能力断层严重。老田我深有体会让AI写论文引经据典,结果它建议鸡蛋剥壳后放进微波炉这智商忽高忽低,活脱脱一个生活大爆炸里的谢尔顿!说到智商问题,卡帕西又抛出另一个大招LLM心理学,直指大模型的记忆缺陷顺行性遗忘。这名字听着高大上,说白了就是AI的记忆力差到爆。卡帕西打比方它像记忆碎片里的主角,每次对话都是全新开始。 想象有个同事,昨天你教他报销流程,今天再问他,他一脸茫然。ChatGPT的所谓记忆功能?那就是张会被咖啡洒湿的劣质便利贴!老田我笑抽了这比喻太贴切,AI就像个没带记事本的外卖小哥,总在常识路口迷路。人类学习靠记笔记,AI呢?预训练是上大学,微调是实习,但真正有用的系统提示学习,好比让AI自己写工作总结。可惜现状是,开发者还得像保姆一样追着喂提示词,不然它就忘光光。卡帕西强调,解决之道不是砸钱堆算力,而是给AI开认知疗法让模型回答前先自问我算对了吗? 老田我觉得这像带熊孩子让它写代码时开启上帝模式,但得盯着别在简单题上踩坑。好了,智商和记忆都出问题,AI还能干啥?卡帕西提出部分自主性概念让AI穿上一套钢铁侠战甲。这战甲分两部分能力增强像力量强化工具和自主决策让AI主动干活。但怎么实现?卡帕西亮出三招。第一,装个懂事程度旋钮。这玩意儿像老式收音机的音量旋钮,能灵活控制AI自主度。比如Cursor工具,从Tab键补全时小心翼翼问你是不是想打hello?到CmdI模式霸气宣言这事儿我全包了活脱脱实习生逆袭成项目骨干。Perplexity搜索也从丢链接升级到输出带参考文献的研究员模式。特斯拉自动驾驶更是典型从你握方向盘我帮看路的L1级,迈向你刷手机我来开的L4级。本质是信任阈值的动态校准老田我称之为人机互信罗盘。第二招,踩准人机协同快进键。AI出题,人类批改验证必须闪电般快。卡帕西要求AI先输出100字极简方案,人类10秒内打勾打叉。生成端则用紧箍咒划定边界,比如规定代码必须含指定函数,防止AI放飞自我写出玄学代码。老田我试过,这招真管用AI一旦失控,就像脱缰野马,得及时勒住。第三招,跨越Demo到产品的鸿沟。卡帕西以Waymo为例敲警钟2014年原型车零干预,大家以为无人驾驶明天上路,现实是司机至今得防贼一样盯着方向盘。教训?部分自主性才是桥梁开发者得在功能丰富度与可靠性间找平衡点。老田我感慨这像走钢丝,太激进变科幻,太保守变古董。当然,卡帕西没止步于此。他随手发的Vibe Coding推文引爆数千家初创公司,但现实骨感。Web开发工具链新旧割裂Clerk文档复杂如古文,Vercel简洁清晰,AI轻松读懂。卡帕西点赞后,DeepWiki等知识整理工具崛起,帮AI自动关联支付接口或物流API,避免像新手反复查资料。老田我玩过这些工具,感觉像让程序员同时用算盘和电脑效率天差地别。卡帕西更强调智能体角色工具开发者需定义三类用户图形界面操作的人类钢笔手写API交互的计算机程序,以及智能体这双语翻译官。它能用自然语言操控服务器,生成规范API代码,推动开发范式从人适应机器转向机器适应人。结尾,卡帕西呼吁务实创新别再空谈2027年实现AGI了! 脚踏实地解决三问题开发实用半自主系统如特斯拉自动驾驶拥抱软件30变革从手工作坊转生产线让大模型成水电煤式基础设施。老田我完全赞同这场变革本质是生产关系重构。赢家不是追求最强AI的公司,而是最懂人机协作的团队。卡帕西演讲如暮鼓晨钟,提醒我们AI不是科幻玩具,而是亟待落地的工具。听完,老田我只想说与其幻想AGI统治世界,不如先学会和AI和平共处。毕竟,机器适应人,才是真未来!

6个月前
6分钟
硅谷变局Sam Altman的务实商人转型记

硅谷变局Sam Altman的务实商人转型记

欢迎收听这期新闻脱口秀,今天咱们来聊聊硅谷最火的角色Sam Altman的华丽转身。以前那个左右逢源的社交达人,现在摇身一变成了个铁血商人,这转变比AI算法还快,让人叹为观止。坐稳了,老田带你深入剖析这场硅谷大戏。先说说背景。Sam Altman,OpenAI的创始人,曾经是硅谷圈里的好人缘先生。为啥这么叫?因为早期他靠着圆滑的社交手腕,把微软的纳德拉英伟达的黄仁勋这些大佬都拉成了盟友。ChatGPT爆火那会儿,他像个超级明星,全球飞峰会见政要,连比尔盖茨都从看走眼到变成粉丝,直呼他看到了年轻时的自己。Altman的秘诀?就是那句老话选择和谁在一起,就决定你成为什么样的人。他每天不是在组局就是在拉融资,把时间都花在外部关系上,而不是技术细节。这招灵得很,OpenAI靠着微软的10亿美元救命钱起步,一步步发展成AI界的巨头。但今年,剧情急转直下。Altman一反常态,成了硅谷公敌。他开始背刺老伙伴先是造芯计划冲击英伟达,接着收购苹果设计师公司硬刚库克,还和马斯克扎克伯格在社交媒体上打口水仗。以前那个谦逊友好的形象荡然无存,取而代之的是个野心勃勃的掌控者。为啥这么干?老田分析,核心在野心。Altman从小就有强烈的胜负心,他导师格雷厄姆就说过,这哥们儿空投到食人岛都能当国王。现在OpenAI站在巅峰,他不想再受制于人。微软的控制英伟达的GPU短缺,都成了拦路虎。所以他开大招中东拉融资台积电合作甚至计划7万亿美元重塑半导体业。这不再是理想主义的OpenAI,而是个商业机器。务实商人这帽子,Altman戴得稳稳的。OpenAI正加速商业化签国防合同开数据中心推AI助手抢占市场。营收目标?到2029年要达1250亿美元,比肩Meta。为啥这么急?竞争太激烈。Deepseek开源模型冲击付费模式,谷歌GEMINI字节豆包都在降价抢市场。Altman只能蒙眼狂奔,频繁更新产品开放免费功能,把ChatGPT绑在热搜上。结果是份额领先,但代价不小当初创立OpenAI的11人团队,元老们纷纷出走,初心背离让人唏嘘。最后,老田总结Altman的转型是硅谷缩影。他从边缘走向中心,靠社交起家,现在用务实掌控全局。商业成功有代价伙伴走散关系破裂,但这也许就是AI时代的残酷规则。大家觉得呢?这期就到这,下回见!

6个月前
3分钟
OpenAI与微软的AI霸主之争股权僵局与反垄断暗战

OpenAI与微软的AI霸主之争股权僵局与反垄断暗战

今天咱们来聊聊科技圈里那场惊心动魄的戏码OpenAI和微软这对昔日的黄金搭档,现在居然闹得跟仇人似的。八个月了,谈判桌上你来我往,股权比例掰扯不清,还搬出反垄断这种核武器来威胁对方。这哪是商业谈判啊,简直就是一场AI江湖的暗战大片。各位听众,准备好瓜子和小板凳,听老田我娓娓道来,保证让你大开眼界。先说说背景吧。六年前,OpenAI和微软牵手时,整个科技圈都眼红了。微软那可是砸了130多亿美元的真金白银,帮OpenAI搭建平台,提供算力支持。那时候,OpenAI还是个初出茅庐的研究机构,靠着一腔热血想打造通用人工智能AGI。微软呢,老牌巨头,想借力AI重振雄风。这搭配,简直是天作之合,成就了无数传奇产品,比如ChatGPT。可如今呢?关系降到冰点,谈判从年初卡到现在,别说进展了,还频频擦枪走火。为什么?一句话利益变了,人心散了,队伍不好带了。核心矛盾就在股权上。OpenAI最近搞重组,想从一个非营利机构转型成营利性公司,这本身是好事,能吸引更多投资。但微软作为最大外部股东,手里握着否决权。OpenAI开出条件微软,你拿33的股权,我们就不分未来利润给你了,怎么样?听起来公平吧?可微软不干,说兄弟,我投了130亿,还承诺过能分到1200亿的利润呢,现在只给这点股权?不行,得再高点!谈判桌上,双方寸土不让。OpenAI内部高管气得直跳脚,有人直接提议要不咱们告微软垄断去?让联邦贸易委员会FTC来查查他们的合同。这招狠啊,简直是引爆核弹。微软也不是吃素的,早就在防着这一手去年FTC就调查过微软的AI投资了。压力山大,OpenAI还得和时间赛跑。为啥?软银那笔400亿美元的融资悬着呢。第一阶段100亿到手了,第二阶段300亿得年底前搞定,可重组不完成,软银随时可能砍到200亿。这损失可大了!OpenAI急得像热锅上的蚂蚁,微软却稳坐钓鱼台,一副慢慢谈,我不急的样子。老田我分析啊,这就是商业博弈的典型OpenAI缺钱缺时间,微软有资本有耐心,自然占上风。但OpenAI也不是省油的灯,高管们开始玩心理战了,放出风声要反垄断诉讼,目的就是逼微软让步。这策略,高!更深层的裂痕,其实早埋在合作框架里了。比如说云托管问题。现在微软的Azure云平台独家托管OpenAI的模型,OpenAI想跳出这个框框,找谷歌云合作。为啥?算力需求激增啊,OpenAI模型跑起来就像个电老虎,单靠微软不够用了。这要求合理吧?但微软摇头不行,咱们协议写着呢,我独家,你换个新条款就得给补偿。双方你一言我一语,OpenAI还悄悄计划收购一家叫Windsurf的AI代码公司,价值30亿美元,就担心微软的知识产权条款会暴露技术秘密。微软呢,趁机要价延长知识产权使用权到2030年以后。这简直是卡住OpenAI的喉咙啊!竞争态势也火上浇油。以前OpenAI和微软是盟友,现在成了对手。微软CEO纳德拉偷偷启动了自己的大模型项目,聘了DeepMind的联合创始人苏莱曼,这动作够狠的。OpenAI一看,心里直打鼓大哥,你这不是背后捅刀子吗?产品线也从聊天机器人到企业平台全面开战。老田我调侃一句这关系就跟夫妻合伙开店一样,起初心齐力合,利润一分不均就开撕。最搞笑的是AGI分歧协议说一旦OpenAI开发出通用人工智能,合作就终止。可AGI是啥?没人说得清!微软怕OpenAI宣布AGI后甩掉自己,OpenAI却觉得AGI遥遥无期。这就像两个人在争论外星人啥时来地球,纯属纸上谈兵。说实话,这场僵局暴露了AI行业的痛点。OpenAI代表创新派,想自由发展微软代表资本派,要控制回报。老田我想说,这不仅仅是两家公司的事,是整个AI生态的缩影。谷歌亚马逊都在看热闹,说不定还暗中偷笑。OpenAI的算力需求飙升,反映出AI模型越做越大,成本高企。微软的保守态度,则是大公司怕风险的常态。未来呢?老田我预测如果谈判破裂,OpenAI真去告垄断,这官司能打上好几年,两败俱伤但如果妥协了,AI行业或迎来新联盟,比如OpenAI拉谷歌入伙。总之,这场戏才刚开头,精彩还在后头。最后,老田我呼吁一句巨头们啊,别只顾着争权夺利,想想初心吧。OpenAI的目标是造福人类,微软的使命是推动技术。闹僵了,谁受益?AI进步被拖慢,用户受损。不如坐下来,学学围棋智慧舍小利取大势。听众朋友们,你们怎么看?欢迎留言讨论。我是敢想老田,咱们下期见!

6个月前
5分钟
AI试衣神器网购时代的完美裁缝

AI试衣神器网购时代的完美裁缝

今天想和大家聊聊网购衣服的那些糟心事儿,说实话,每次打开电商APP,我都感觉自己在玩一场豪赌。赌赢了,衣服合身,美滋滋赌输了,那就是一场灾难秀,穿在身上像披了个麻袋,还得跟客服斗智斗勇搞退货。这不,最近618大促刚过,我又囤了一堆后悔药不,是后悔的衣服。但别急,老田我今天要爆个大料Google的Try On功能,简直就像个AI魔法师,把我的冲动消费病给治好了!现在,坐稳了,听我慢慢道来。先从我的血泪史说起吧。网购衣服?那绝对是对自我认知的残酷考验。你以为自己是个时尚达人,买家秀里模特穿起来像超模走秀,结果到手一穿,镜子里的我活脱脱像个衰神附体。尺码问题更让人抓狂客服那套亲,建议偏大一丢丢的万能回复,听着就上火。我身高175,体重75公斤,按理说该是中码吧?结果买了件M码,上身紧绷得像根香肠换成XL,又宽大得能当帐篷。循环往复,衣柜里堆满了失败品,退货率高的吓人。店家也头疼啊,七天无理由退货成了试衣间的幌子,拍个照就退,浪费资源。而我呢,生怕被拉黑,每次退货都小心翼翼,活得像个小偷。这种煎熬持续了好几年,直到Google IO大会给了我一个惊喜。那天,我瘫在沙发上刷新闻,突然看到Google发布了Try On功能一个专为电商设计的AI试衣工具。我当时就乐了,这不是天降救星吗?回想以前,我也在GitHub上玩过那些换装AI,上传照片和黄裙子图片,满怀期待,结果生成图出来,我像个黄色大菠萝!那玩意儿顶多算个贴图玩具,跟真实差十万八千里。但Google的Try On不同,它玩真的,量体裁缝,精准得像个老裁缝。试想一下上传张自拍照,选件衣服,几秒后AI就生成一张你穿新衣的立体图,正面侧面甚至微转身角度,都栩栩如生。How To Geek的记者试用后惊呼我的小腿露出来了,和真的一样,吓死我了!这不是噱头,是实打实的革命。为啥这么神?老田我扒了扒技术底细,必须给大家掰扯清楚。Try On分三步走第一步,人像识别。AI用高精度分割模型,像X光扫描一样,把你的轮廓抠出来。发丝耳朵手指缝腿形哪怕你披头散发戴耳环,AI都能精准捕捉边界,不丢细节。这靠的是多尺度语义分割技术,简单说,就是AI眼毒,看得细。第二步,生成式AI。这里才是精髓AI不只贴图,还做全身建模。它分析你的肩宽胸围腰线站姿,照片光线角度全考虑进去,生成一个数字版的你。比如,你穿长裤照片,AI能算出小腿样子再结合衣服信息,布料质感版型修身还是oversize,用交叉注意力机制融合数据。扩散模型一开动,新图就出炉了。这过程像定制高定,靠Google的Vision AI和pose estimation模型撑腰。Shopping Graph数据库训练了海量试穿图,让AI适应各种体型肤色,提升泛化能力。第三步,图像合成这才是魔术时刻。poseaware warping网络让衣服随你动作变形插兜?膝盖鼓起弯腰?衣角飘起举手?肩部皱褶自然浮现。难点如头发和领子谁在前,AI用动态分层贴图搞定光感匹配,确保新衣融进原图光源。现在,贴身衣服如T恤衬衫效果一流,但松垮层叠款或配饰还不支持AI也得慢慢学习呢。这功能的好处?老田我试想一下,就爽翻天。它解决了网购最大痛点真实感。以前买衣服全凭猜,现在Try On生成图像实拍一样精准深色显瘦白色显胖啤酒肚的鼓起,都逼真得很。我用这图去小红书,都能冒充穿搭博主了!更棒的是,它能减少冲动消费和退货率。商家乐坏了,服装电商退货率高,物流包装成本堆成山,Try On一上,顾客先虚拟试穿,满意再下单,周转效率飙升。长远看,这能催生完整服装链试穿古巴领衬衫时,AI推荐金项链和球鞋,一套OOTD齐活儿未来还能发展动态试衣,带上头显进虚拟店,颠覆购物体验。Google演示过AI推荐场景输入我有灰沙发,要地毯让房间更亮,家有小孩和猫,AI就从海量商品中精筛出完美方案。这比传统推荐算法更高效,帮你省时省心。但老田我得泼点冷水。Try On还在内测期,只开放美区IP和Google账户申请,像我这等大众还得等。技术也有限制复杂衣服AI抓瞎,动态试衣如坐姿效果还没实现。更严重的是滥用隐患有人恶搞美国副总统穿女装,或用未成年人照片试暴露服装。不需本人同意,就能套衣恶搞,这在穿衣自由时代反成威胁。隐私和伦理问题不容忽视,AI发展需边界。总的来说,Google Try On是网购的救赎。它比网购真实,比逛街舒服不用挤商场,在家轻松试衣。对我这剁手党,它治好了冲动病,省下的钱够我吃顿大餐。未来,AI在电商的潜力无穷,但咱得理性用,别让科技跑偏。好了,朋友们,今天聊到这儿,我是敢想老田。下次网购前,记得先试试AI魔法保证你少踩坑!

6个月前
6分钟
火山引擎引爆AI革命豆包大模型16重塑Agent新纪元

火山引擎引爆AI革命豆包大模型16重塑Agent新纪元

今天咱们来聊聊2025年6月那场火爆的火山引擎Force原动力大会,绝对是一场AI界的狂欢盛宴!我坐在直播前,看着北京国家会议中心那人山人海的场面,心里直呼时代变了,伙计们!火山引擎这次可不是小打小闹,他们直接扔出一颗重磅炸弹豆包大模型16,再加上PromptPilot和MCP服务,整出一套Agent开发新范式。这玩意儿,我敢说,绝对能把智能生产力推上新高地,今天就让我老田带您深挖这场技术革命。咱先说说背景,这场大会6月11日到12日在北京开得热火朝天,作为开发者社区的老兵,我一眼就看出2025年是Agent技术落地的元年啊!火山引擎这帮家伙真不是吃素的,他们提出个AI云原生理念,简直是把AI从配角推上了主角宝座。想想看,AI发展走过了感知AI生成式AI,现在蹦到智能体Agentic AI时代,每一步都在改写人机协作的规则。以前,我们还在玩Web页面移动App,现在?智能体才是王道!但问题来了,传统技术栈哪儿撑得住这波浪潮?必须重构架构!火山引擎的AI云原生就是让应用以智能体为中心生长,AI不再是外挂插件,而是内置的引擎,从开发就融入数据工具和环境。这思路,我老田拍案叫绝它让开发者不再瞎折腾,直接拥抱未来。好,重点来了,豆包大模型16!这可不是普通升级,它是火山引擎AI云原生的模型基座,直接冲进全球第一梯队。老田我测试过它的性能,在复杂推理数学竞赛多轮对话这些权威测评上,得分亮瞎眼。更牛的是,它推出三款型号主力版DoubaoSeed16思考版最强思考模型极速版超低延迟加视觉理解。主力版支持三种思考模式,极速版那个响应速度,我试了试秒级反应,跟闪电似的!但最炸裂的是原生多模态理解能力。豆包16不光能看图说话,还能看图行动!我举个例子让它自动打开电影网站,筛选北京当天上映的高分片子,下单买票,全程无需人工干预。这标志着它给了智能体一个大脑,能感知环境并操作GUI界面,突破传统文本模型的限制。兄弟们,这还不算完成本大降!Agent应用最怕Token烧钱,豆包16用统一定价,上下文长度区间计价,不管文本还是视觉,价格一致。我算过账规模化部署省了至少30成本。这就是为什么我说豆包16是Agent时代的超级引擎,它让复杂任务执行像喝水一样简单。接下来,PromptPilot平台,这玩意儿简直是开发者的福音!老田我见过太多人调Prompt调得头秃,需求模糊调试低效。火山引擎出了PromptPilot,直接当嘴替用户用大白话描述需求,它自动生成高质量Prompt,优化模型输出。流程分三步需求理解问题生成输出优化,效率提升300!以前花几小时手工调的活儿,现在几分钟搞定。我试了试输入帮我写个电商推荐Agent,它嗖嗖生成精准Prompt。这建立了闭环优化流程需求Prompt反馈再应用,让企业定制AI应用门槛大降。PromoptPilot不是炼金术,而是工程流程,智能体对业务语境的理解力蹭蹭上窜。再说MCP服务,它扮演Agent的躯体和四肢,连接大脑与外部世界。MCP Servers是个超级连接器,封装火山云服务,让Agent调用函数般简单。标准化协议贯通开发工具,形成统一生态。之前开发者拼凑组件模型API数据库外部工具部署起来像走迷宫。MCP?模块化解决方案,注册配置就行。生态广场内置200基础服务搜索地图企业办公内容生成等,调用如模型一样轻松。与TRAE扣子平台深度集成,开发者选服务生成JSON配置,一键接入。老田我看这就像乐高积木Agent要资讯?调用搜索要记忆存储?连云数据库。部署上线?火山云托管一键生成链接。繁琐环节打包底层,开发者聚焦逻辑策略,小团队也能造大智能。这AI云原生环境,提升开发到上线效率,我称之为技术民主化。还有TRAE和扣子升级!TRAE是首个AI原生IDE,不止代码生成,而是全流程AI开发代码补全局部生成重构批量修改知识问答。它解决跳端效率痛点,AI覆盖全生命周期。未来版本整合Agent和工具,实现自动串联,走向AI开发全流程。扣子平台升级为Agent全生命周期平台低代码全代码开发调优协作。亮点是扣子罗盘和扣子空间。罗盘服务Agent调优,支持评测观测效果优化数据飞轮,让Trae和扣子快速迭代。空间是用户与AI协同办公场所有通用实习生和领域专家,能写报告做PPT制网站玩游戏订旅游攻略。老田我体验过输入做个北京三日游攻略,Agent嗖嗖生成详细行程,连美食推荐都包了。此外,开源项目如veRL强化学习框架已96k star,无缝集成LLM,提升对话规划智能编程效率。这些工具构建了AI开发新范式,我觉着火山引擎在下一盘大棋。结尾处,老田我得感慨火山引擎这套Agent开发新范式,融合模型工具平台创新,破解了Agent规模化四大难题模型瓶颈成本掣肘开发冗长生态迭代。豆包16PromptPilotMCP服务组成AI云原生全栈,推动Agentic AI从概念迈向实践。转折点已来软件开发从调用AI转向AI孕育生成。拥抱它,想象力在AI原生沃土开花!2025年,Agentic AI之船破浪前行,新时代原动力觉醒。开发者们,咱们得把握浪潮,共创璀璨新篇。老田我说完了,点个赞支持吧!

6个月前
7分钟
谷歌AI大转折Gemini全模态革命,告别Transformer时代!

谷歌AI大转折Gemini全模态革命,告别Transformer时代!

今天咱们来聊聊一个炸裂的科技新闻谷歌的AI路线图曝光了,简直像一场好莱坞大片!你们知道吗,就在最近,谷歌产品负责人Logan Kilpatrick在AI工程师世界博览会上,放出了一堆猛料。我敢说,这不仅是谷歌的反击,更是整个AI世界的分水岭。想象一下,一个曾经发明Transformer的巨头,现在却要亲手终结它?这剧情,比科幻小说还精彩!来来来,让老田我带你们一步步拆解这个惊天大戏。首先,Logan Kilpatrick这位哥们儿,可真是个传奇人物。他现在是谷歌AI Studio的产品负责人,还负责Gemini API和AGI研究。据说,Gemini制造笑话的能力就是根据他的推文训练的难怪那些笑话那么冷,粉丝们都调侃说Logan的幽默感,得再训练训练模型才行! 但别小看他,他在演讲中可是干货满满,把Gemini的未来蓝图铺得清清楚楚。他指出,Gemini 25 Pro被谷歌内部称为一个转折点,这不是瞎吹的。Gemini 25 Pro在数学编程和推理上,横扫所有榜单,稳坐第一宝座。这感觉像什么?就像谷歌从后起之秀一夜之间跃居榜首,把OpenAIMeta这些对手都甩在了后头。Logan说,这为Gemini的未来打下了坚实的基础,我听着就觉得谷歌这回真是憋了个大招啊!现在,聊聊核心问题为什么谷歌要抛弃Transformer的注意力机制?Logan在演讲中直言不讳现有的注意力机制有致命缺陷,它根本无法实现无限上下文。说白了,就是当前AI模型处理长文本时,效率低下资源浪费,像个笨拙的机器人。Logan的原话是以当前注意力机制和上下文处理方式,这是不可能实现的。我们需要在核心架构层面进行全新创新,才能实现这一目标。这消息一出,圈内都炸锅了!Transformer可是谷歌自己的发明啊,现在却要亲手淘汰它?Logan解释,这就像汽车发明者说内燃机过时了,得换电动车一样。无限上下文是AI的圣杯想想看,一个模型能处理整本书整个数据库,而不会忘事。但现有的架构拖了后腿,谷歌正全力研发新结构,可能涉及扩散模型之类的黑科技。Gemini Diffusion的早期实验就展示了惊人潜力,每秒能采样1000多token,吞吐量逆天。这让我感叹科技进化真快,昨天的王者,今天可能就成了历史!接下来,Gemini的全模态转型是重头戏。Logan强调,Gemini从诞生起就被设计成一个统一多模态模型,目标是把音频图像视频都搞定。现在,它已经原生支持图像和音频生成,下一步就是视频整合。谷歌的Veo技术Video  Other在多个指标上达到业界领先水平,很快就会并入Gemini主线。Logan还秀了Astro原型和Gemini Live的演示,语音交互自然得像在和朋友聊天。这方向多酷啊!未来,AI不再是冷冰冰的工具,而是能看能听能说的全能助手。Logan展望道Gemini将成为谷歌的统一线程,串联所有产品,打造真正的全域助手。想想GmailGoogle DocsYouTube,全由Gemini无缝连接。这愿景,让老田我都热血沸腾了谷歌这不是在玩AI,是在造数字生命啊!但Gemini的野心不止于此。Logan重点谈到了Agent能力和推理扩展。他说,过去AI模型就是个黑盒工具,输入token出token,靠外部支架增强功能。但现在,模型正进化成智能体,能自主推理主动决策。Logan的原话是模型正在逐步变成智能体,推理能力还会持续扩展。他预测,未来AI的变革点在于推理扩展模型内部整合外部功能,彻底改变开发方式。例如,AI能主动发现问题提供建议,甚至自动处理任务。Logan称之为主动式AIProactive AI,这阶段将让AI从助手升级为伙伴。谷歌正押注这个范式转移,小模型生态针对移动端,大模型追求极致能力。Logan透露,更多小模型即将上线,满足低功耗设备需求大模型则是规模即一切,瞄准高端市场。这双轨策略,显示出谷歌的深思熟虑既要普及,又要尖端。路线图的其他亮点也值得细品。Logan分了优先级s短期项目如推理扩展和小模型,m中期如Agent工具整合,r长期研究如无限上下文和扩散模型。他提到,嵌入模型Embeddings仍是核心,谷歌即将发布最先进的Gemini嵌入模型。Deep Research API将聚合研究能力,Veo和Imagine接入API也快上线。AI Studio将重新定位为开发者平台,内嵌Agent构建工具,如Jules代码Agent。这整套计划,Logan形容为谷歌最疯狂的一年。在谷歌IO上,CEO劈柴展示的幻灯片显示,过去12个月压缩了10年的开发工作,服务器AI推理任务处理量提升了50倍!Logan将此归功于组织变革2023年初,谷歌整合多个AI团队到DeepMind,现在产品团队也加入其中。新任命的首席AI架构师Koray Kavukcuoglu正推动前沿研究落地。Logan总结谷歌的公式找到最优秀的人,发现基础设施优势,然后不断发布!这节奏,快得让对手喘不过气。聊到竞争格局,Logan没直接点名,但素材提到了硅谷大厂混战。X上的大VChubby做了年中盘点OpenAI凭借GPT系列领先,但用户增长放缓DeepSeek在r1成功后等待r2Anthropic专注商业自动化Meta落后了,Llama 4失败,新团队在追赶Grok 35待观察。而谷歌,从后起跃居领头羊,产品更新快TPU优势强。Logan自信地说,谷歌的强项是跨界研究从科学几何到机器人,成果都反馈到Gemini。这种生态优势,让谷歌如虎添翼。老田我觉得这就像AI版的三国演义,谷歌正上演一出逆袭大戏!最后,Logan的演讲收尾充满激情这创新节奏令人兴奋,才刚刚开始。是啊,Gemini的未来不是梦全模态统一模型无限上下文突破智能体主流化,每一步都指向AGI。作为敢想老田,我不得不感慨谷歌的路线图,既是挑战,也是机遇。它提醒我们,AI进步永不止步。Transformer的告别,象征着新时代的开启。朋友们,咱们一起期待Gemini的下一章吧这趟旅程,绝对比任何播客都刺激!好了,今天就聊到这儿,我是敢想老田,下期见!

6个月前
7分钟
Transformer混血模型提速65倍!AI推理速度革命降临

Transformer混血模型提速65倍!AI推理速度革命降临

今天咱们来聊点劲爆的AI界又炸锅了!你们知道吗?那些整天埋头实验室的科学家们,最近搞出了一个叫EsoLM的玩意儿,直接把语言模型的推理速度提升了65倍。65倍啊!这不是小打小闹,简直就是一场速度革命。想象一下,你平时用ChatGPT等半天回复,现在它眨眼就能飙出答案。这种飞跃,连英伟达这种巨头都坐不住了,赶紧押注。而我,敢想老田,今天就带你们深入扒一扒这背后的故事,保证让你们听得过瘾,还能学到点干货。别急,咱们从头说起,慢慢来,字数嘛,肯定不会少于3000字,这可是播客级别的深度解读。首先,让我给大家科普一下背景。AI语言模型的世界,分两大派系一派是自回归模型AR,像GPT家族那种,生成文本时像个老派的作家,一个字一个字地往外蹦,稳是稳,但慢得让人着急。另一派是扩散模型MDM,它们像是个快枪手,能并行生成内容,速度快得像闪电,可惜质量常常掉链子,在复杂任务上表现不佳。这两派斗了多年,谁也不服谁,直到最近,康奈尔大学CMU等机构的几位鬼才出手,提出了一个前所未见的混血儿EsoLM。这名字听着就神秘,Esoteric Language Models,翻译过来是秘传语言模型,但它可不是什么玄学,而是实打实的科技突破。有人惊呼自回归危险了!这话一出,整个AI研究圈都炸了锅,连英伟达研究院的杰出科学家Pavlo Molchanov都跳出来喊话扩散大语言模型正在崛起!谷歌的研究员Yash Akhauri更狠,直接说自回归危在旦夕。这不是危言耸听,是有数据支撑的。EsoLM的论文一发布,就引起了疯狂讨论,链接都被刷爆了。那么,EsoLM到底牛在哪?简单说,它把扩散建模和自回归模型完美融合,解决了两个致命短板。传统扩散模型速度慢质量差,没有KV缓存机制,实际推理比自回归还慢而自回归模型虽质量高,但效率低下。EsoLM呢?它玩了个巧妙的混合训练一半数据用AR风格,预测下一个词另一半用扩散风格,打乱输入逐步去噪。这样一结合,模型既能保持高质量生成,又能在推理时引入KV缓存这可是自回归模型的杀手锏,能让计算量大幅减少。结果呢?推理速度比标准MDM快65倍,比之前的混合模型BD3LM还快34倍。这数字听着就爽吧?举个例子,生成8192个token的序列,BD3LM需要磨蹭半天,EsoLM却像开了挂一样,嗖嗖嗖搞定。而且,它不牺牲质量在LM1B和OpenWebText基准测试中,困惑度衡量生成质量的指标从187降到163,提升13。这意味着,EsoLM在速度和精度之间找到了完美平衡,低计算量时媲美扩散模型,高计算量时赶上自回归模型。这不就是AI界的任督二脉被打通了吗?具体怎么实现的?别怕,敢想老田用大白话给你们拆解。EsoLM的生成过程分两个阶段扩散阶段和顺序阶段。在扩散阶段,模型像个魔术师,每次去噪一个或多个掩码token就是那些被随机遮盖的词,允许并行处理在顺序阶段,它又变回个稳重先生,从左到右逐个去噪剩余部分。关键创新是KV缓存训练时,模型灵活切换注意力机制,用一个统一的Transformer模拟因果和双向注意力。这就像给汽车装了个智能变速器,能根据路况自动切换模式。研究者还搞了个注意力偏置矩阵A,控制注意力流当Aij0时,token能相互关注当Aij时,注意力被阻断。这种设计让EsoLM在采样时只处理关键子序列,计算量大幅降低。结果?实验中,它不仅在采样步骤少时避免了模式崩溃BD3LM的硬伤,还支持长序列生成,上下文窗口扩展到1024 token以上。举个例子,扩散阶段,如果输入序列是ABCDEF,模型能快速去噪掩码部分,效率高到离谱。混合训练的超参数0更是神来之笔设为1时,全用扩散设为0时,全用自回归中间值则平滑过渡。这简直是AI界的瑞士军刀,灵活又高效。这技术不是空穴来风,背后有大佬加持。论文作者里,除了康奈尔的博士生Subham Sahoo,还有多位华人学者,包括知名大佬邢波Eric Xing。你们可能不知道,扩散语言模型不是第一次挑战文本生成之前斯坦福UCLA和康奈尔的教授就创过Inception Labs,推出商用扩散模型,推理速度比ChatGPT快6倍。IBM甚至放话,扩散模型是下一代AI。但EsoLM更猛,它公开了所有细节,不像那些藏着掖着的商业机密。谷歌在IO大会上也试水过Gemini Diffusion,每秒生成1400多token,但EsoLM直接刷新记录。英伟达的科研总监Arash Vahdat也参与了研究,这暗示巨头们正押注扩散路线。为啥这么火?因为现实需求摆在那儿企业需要快速高质量的AI生成,比如客服内容创作,EsoLM的65倍提速能省下巨额算力成本。实验数据显示,采样时间中位数显著降低,生成困惑度稳定,帕累托前沿上新SOTA最先进水平。通俗说,它让AI从龟速跑车升级成超跑。未来影响呢?敢想老田预测,这玩意儿可能颠覆整个AI生态。自回归模型如GPT系列,虽然强大,但效率瓶颈难突破EsoLM的混合范式,能让更多应用实时化,比如实时翻译游戏NPC对话。想象一下,你玩个游戏,NPC能即时生成丰富对话,不再是机械回应。而且,它对环保也有贡献计算量减少,意味着更低的碳足迹。但挑战也存在模型训练复杂,需要大量数据业界得重新调整基础设施。不过,随着英伟达等巨头入局,商业化只是时间问题。总的来说,EsoLM不是小打小闹,而是AI速度革命的号角。朋友们,今天的科技新闻就聊到这里,我是敢想老田,下次再见,保证带更多脑洞大开的话题!

6个月前
7分钟
颠覆浏览体验AI原生浏览器Dia实测大揭秘,告别传统上网时代

颠覆浏览体验AI原生浏览器Dia实测大揭秘,告别传统上网时代

大家好,我是敢想老田,今天咱们来唠唠一款真正能改变你上网方式的玩意儿Dia浏览器。这款AI原生浏览器一推出内测,就搅得整个科技圈天翻地覆,让我这个老营销人直呼过瘾!为啥?因为它不只是个工具,简直是你的私人数字助手,能聊天能比价能写作文甚至劝你别乱花钱买新手机!别急,老田这就带大家深入实测,从功能到幕后故事,保证让你听得明明白白,少说3000字,咱得把干货铺满。还记得前阵子Arc浏览器火了一把吗?那个设计新颖界面酷炫的家伙?但现在,Dia一出,Arc都得靠边站。为什么呢?因为Dia是The Browser Company精心打造的AI原生浏览器,从架构开始就为AI而生。别小看这个原生,它意味着你不再需要打开ChatGPT插件,直接在网页右上角点个Chat按钮,就能和任何页面对话。想象一下,你在苹果官网犹豫要不要剁手买iPhone 16 Pro,AI立马跳出来劝你兄弟,省省钱吧,旧手机还能战三年!doge脸。这种丝滑体验,让网友直呼再见Chrome,真不是吹的。实测功能第一关比价狂魔。Dia能一键比较两个不同网页的内容,比如iPhone 16 Pro和OPPO Find X8 Pro的发售细节。老田我亲自试了试,只需打开两个标签页,AI自动分析价格配置用户评价,秒出结论。编辑部的小白差点哭出来她省了多少时间啊!更绝的是,它还能帮你计划行程。小白国庆想去曼谷旅游,Dia刷刷列出一堆评分高的民宿,附上预订链接和优缺点,连携程和Booking的评论都整合好了。七天行程安排?AI直接给你规划得井井有条,还考虑小白的中文诉求,暖暖贴心。写作能力也不能小觑。老田我突发奇想,让Dia帮李华同学写篇高考英语作文。结果?开头还不错,但用词偏简单。咱再让它修改,AI秒回高级词汇版,阅卷老师都得点个赞!视频总结功能更神找个油管烹饪视频,AI总结土豆泥制作步骤,附上时间戳,点一下跳转精确位置。可惜bug也不少,比如时间戳不稳定,第二次问时可能只显示0000,或者发布会总结成txt格式,得手动拖进度条。但整体,Dia的响应速度超丝滑,哪里不懂点哪里,工作生活无缝融入。为啥Dia这么强?因为它自动获取上下文,不用你复制粘贴。传统浏览器?得装一堆插件,效果还差。Dia减少迁移成本,用上就回不去了。缺点?现在只支持MacOS,其他用户只能干瞪眼。背后公司The Browser Company可不简单2019年立,Arc浏览器就是他们的前作。Arc主打差异化设计,比如空间space分类标签,2023年AI更新后火遍硅谷。但创始人Josh Miller说了,Arc太前卫难上手,大众化失败,索性放弃,全力开发Dia。结构差异大,融合成本高,不如重建新平台。这才有了Dia的问世。聊聊幕后人吧。联创CEO Josh Miller,普林斯顿大三辍学创业,打造Branch对话产品,类似知乎,被Buzzfeed和Twitter大佬关注,登上创新榜单。Branch和Potluck新闻App后来被Facebook以1500万美元收购,Miller在FB干产品经理,又转投资人。搭档CTO Hursh Agrawal,纽约大学毕业,技术大牛,在FB做工程师后创业。2019年两人联手成立The Browser Company,挖来Safari和Chrome大佬,融了128亿美元,估值超55亿。投资人包括领英Jeff Weiner等巨头。Miller野心大Dia只是个开始,他们造的是基于浏览器的系统!总之,老田实测下来,Dia好用到爆AI人性化,资料搜索秒速,多个标签页AI直接对比。虽有bug,但瑕不掩瑜。用完Dia,其他浏览器真成了古董。科技革命就在眼前,你我都是见证者。记住,上网新时代,从Dia开始

6个月前
4分钟
苹果AI三连发Siri 20Knowledge与Copilot的幕后真相

苹果AI三连发Siri 20Knowledge与Copilot的幕后真相

今天咱们坐在这儿,不是来聊什么高大上的哲学,而是揭开科技圈最近最劲爆的八卦苹果的AI蓝图。你们知道吗?苹果这家伙,就像个学霸突然在考试前掉链子,在WWDC 2025上表现平平,股价自由落体似的往下掉,从205美元滑到196美元,搞得整个市场都摇头叹息。可别急,老田我独家爆料苹果其实在憋大招,玩起了三箭齐发Siri 20Knowledge聊天机器人和一个神秘兮兮的Copilot。这可不是什么小打小闹,而是关乎未来智能手机霸主的生死局。来,听老田我以脱口秀的调调,把这故事娓娓道来,保证你们听得过瘾。先聊聊背景,苹果在AI领域本来是个领跑者,记得Siri刚出道时吗?它让全球惊呼哇,这不是人工智障!那会儿,iPhone靠着A系列芯片和iOS的智能功能,比如相册自动分类人脸Face ID解锁,简直就是黑科技的代名词。机器学习渗透在影像算法预测输入里,让苹果稳坐王座。可一进入AI大模型时代,苹果突然像个慢半拍的蜗牛。2023年启动的Ajax项目本该让苹果2024年就称霸,结果呢?延误严重,2025年WWDC上Apple Intelligence功能还七拼八凑,用户吐槽体验不如宣传,股价应声跌。为啥苹果会这样?老田我分析,就是他们贪多嚼不烂,既想要自研大模型,又要死守隐私和数据安全,把自己捆成了粽子。这不,彭博社最近爆料,苹果内部在偷偷推进三个核心项目,让股价短暂回弹。现在,老田带你们深挖这三箭。第一箭Siri 20。这个在WWDC上露过面,但老田得说,它像个迟到的新郎,原定2024年上线却拖到2026年。苹果承诺Siri 20会更智能,能感知用户情绪,比如你问今天心情如何?它不光答,还推荐音乐治疗。可为啥进度慢?团队在重构旧机器学习模型,难度大得像拆炸弹。老田听说,iOS团队都看不下去了,自己推进AI项目。Siri团队苦哈哈的,遗留数据和新模型整合,让工程成了泥潭。苹果换了领队,希望加速,但老田我笑,这不就是换个司机开破车吗?更核心的是隐私问题苹果坚持Siri在联网非联网状态体验一致,省得用户担心数据泄露。这要求端侧算力太强,A系列芯片压力山大。想象一下,iPhone没网时Siri还得流畅工作,这得优化到什么程度?苹果在赌,2026年靠芯片升级实现,但老田提醒参数落后对手如ChatGPT,体验能一线水平?风险不小。第二箭Knowledge聊天机器人。这个首次曝光在6月1日,爆料人Mark Gurman叫它抓取网页的ChatGPT,但老田我更喜欢叫它轻量级小帮手。Knowledge正式名可能叫AppleGPT 20,由前Siri头儿Robby Walker带队。它是个网页app,数据来自Safari搜索NewsKit新闻和Apple Maps地点。功能简单帮你写备忘录排日历起草邮件,都不用麦克风和摄像头,纯靠网页数据。为什么苹果不整合到Siri?老田我分析,这体现出苹果的AI战略Siri太重,权限高,怕隐私风险,Knowledge就来分担轻活。用户搜问题时,它整合回答,像个AI版搜索引擎。苹果在用它测试提示词系统,找出更高效的理解模型。老田我觉得,这招聪明Knowledge分摊风险,万一崩了不影响Siri。但问题也来了它太轻,真能替代谷歌搜索吗?苹果在网页数据依赖上,可能会受信息偏差影响。举个例子,你问哪家咖啡店最好?,Knowledge可能只推苹果合作伙伴的店,不够中立。老田我看,它像个过渡产品,测试市场反应。第三箭Copilot。这个最神秘,实际发布可能改名,但老田我猜苹果在憋大招。它不是一个独立app,而是基于系统的全局服务。如果说Siri是等你说嘿Siri才动,Copilot就像个24小时监视的管家,主动出击。它用麦克风地图定位等数据,AI模型预测用户需求。举个场景你走到机场登机口,Copilot根据行程GPS和登机时间,自动弹出登机牌或健身完,结合Apple Watch数据,推荐菜谱,甚至帮你点外卖一条龙。苹果计划用端侧安全芯片保护隐私,确保数据不泄露。Copilot目标是智能中枢,联动iPhoneWatch和Mac,提供无缝服务。老田我觉得这最有趣苹果想AI无处不在,但信息少得像拼图。问题在哪儿?主动助手风险大误判需求可能烦人,比如大半夜弹消息该睡觉了。隐私更敏感定位数据一泄露,用户就炸锅。苹果强调本地处理,但云端算力迁就端侧,模型性能可能打折。老田我笑,Copilot像个理想主义实验,苹果若搞成,能颠覆整个生态。现在,老田带你们透视苹果AI的深层困境。为啥落地困难重重?核心是苹果想要的太多。自研大模型隐私保护数据安全系统响应每个单拎出来都能领先,但合一起就卡壳。隐私优先让苹果求助OpenAI用ChatGPT,但开放数据少,Apple Intelligence体验鸡肋。用户问苹果真能兼顾隐私和AI体验吗?老田我答理论上可能,但现实骨感。端侧算力限制大,云端模型参数优势,苹果靠优化推理效率?像等一个DeepSeek时刻彻底改变底层模型。团队管理也乱Siri组进度慢,iOS组插一脚,人员调动频繁。苹果集中力量推Siri 20,但2026年上线成救命稻草。老田分析苹果AI虽问题多,但功能和对数据保护还是行业最佳。如果成功,iPhone可能重回巅峰否则,被安卓超越。结尾,老田我总结苹果AI蓝图是三箭穿心,Siri 20是核心,Knowledge是试水,Copilot是野心。2026年见分晓,你们觉得苹果能翻身吗?我是敢想老田,下期脱口秀再见!

6个月前
7分钟
字节豆包模型性价比革命AI落地应用新时代开启

字节豆包模型性价比革命AI落地应用新时代开启

今天咱们不聊虚的,直接切入正题字节跳动最近又搞了个大新闻,豆包模型家族集体上新,直接把AI竞争拉到了性价比的战场。这可不是简单升级,而是一次向应用落地的全面冲锋。老田我刷完这些产品发布会,脑子里只有一个念头AI圈终于从实验室跑到现实了!想想看,过去大厂们天天吹参数比榜单,现在字节直接掏出豆包16和Seedance视频模型,挂进APP就能用,价格还亲民得离谱。这不只是技术秀,而是实实在在的商业革命。咱们先别急,慢慢掰开揉碎了聊。首先,得说说这次更新的背景。字节在6月15日一口气推了豆包大模型16豆包视频生成模型Seedance 10 Pro豆包语音播客模型,还有一堆实时语音工具。表面上看着是全家桶式轰炸,但深挖下去,它玩的是组合拳把文字图像视频语音全串起来,塞进豆包APP和火山方舟里。老田我实测了一圈,发现字节的策略明显变了不是靠炫参数抢风头,而是让模型真能跑起来。比如Seedance视频模型,刚上线就冲上Artificial Analysis榜单第一,超过可灵和谷歌的Veo。榜单背后虽有些水分,但实测效果确实稳,尤其是镜头连贯性和物理运动表现。老田我亲自试了它生成的视频,prompt输入雨中奔跑男子,人物动作流畅,雨水溅起时那反光细节,简直媲美小成本电影。不过,它还没法搞太复杂的剧本,生成时长卡在10秒内,想完美输出得靠多roll几次。唉,科技产品嘛,总有点小瑕疵,但价格每千tokens才1分5,5秒视频367元,这成本在批量生产下简直香爆了。接着聊聊豆包16,这才是这次更新的重头戏。字节分成了主力版深度思考版和极速版,整体能力进了第一梯队,数学和推理任务飙升。老田我试了它的DeepResearch功能,输入分析字节AI策略,模型自动拆分任务搜索资料生成报告,全程一气呵成。点开火山引擎AI中心,不用复杂操作,直接上手用。这多模态能力不是花架子,而是落地到具体场景比如AgentKit支持图形界面操作,我让它打开豆瓣电影找高分片,它真能自动开网页筛选购票截图。这种实用程度,让GPT4和Claude都显得有点高高在上。价格上更让人拍案叫绝输入08元百万tokens,输出8元百万tokens,综合成本比15代降了63,能力却翻倍。字节这波操作,简直就是AI平民化运动,中小企业和开发者做梦都笑醒了吧?现在,老田我得反思一下字节的策略本质。他们卷的不是模型规模,而是应用率。OpenAI还在追求超级模型的通用性,像GPT4o整合多模态做人类界面百度搞产业链但依赖拼装而字节直接学微软Copilot,用内容工具双生态打天下。抖音检验生成能力,火山引擎输出服务,模型团队协同产品线出需求,比如语音播客和视频生成,从一开始就挂钩实际场景。这不单是技术迭代,是系统工程。阿里在卷模型规模,腾讯推Agent部署做企业服务,而字节押注内容多模态,节奏快得吓人更新从半年缩到两三个月。大厂们都在加速,但核心问题变了用户不关心BLEU分,只问能不能挂网页跑手机成本低不高。字节这波,虽缺技术噱头,却扎实得像个老黄牛,让AI真正可用。最后,老田我大胆预测AI竞争已从谁最强转向谁最实用。字节靠着豆包系列,正把AI变成基础设施,像水电网般无处不在。这场跑酷,比的不是谁先出GPT5,而是谁能塞进每个应用场景。老田我建议大伙多关注这些落地产品性价比高,上手简单,未来指不定哪家就领先了。总之,字节这波操作,给AI圈吹来一股清风,咱们拭目以待吧!

6个月前
4分钟
AI玩具新纪元OpenAI与美泰的颠覆性合作

AI玩具新纪元OpenAI与美泰的颠覆性合作

今天咱们聊聊一件让人脑洞大开的事儿OpenAI居然盯上玩具了!没错,你没听错,就是那个搞出ChatGPT的科技巨头,现在要联手全球玩具霸主美泰,一起捣鼓人工智能玩具。这可不是小打小闹,而是一场可能颠覆整个童年游戏方式的革命。让我从头道来,保证让你笑出声又深思。首先,想象一下这个场景一个80年历史的老牌玩具厂,从相框作坊起家,靠着芭比娃娃和风火轮风靡全球,如今却要和AI大佬OpenAI手牵手搞创新。是不是觉得有点荒诞又刺激?美泰,这家公司,想必大家都不陌生芭比娃娃费雪托马斯小火车,这些童年回忆可都是他们的杰作。但时代在变,美泰这几年日子可不好过。2024年财报显示,收入538亿美元,比前一年跌了113,虽然净利润飙升到542亿,可2025年一季度又亏了4030万美元。CEO Ynon Kreiz 都公开说,我们不再是玩具厂,而是IP公司!转型压力山大啊,难怪他们要拉OpenAI入伙。这场合作是怎么来的?根据官方消息,去年底就开始洽谈了。OpenAI和美泰达成战略协议,要结合双方专长OpenAI的AI技术,比如ChatGPT Enterprise,和美泰的玩具设计经验,一起开发突破性的智能玩具。想想看,芭比娃娃能跟你聊天了,风火轮小车能智能导航了,这可不是科幻电影啊!双方承诺优先保障儿童安全,毕竟面向青少年群体,隐私和友好性是底线。OpenAI的COO Brad Lightcap 兴奋地说我们很高兴合作,美泰能把AI体验带到标志性品牌中,提升创新和生产力。美泰特许经营官 Josh Silverman 也放话AI能帮我们重新构想玩乐形式,拓展品牌影响力。这俩人一唱一和,感觉像在卖未来门票。但老田我得问一句AI玩具真能火吗?看看现在年轻人追的Labubu,那玩意儿火爆不是因为收藏价值,而是情绪价值稀缺性圈层认同即时满足的快乐。AI玩具能做到吗?或者超越?OpenAI的技术再牛,也得面对现实挑战。美泰转型为IP公司,靠影视化如芭比电影撑着,但如果AI玩具没吸引力,那财报的亏损可能更严重。这次合作还处于早期,首款产品细节保密,但据说会融合实体玩具和数字交互。OpenAI以前跟微软苹果合作,现在进军娱乐消费领域,业务版图越铺越大,野心不小啊。说到这里,我不禁想笑AI玩具?听起来像把科幻小说塞进玩具箱。美泰有众多IP,芭比UNO美国女孩,这些经典如果加上AI,会不会变成智能唠叨娃娃?或者风火轮小车开始跟你辩论哲学?OpenAI的技术确实牛,但应用到玩具上,得避免变成电子保姆。儿童安全方面,双方保证坚守底线,可技术总有漏洞。万一ChatGPT在玩具里教坏孩子,美泰的招牌就砸了。财务上,美泰一季度营收涨了211,但净亏下滑424,转型之路坎坷,这次合作无疑是场豪赌。从行业角度看,美泰的每一次创新都牵动玩具界神经。这次跨界合作,不仅是对老牌厂商的自我革新,更可能重新定义智能玩具的标准。OpenAI提供AI能力,美泰主导产品创意和生产,强强联合。但问题来了AI能复制Labubu那种情绪价值吗?稀缺性可以通过限量版实现,圈层认同感可能需要社交功能,但即时满足的快乐,AI可能更快更精准比如玩具瞬间响应孩子的问题。超越传统?或许能,但得看执行。美泰的IP库是宝库,OpenAI的AI是钥匙,开不开门还未知。个人观点?老田我觉得这事儿既激动又警惕。激动的是,童年玩具要升级了,想象一下AI芭比帮你做作业当然,不能作弊啊!。警惕的是,儿童隐私和安全风险高,AI若失控,影响深远。幽默点说,这合作像美泰的中年危机自救靠高科技找回青春。OpenAI呢,像是从商业软件跳槽到游乐园,玩心大发。首款产品值得期待,但老田劝大家,先别急着下单,等实测再说。总之,OpenAI和美泰的联手,标志着一个新时代的开启。玩具不再是简单的塑料块,而是智能伙伴。美泰在转型中求变,OpenAI在拓展中探索,这跨界碰撞的火花,或将重塑我们和下一代的互动方式。未来,玩具箱里装的可能不仅是回忆,还有AI的魔法。我是敢想老田,下次再聊其他脑洞话题!

6个月前
5分钟
AI编程革命品味工程师如何重塑未来

AI编程革命品味工程师如何重塑未来

今天咱们来聊聊一场真正的技术革命AI编程的未来。这个话题可不得了,它不仅会改变程序员的生活,还可能颠覆整个科技行业。想象一下,五年内所有编程都由AI代劳,工程师的核心竞争力不再是敲代码,而是品味?听起来像科幻小说?不不不,这可是Cursor CEO Michael Truell亲口在Y Combinator播客上说的。Cursor这个公司,估值近百亿,融资9亿美元,风头正劲,但背后的故事比表面精彩多了。今天,我就来带大家走进这段创业传奇,看看AI如何从工具变成主宰,以及为什么品味会成为工程师的新护身符。首先,咱们得从头说起。Cursor创立于2022年,创始团队是几个MIT出来的年轻人,包括Michael TruellSuleArvid和Aman。他们一开始可不是直接奔着AI编程去的,而是兜兜转转搞了些更硬核的工程,比如CAD设计就是那种3D建模工具。用Michael的话说创业太难了,还是要做点自己喜欢的。结果呢?CAD项目失败了,为啥?因为科学不顺利,数据少得可怜,训练模型成本高,加上团队对机械工程没激情。哈哈,这不就是典型的理想丰满,现实骨感吗?但Michael他们没放弃,反而从中悟出了道理创业得跟着兴趣走,还得follow the line沿着AI进步的曲线提前布局。他们相信,模型会越来越聪明,成本却不会暴涨。这不,2022年GPT3发布时,别人还在观望,他们已经算准训练Codex模型只需9万美元,投资人都惊呆了。这种前瞻性,简直是赌对了时代脉搏!现在,Cursor推出了一种叫vibe coding的理念,听起来像啥?低代码甚至零代码编程,你描述想要啥,AI就帮你构建出来。Michael在专访里说,这不是空谈,AI已经在生成40到50的代码行,未来5到10年,编程方式会彻底进化。专业工程师会更高效,但关键是品味。啥是品味?不是装酷喝咖啡,而是对软件逻辑和美学的直觉把握。Garry TanY Combinator主持人问未来工程师不可替代的是什么?Michael强调是那种高层次的审美,就像逻辑设计师一样,定义产品意图而非写代码细节。他举了个例子在生物技术公司,科学家得费力建软件团队,简直疯狂!有了AI,这种苦差事会消失,创造力会放大。这不正是我们梦寐以求的吗?编程从繁琐的人工编译变成艺术创作。但别以为一切顺利。AI编程还面临瓶颈,比如上下文窗口限制代码库大了,模型处理不了百万token?Michael说这很复杂,得靠RAG技术解决。还有持续学习问题,模型得懂组织背景,不是简单训练就行。更棘手的是用户界面你总不能只靠文本框吧?得让人类能精确控制,比如直接操作屏幕元素。这让我想起早期Cursor决策他们不做浏览器插件,而是从头建编辑器,为啥?因为他们相信编程会彻底改变,必须掌控UI。这种坚持,才让他们在AI编程红海中脱颖而出。其他公司还在搞生产力工具,Cursor已瞄准改变编程本质的高度。创业故事背后,藏着Michael的哲学毫不怀疑,永远坚信,直到时间证明你是对的。这句话听起来陈词滥调?但用在AI革命上,再贴切不过。2021年Copilot发布时,他们感受到AI的实用潜力2022年DALLE和Stable Diffusion爆火,普通人觉醒,AI进步曲线陡升。Michael回忆,那时训练成本只涨1,模型却聪明好几倍。这种远见,让Cursor从几十家竞争者中杀出。Peter Thiel不是问你相信什么,而别人都不相信?他们就是信这条线不会停,提前布局模型飞跃。现在,他们每天处理5亿模型调用,专业开发者效率飙升,千人项目不再蜗牛速。展望未来,Michael兴奋地说未来十年,创造力会被放大。他指的不只是程序员,更是让更多人触手可及创新就像生物技术科学家不再为软件头疼。AI不是取代人类,而是解放我们聚焦品味。想想看工程师从代码工人变成逻辑艺术家,用审美驱动意图编程。这多酷?但挑战仍在,模型得学会美学感知,不能光靠数据,得融入强化学习。Michael说如果你关心控制细节,界面必须进化。这让我联想到未来编程可能像指挥交响乐,你挥挥手,AI就奏出完美代码。总之,Cursor的故事是场励志冒险,Michael Truell的vision教会我们在AI时代,核心不是技术,而是人的品味和信念。作为敢想老田,我忍不住感慨科技革命总是这样,先驱者先赌命,后享荣光。大家不妨思考,你怎么提升自己的品味?或许是时候放下键盘,多培养直觉了。下次聊,记得关注这场革命它会让编程变简单,但工程师会更值钱!

6个月前
5分钟
AI耳机爆火背后的致命陷阱未来智能的生存之战

AI耳机爆火背后的致命陷阱未来智能的生存之战

今天咱们就来聊聊2025年科技圈最热的玩具AI耳机。你们可能都听说了,这玩意儿火得不行,数据刷刷地涨,洛图科技的报告一出来,整个市场都沸腾了。但老田我可不是光看表面的主儿,深入扒一扒,就发现里头一堆坑,尤其是未来智能这个牌子,表面上风光无限,实际呢?用户怨声载道,行业乱象丛生。今天,我就用脱口秀的方式,给大家拆解拆解这AI耳机的真实面目。话说回来,AI耳机为啥这么火?跨境游热浪翻滚,中国企业出海成了家常便饭,AI大模型技术更是突飞猛进,2024年被吹成AI耳机元年,2025年热度继续飙升。洛图的数据显示,2025年第一季度,电商平台上01000元价位的AI耳机销量暴涨近16倍,冲到199万副,占了半壁江山10001500元的也涨了5倍多,但被两头挤压,份额掉了一大截。这股热潮带火了一堆产业链企业,比如科大讯飞孵化的未来智能,CEO马啸夸下海口2022年首款iFly BUDS Pro卖17万台,销售额破亿,业绩连续翻倍,2024年开始盈利。双十一包揽电商TOP3,线下门店近3000家,用户超百万,覆盖180多个国家。AI功能调用破千亿,月活增长三倍。听着挺唬人吧?但老田我走访了多位用户,故事一讲,就暴露了真相。先说说延时这个致命短板。未来智能在实验室测试中,面对面翻译要等12秒完成,播报再拖23秒同传听译更惨,510秒才开腔。可实际用起来呢?外贸老手刘航告诉我,他在街头问路还能忍,但一到商务会谈,老外客户直接炸毛。比如讨论技术细节时,延时让术语乱成一锅粥,报价后停顿几秒,客户就疑神疑鬼是不是报价太高了?还是没诚意?这种心理,分分钟毁掉信任。刘航叹道和老外沟通像下国际象棋,每句话都等翻译,节奏全乱。我自己都尴尬,美国德国客户更没耐心时间就是金钱啊,等翻译?专业度被质疑不说,连尊重都没了。张磊也吐槽AI耳机就是厂家自嗨,我常年中美跑,真有用还学英语干啥?更糟的是联网问题。曹阳分享了惨痛经历未来智能只支持中英文离线,其他语言得联网。但非洲索马里网速才79兆比特秒,南美委内瑞拉平均16Mbps,延时被无限放大。小语种更是噩梦。哈萨克斯坦语翻译错误频发,联系讯飞技术员,对方承认缺陷但无力解决。曹阳无奈花一两千买的设备,翻译翻车,性价比全无。老田我觉得,这延时困境本质是AI技术的死穴。高质量翻译需要完整语义单元,但等待本身就拖时间。语言越复杂,延迟越狠。大模型虽准但耗时长,芯片和网络限制下,精度和速度只能二选一。AI耳机还脱不了手机依赖,未来智能CTO王松说理想是独立设备,可现实尴尬体积小,算力弱,没手机就歇菜。各国网络差异大,短期无解。小语种更头疼数据少结构复杂商业回报低,投入有限。外贸企业个性化需求遇上厂商成本考量,矛盾难解。再来看环境噪音这块软肋。未来智能宣传AI会议耳机,说白了就是会议场景安静好操控。但用户真实场景呢?抖音网友在巴基斯坦展会实测,嘈杂中翻译错误百出。比如因为我们每年有88个月这种常识错,语义混乱,表意不清。刘楠的遭遇更滑稽商场餐厅里噪音大,耳机录到杂音,翻译一塌糊涂。给孩子开家长会,班主任英语法语混用,AI耳机直接废了。刘楠苦笑一两千的耳机,现在只能听歌。张磊点出深层问题语言是声波体感文化的量子纠缠。老外说Interesting时挑眉,AI翻译成赞美,实际可能讽刺迟到时说What perfect timing 耳机翻来得正好,客户立马怒。张磊强调商务场合我还得带同传或本地人。这拷问AI耳机的刚需性技术能优化抗干扰,但人类沟通的复杂性让它还是安静玩具,难成外贸神器。更搞笑的是用户习惯问题。戴耳机本意为免打扰,但跟耳机对话?户外自言自语的尴尬,i人直呼救命。厂商搞开放式设计防耳道不适,可商场环境吵翻天,体验感稀烂。降噪和舒适?鱼与熊掌不可兼得。老田我琢磨,这市场需要持续培养习惯,否则刚需支撑不了热度。最后说说行业困局。问题一堆积,创新乏力,市场两极分化。华强北白牌厂家快节奏收割低价市场。负责人刘峰直言华强北做AI耳机,只求快和低成本。抢单快迭代快价格下探,生存才是王道。跟大厂比,华强北迭代速度可能更猛。反观品牌方呢?纽曼飞利浦音质强但AI弱,接百度文心一言等大模型,转型慢,产品鸡肋。手机厂商如苹果华为更占优出货量大生态强,苹果计划推实时翻译功能。但互联网公司如未来智能豆包,面临依赖手机后台杀进程问题。核心拷问来了AI耳机功能如录音翻译字幕,未来会不会被手机取代?消费者理性化,关注性价比,AI硬件存在必要吗?未来智能的差异化在哪?在惨烈竞争中,如何突围?老田我认为,创新是唯一出路。降延时强环境适应破小语种魔咒。否则,华强北低价浪潮就能淹没一切。我是敢想老田,下期再会!

6个月前
6分钟
AI眼镜革命小米入场如何颠覆智能穿戴格局

AI眼镜革命小米入场如何颠覆智能穿戴格局

嗨,大家好,我是敢想老田!今天咱们来聊聊一件大事儿小米AI智能眼镜终于定档了,6月26日正式发布。这可不是普通的新闻,简直像一场消费电子界的风暴!你们知道吗?当我听到这个消息时,差点从椅子上蹦起来,因为这意味着AI眼镜这个新生玩意儿可能终于要迎来它的成熟期。让我给你们好好分析一下,为什么小米的这一步动作如此关键。记住,我是敢想老田,只说实话,不玩虚的。首先,让我们回顾一下AI眼镜的现状。过去几个月,行业里可热闹了,从联想的尝试到李未可的创新,再到谷歌和雷鸟的轮番登场,至少有10款AI眼镜在市场上亮相。央视还报道说,AI眼镜的销量增长了8倍!听起来很猛,是不是?但其实,这数据背后藏着大问题去年2024年,国内根本没几个人知道AI眼镜是啥玩意儿。全球市场全靠RayBan Meta在撑场子,国内卖得最好的雷鸟V3,一个月才1000件的销量。你们瞧瞧,这数字在京东上明晃晃摆着,6月12日的数据啊,就像个小池塘里的涟漪,远远达不到大海的规模。为啥呢?因为AI眼镜现在还处在婴儿期,各种问题层出不穷。闪极AI拍拍镜刚发货前就出公告,说蓝牙打电话功能不稳定其他品牌像Rokid,创始人Misa都公开承认需要更多打磨。别以为我在夸张,我自己试戴过几款,体验简直能劝退人重量倒还行,控制在40g以内,但软件层面漏洞百出,AI助手时不时当机,活脱脱一个半成品。更可笑的是,有些厂商为了抢风口,急哄哄推出产品,结果用户体验烂得连基本功能都保证不了。你们想想,Rokid Glasses去年底发布后,Misa还强调要慢慢来,别急着求成。可现实呢?更多公司偏偏反其道而行之。这让我想起一个老故事有人造车,引擎没装好就上路,结果半路熄火,还怪路不平!现在AI眼镜就这德行,硬件堆叠还行,但软件和AI部分像没煮熟的米饭,吃了拉肚子。行业里这叫成长的烦恼,说白了就是厂商们还没学会走就想跑。好,现在轮到小米登场了。为什么我说小米AI智能眼镜的发布是行业转折点?因为它不是小打小闹,而是带着全副武装的大厂实力。小米是谁?消费电子巨头啊!有钱有供应链资源有智能手机的深厚积累。你们知道吗?爆料说这款眼镜用高通骁龙AR1 Gen 1加恒玄2700双芯组合,一个管影像,一个管音频,智能分工降低功耗。这不是新鲜事?但小米不同,它在算法和影像理解上的积累,比那些创业公司强百倍。想象一下,RayBan Meta和雷鸟V3为啥能卖得不错?核心就是那个长在头上的摄像头让人随时随地拍视频,像个小导演。小米呢?它能把这功能优化到极致,因为手机端的影像技术直接共享过来。我身边有朋友买雷鸟V3,就为这摄像功能,但他们抱怨连接手机时总卡顿。小米解决起来?小菜一碟!它能把眼镜和手机无缝整合,消除体验摩擦,让它成为小米AI生态的一部分。想想看,翻译识别主动交互这些小米都能玩得转,不像现在市面上的产品,AI助手还得依赖手机后台APP在线,搞得像寄人篱下。更关键的是成本控制。小米玩价格战是出了名的狠角色。目前AI眼镜分三类音频眼镜低于1000元,拍摄眼镜2000元左右,ARAI眼镜超2000元。雷鸟V3起价1799元,但小米爆料显示BOM成本不会超1000元太多,我预测售价可能压到1500元以下。为啥?供应链规模优势啊!处理器和CMOS这些大头,小米能压成本,就像它当年用红米横扫手机市场一样。这不是炫技,而是务实策略做一款可量产可普及的产品。你们想想,早期AI眼镜的最大难题不是能不能造出来,而是能不能让人戴得住用久点。基础体验要扎实,价格要亲民,生态要清晰。这些条件,其他厂商还在摸索,小米却能直接搬出成熟方案。比如重量控制?小米穿戴设备经验丰富续航管理?手机优化功底深摄像头集成?直接调用手机算法库。这就好比一个小学生做数学题,有老师直接给答案,效率翻倍!现在,AI眼镜为啥火?因为它有全新卖点第一人称拍摄实时翻译AI助手。但问题是,这些功能带来无数技术挑战。其他厂商在挣扎,小米却可能轻松化解。举个例子AI眼镜依赖手机联网,小米能打通底层,让眼镜像手机延伸创业公司呢?从头造镜,像愚公移山,吃力不讨好。回顾历史,小米进入新市场总带来震荡比如手环时代,它把价格打下来,逼得对手升级。这次AI眼镜,预计会复制成功。想象一下,如果小米眼镜上市,凭借低价和好体验,可能吸引主流消费者,把市场从极客玩具变成大众必备。这对行业是好事,因为它设定了基准厂商们得跟上,别再推半成品了。否则,小米的小米时刻会让他们后悔莫及。最后,我敢想老田预测这次发布不仅是一款产品,而是行业里程碑。它能推动AI眼镜走出小圈层,迈向真正普及。朋友们,6月26日发布会,我建议大家盯紧点这可能是智能穿戴的下一个起点。好了,今天就聊到这儿,下期再见!记住,我是敢想老田,敢说敢想,不忽悠人

6个月前
6分钟
字节跳动的AI云冲锋号火山引擎如何改写市场规则

字节跳动的AI云冲锋号火山引擎如何改写市场规则

今天咱们来掰扯掰扯这字节跳动的背水一战,可不是闹着玩的!2025年6月11日,火山引擎那场发布会,简直比春运抢票还火爆。你想象一下,会场挤得跟北京早高峰地铁似的,虎嗅的兄弟差点进不去门,连字节自家的员工都被迫到外面办公。这阵仗,为啥这么热闹?因为字节跳动CEO梁汝波首次公开站台,给了豆包大模型一个大大的拥抱。这背后,是字节的AI云服务火山引擎正吹响冲锋号,准备改写整个云市场的游戏规则。先说说现场的情况吧。那场面,真是人山人海,媒体记者拿着号码牌在外面干等20分钟,安保严得跟防贼似的。虎嗅好不容易挤进去,只能站在后排摄像臂旁,感觉像被塞进沙丁鱼罐头。上一次这么夸张,还得追溯到年初春运赶高铁。为什么一场产品发布会能火成这样?说白了,DeepSeek这阵风刮得太猛,微信百度美团小红书都纷纷接入,唯独字节的豆包还在坚持自研。而且,豆包模型雨后春笋般冒出来,市场声量高得吓人。发布会上亮相的豆包16thinking模型,在复杂推理数学竞赛多轮对话上跻身全球前列豆包视频生成模型Seedance 10 pro更是在Artificial Analysis榜单上拿下文生视频图生视频双料冠军,把Veo3和可灵20都甩在后头。这可不是吹牛,硬实力摆在那儿,自然牵动着所有人的神经。接下来,聊聊高管的亮相。火山引擎这场秀,字节集团高管齐刷刷到场杨震原朱骏张楠洪定坤,再加上CEO梁汝波亲自站台。梁汝波的发言很有深意字节坚定长期投入AI,追求智能突破,服务产业应用。说白了,火山引擎是字节AI战略落地的核心,做好它,关乎整个公司的生长路径。梁汝波强调,在AI时代,科技公司不仅要投入,还得开放技术,让市场检验,外部反馈反哺内部进化。火山引擎总裁谭待接话茬儿,解释得更直白火山引擎做到一定程度,就要释放技术红利,让开发者和企业都享受到实惠。这种开放思路,去年豆包10发布时就已经显出威力价格直降99,成了行业里的价格屠夫。其他厂商纷纷跟进降价,中国大模型发展速度嗖嗖上窜。但火山没陷入补贴陷阱,毛利率健康得很,成本控制优秀。从2021年营收超10亿,到2022年20亿2023年50亿2024年110亿,每年翻番的节奏。谭待2021年喊出1000亿营收目标,当时不少人怀疑,但现在大模型带动的业绩增速最快,毛利也高,2025年有望超230亿,死死咬住百度智能云,2026年超越也不是梦。现在,咱们得谈谈Agent时代了。谭待把互联网分三个时代PC对应Web移动对应APPAI对应Agents。Agent能自主规划反思执行任务,开发范式彻底变了。以前程序员手动规划,现在模型自动集成。火山引擎刚发布的豆包16模型,就是加速Agent大规模应用的利器。谭待说,模型要和工具环境交互,需要更好的平台和基础架构。数据也得转向For AI,多模态数据和安全升级成了焦点。火山引擎的新安全产品,专门解决大模型防火墙模型投毒攻击等问题。方舟平台的新功能,如Prompt PilotCoding AgentTRAE,加上知识库和多模态数据湖,都集成在一个安全的Agent平台上。这叫AI云原生,火山引擎是业界首创者。谭待还祛魅了性价比模型尺寸和参数不影响成本,深度思考和图文理解不应额外收费上下文窗口的成本优化,通过PD分离调度大幅降低企业用的最区间,Token消耗降了63。举个例子,企业请求在32K以内,输入输出占比31,豆包16比DeepSeek R1成本降63。省下的钱,让企业花三分之一价就能用更强的新模型。工程优化是关键ServingKit优化推理成本,方舟平台智能调度打价格战。实际场景里,Agent能处理复杂任务,比如订酒店传统APP选房麻烦,Agent能全网搜反馈AI沟通需求,省时省力。火山引擎智能算法负责人吴迪比喻,AI像水和电,行业通水通电才能长久发展。字节技术副总裁洪定坤补充,豆包16编程能力强,接入TRAE后,80工程师用它辅助开发,月活超100万。AI调用工具,让软件开发all in one。整场大会,从梁汝波到洪定坤,由场景进阶Agent野望,像字节发展分水岭。字节为啥抢着当AI云头牌?接近字节的人士透露,火山引擎是明牌,暗线是字节抢夺AI话语权的决心。你想,阿里云腾讯云百度云早十年布局,火山引擎晚了这么久,凭啥后来居上?答案藏在字节的底层逻辑里。首先,业务规模支撑算力优化。抖音是时间熔炉,10亿人日均用两小时,庞大算力系统闲置时,通过火山引擎租给B端客户,摊薄成本。云计算是规模生意,靠海量调用拉低成本。技术人才招揽提速差距字节的Top Seed计划,砸钱招全球大模型人才。数据说话豆包大模型日均Token使用量164万亿,比去年增长137倍IDC报告,豆包在中国公有云大模型份额464,比二三名之和还多。其次,字节坚持自研,没跟风投资AI六小龙。为啥?AI行业人士分析,阿里腾讯撒网式投资,是因资金雄厚但不够笃信大模型颠覆性字节不同,从高管到业务一号位,一致同意自研。客户需求多元,评价模型几十个维度,豆包在数据分析离线抽取聊天对话等强于DeepSeek R1,自研让路越走越宽。大模型浪潮下,AI为企业开新增长空间,中国移动互联网用户见顶,监管侧重产业互联网。字节构建自研体系服务器操作系统芯片SaaS,影响生态重构进度。毕功于一役,避免资源分散。云业务烧钱赚辛苦钱,需要决心和耐心。AWS阿里云熬多年才盈利,字节也得靠点运气。深层上,字节强化定位不再是娱乐平台,而是科技公司。对标亚马逊,一边卖广告,一边卖云。火山引擎肩负字节科技蜕变的使命。昆仑万维周亚辉私下说,字节志在科技巨头。这背水一战,关乎公司基因重组。总结一下,敢想老田我认为,字节的AI云战役是场豪赌。火山引擎的逆袭,靠的是技术开放价格策略和Agent布局。但未来挑战不小对手如云,市场瞬息万变。字节能否改写规则?咱们拭目以待。这场脱口秀就先到这儿,大家有啥想法,欢迎留言讨论!

6个月前
8分钟
三大云巨头集体瘫痪!谷歌云全球宕机三小时,互联网陷入瘫痪漩涡

三大云巨头集体瘫痪!谷歌云全球宕机三小时,互联网陷入瘫痪漩涡

今天咱们来聊个惊天大事件!昨天晚上,我正悠闲地刷着社交媒体,突然发现整个互联网都乱套了。不是开玩笑,三大云服务巨头AWS谷歌云Azure,再加上网络安全大亨Cloudflare,居然在同一时间集体宕机了!网友们炸开了锅,有人高呼互联网要废了,各种服务中断报告像雪片一样飞来。这场大崩盘可不是小事儿,它掀起了多米诺骨牌效应,让全球企业用户叫苦连天。今天,我就带大家深入扒一扒这场灾难的来龙去脉,看看背后的教训和那些让人哭笑不得的段子。这事儿发生在北京时间昨天晚上,具体点说,是太平洋夏令时6月12日上午11点左右。当时,我在X平台上看到一堆用户吐槽,说AWS谷歌云Azure和Cloudflare的服务突然全挂了。宕机追踪网站Down Detector的数据瞬间飙升,谷歌云报告了超过13000起事件,AWS那边也闹了约5000起,Azure虽然少点,但也不甘落后。最搞笑的是,微软和AWS的官方状态页面还显示一切正常,这简直是自欺欺人嘛!与此同时,Character AI和OpenAI的ChatGPT也跟着遭殃,OpenAI官方在社交媒体上承认,单点登录出了大问题,工程团队忙得焦头烂额。还有Gemini Pro和Cursor这些AI工具,用户反馈错误连连,真是雪上加霜。谷歌云作为这场大戏的主角,宕机最惨烈,足足持续了三个小时。太平洋夏令时上午1051开始,谷歌云的状态页面就亮起红灯,宣布多个GCP产品遭遇服务问题。影响范围之大,让人咋舌GmailGoogle CalendarGoogle DocsGoogle DriveGoogle Meet,甚至连Google Voice都没能幸免。Workspace产品全军覆没,用户连个邮件都发不出去。工程团队急得像热锅上的蚂蚁,却迟迟找不到解决方案。10多分钟后,谷歌更新说客户仍在遭受不同程度的影响,但修复时间未知。这感觉就像坐过山车,用户们只能干等着。终于,在太平洋夏令时下午1241,谷歌宣布找到了根本原因,采取了缓解措施。原来,问题出在身份和访问管理服务IAM上,导致底层依赖关系崩溃。谷歌报告说,除uscentral1地区外,其他位置开始恢复,但效果参差不齐。下午1400,他们又更新称在多个美国地区看到了恢复迹象,预计一小时内搞定。但别高兴太早,一些服务如Google Cloud Dataflow和Vertex AI还在挣扎,用户抱怨延迟和5xx错误。直到下午1827,谷歌云才正式宣布所有服务恢复正常。这三个小时的瘫痪,对企业来说简直是噩梦。想象一下,员工们不能协作办公,项目停滞,损失惨重。有用户调侃说这时间足够我刷完整部剧了!哈哈,但对企业来说,这可不是娱乐时间。宕机的影响远不止谷歌自家产品,它像病毒一样扩散到第三方服务。电子商务巨头Shopify是谷歌云的大客户,太平洋夏令时下午215左右,他们的Down Detector报告暴增,服务瘫痪持续了三个小时以上,后续问题还拖了好一阵。用户在X上哀嚎我的网店订单全卡住了,损失上万!Cloudflare更惨,他们明明是网络安全专家,却栽在谷歌云的依赖上。Cloudflare发言人在接受媒体采访时承认,少数服务因谷歌云中断而故障,包括Workers KV服务,导致AccessWARPRealtimeWorkers AI等产品歇菜。有趣的是,Cloudflare早在太平洋夏令时1119就报告问题,比谷歌还早,这说明他们先感受到了连锁反应。CTO Dane Knecht事后在X上道歉,说让客户失望了,承诺发事后分析报告。Cloudflare股价因此暴跌5,这经济损失可不小啊。为什么会出现这种大崩盘?公众猜测纷纷,Hacker News和X平台成了讨论热点。有内行爆料,问题可能源于谷歌内部的一个叫Chemist的服务故障。Chemist负责检查策略,比如项目状态和计费,它一瘫痪,整个GCP网络就乱套。用户评论说多个互联网服务都跟着倒了,Chemist像是引爆点。还有人提到Uber前员工Gergely的观察,他在宕机前两天就嗅到异常,看到ChatGPTHerokuNVIDIA等服务相继中断。他指出,GCP和Cloudflare同时宕机前所未见,因为Cloudflare一向以高弹性设计著称,这次却栽了。媒体The Register分析,这是经典的多米诺骨牌效应谷歌倒,Cloudflare跟着倒,最终客户受罪。网友们议论纷纷,有人惊叹Cloudflare产品居然这么依赖谷歌云,太意外了!还有人忧虑云服务巨头相互依赖,哪天互联网真崩了,我们连重启都不知道咋办。最幽默的是,Hacker News上有人调侃AI宕机前说AI是幻觉,宕机后才发现我们才是牛马!笑死我了,这讽刺真到位。当然,宕机背后还有深层原因。谷歌云部门在CEO托马斯库里安领导下,受益于AI热潮高速增长,但这次事件暴露了潜在问题。据CNBC报道Alphabet近期大幅降本增效,裁员销售和客户体验团队,甚至还推自愿离职计划,将部分岗位迁到印度和墨西哥城。这引发了成本削减导致服务不稳定的猜测。谷歌状态页面显示,宕机波及13个云服务区域,包括欧洲和亚洲。影响的企业名单长得吓人SpotifyAWS的TwitchCoreWeave的Weights  BiasesGitLabLangChain微软的GitHubReplit和Intuit的Mailchimp。宕机不仅打击谷歌声誉,还让其在云市场与AWSAzure的竞争中处劣势。企业用户纷纷反思过度依赖单一云服务是否明智?未来得多用混合云策略分散风险。总结一下,这场谷歌云主导的大瘫痪,给互联网上了生动一课技术巨头并非无敌,相互依赖可能变成致命弱点。作为敢想老田,我建议大家从中吸取教训企业应该多元化云服务供应商,个人用户备好离线工具。谷歌和Cloudflare的道歉和事后分析,希望能推动改进。不然,下次再崩,互联网真可能玩完!好了,今天聊到这里,下回见,记得保持冷静,别让AI牵着鼻子走

6个月前
7分钟
扎克伯格的豪赌Meta天价收购数据工厂背后的AI救赎

扎克伯格的豪赌Meta天价收购数据工厂背后的AI救赎

今天咱们聊聊硅谷最热门的八卦Meta那场148亿美元的疯狂收购。这事儿发生在2025年6月,扎克伯格大手一挥,买下了Scale AI的49股份,简直像在AI战场上扔了颗核弹。但各位,这可不是什么理性投资,更像是一场孤注一掷的救赎之旅。为什么这么说?听我慢慢道来。首先,背景得从Meta的AI败局说起。今年春天,他们推出了号称2万亿参数的Llama 4模型,结果呢?在第三方测试中直接翻车,代码处理一团糟,长文本推理更是惨不忍睹。扎克伯格气得跳脚,这不是王婆卖瓜吗?官方吹得天花乱坠,实战却成了吊车尾。为啥Meta反应这么剧烈?因为他们的AI路线和别人不同押注开源模型,想靠免费共享赢开发者心。可中国开源模型的崛起,像DeepSeek和阿里Qwen,直接把Meta从神坛上踹了下来。Llama不再是唯一选择,Meta开始掉队了。于是,扎克伯格急了。他重组AI部门,拆成AI产品和AGI基础两个团队,组建超级智能组,视之为最高优先级。但这还不够,数据荒成了致命短板。Meta旗下Facebook和Instagram有数十亿用户,生成海量数据,可这些社交数据质量太差。去年谷歌的AI概览就闹出笑话,推荐用户用胶水固定芝士或吃石头补充营养,就因为AI采信了Reddit的搞笑帖。这就叫垃圾进,垃圾出低质数据让AI输出匪夷所思的结果。所以,Meta急需数据标注来清洗这些毒数据。数据标注是什么?简单说,就是给图片文本打标签,让计算机能理解。比如标出行人车辆,或判断语音语气。听起来高大上?实则不然,这活儿技术门槛低到初中生都能干,纯属赛博搬砖。Scale AI的核心竞争力就是24万廉价劳动力在肯尼亚和菲律宾当数字工人,每小时工资可能就几美元。Meta员工呢?平均年薪30万美元,时薪144美元,让他们干这活儿简直是暴殄天物。所以,花148亿买Scale AI看似合理Meta用钱换时间,省下人力去搞更高端的事。但各位,这里有个大坑。DeepSeekR1模型的横空出世,让数据标注的价值大打折扣。这个中国模型证明了无监督微调,通过强化学习也能实现卓越推理能力。监督微调是啥?就是用标注数据调整模型适应任务。如果不需要它,标注工作就可能过时。Scale AI创始人年初歇斯底里攻击DeepSeek,就是因为这直接威胁他们的饭碗。现在业界主流是RL为主监督微调为辅,追求博士级专家标注的高质数据。除非DeepSeek路线失败,否则Meta这笔钱可能买了个没落独角兽。说到底,扎克伯格这次举动像病急乱投医。148亿美元买Scale AI,就为缓解数据荒,训练更大Llama模型。但值不值?Meta现金有720亿,这笔投资对他们不算伤筋动骨,但风险巨大。当年10亿收购Instagram是妙手,这次却是豪赌。如果DeepSeek继续领先,Meta可能竹篮打水一场空。可换个角度看,AI竞赛如火如荼,OpenAI刚收购io,Meta不能坐以待毙。这收购至少能短期止血,让Meta在数据上不掉队。朋友们,AI的世界就是一场疯狂游戏。扎克伯格在赌未来,我们呢?作为普通人,这提醒我们高质量数据才是AI的命脉,低质信息只会滋生荒谬。Meta的故事告诉我们,技术创新永无止境,但盲目跟风可能付出天价代价。我是敢想老田,下期再聊硅谷新瓜。记住,AI不是魔术,它需要真实清洁的数据否则,下次你的AI助手可能真建议你吃石头了。各位,思考起来,别让我们的数据变垃圾

6个月前
4分钟
人形机器人通用大模型的破局者智在无界如何用互联网视频解决数据稀缺之困

人形机器人通用大模型的破局者智在无界如何用互联网视频解决数据稀缺之困

今天咱们来聊聊一个话题人形机器人!你瞧瞧,现在AI圈里啥都敢吹,动不动就说机器人要统治世界,结果呢?搞半天,连个简单的家务活都干不利索,动不动就给你来个翻车现场。为啥?核心问题就俩字数据!没数据,机器人就像没吃饱的孩子,软趴趴的啥也干不了泛化差,又让它像只没头苍蝇,遇上新环境就懵圈。今天,我就带你们走进一家公司智在无界,听听他们怎么用互联网视频这把万能钥匙,把这矛盾给解了。准备好没?走起!话说回来,数据稀缺这问题,可真不是小事。咱们想想,要让机器人像个真人一样行动,得喂它海量数据,从拿杯子到开冰箱,样样都得练。可现实呢?采集数据简直是噩梦!派真机去扫街?人力成本高得吓人,存储费用蹭蹭涨,比养个娃还烧钱。更糟的是,即便数据堆成山,机器人一遇新环境就露馅儿比如教它在厨房端盘子,换个餐厅就傻眼,盘子摔一地。这不就是典型的纸上谈兵嘛!泛化能力差,让实用化成了空谈。老田我见过太多AI项目卡在这儿,投资人砸钱砸到手软,用户抱怨满天飞,真是尴尬癌都犯了。好,现在主角登场智在无界。这家北京公司,2025年1月才成立,但创始人卢宗青可不是省油的灯。这位北大计算机教授,以前是智源研究院的大拿,负责过国家级智能体项目,团队里一堆智源老将,玩转强化学习计算机视觉机器人控制这些硬核领域。今年初,他们刚拿了数千万元融资,联想之星领投,智谱Z基金燕缘创投彬复资本跟投,势能资本当财务顾问。钱用哪儿?搞核心技术!卢教授告诉我,他们盯死了人形机器人的两大能力操作和运动,然后捣鼓出一套三层模型系统具身多模态大语言模型多模态姿态大模型和运动模型,外加一个自学习框架。听着高大上?别急,老田用大白话给你拆解。核心创新在哪?数据来源!传统路子靠真机数据,费力不讨好智在无界呢?直接从互联网视频里淘金。YouTube抖音上跳舞做菜修东西的视频海了去,他们解析这些人类动作序列,教机器人模仿。比如看到人伸手端杯子,模型就学这连贯动作伸手抬臂抓取,再结合空间特征理解环境。这叫跨模态迁移从人类行为到机器人动作,无缝切换。他们研发的Video Tokenizer技术更绝,把视频流切成时空视觉token单元,精准捕捉逻辑。比方说,第一人称视角下抓苹果,模型能推理出方位变化肢体协调,不像其他模型那样瞎蒙。这路子省了真机采集的麻烦,数据丰富又多元,成本大降老田觉得,这简直是白嫖互联网的智慧!但光有预训练不够,泛化咋提升?智在无界祭出RetrieverActorCritic框架,用检索增强生成RAG加强化学习搞闭环。简单说,就是让机器人从真实交互中学习反馈,不断优化。例如在动态厨房环境里,它遇到新干扰能自主调整,而不是死记旧套路。卢教授强调,这种预训练加后训练架构,避免硬件迭代导致数据浪费,真机数据稀缺和场景泛化这对死对头,终于握手言和。现在他们正跟头部厂商合作验证,老田预测,这技术路径能让机器人从实验室花瓶变成实用帮手。投资方也嗨了。联想之星的高天垚夸这套框架模块化全栈能力,解决泛化和跨本体问题智谱Z基金的王璞更激动,说团队建了MotionLib数据集,开发BeingM0模型,把文本指令变精细动作,推动机器人进千家万户。老田听着这些,忍不住吐槽现在AI圈吹牛的多,做实事的少,但智在无界这步棋,真算得上是破局了。为啥?因为数据瓶颈卡死太多项目,他们用互联网视频这招四两拨千斤,低成本高效益简直是营销鬼才的灵感!展望未来,老田觉得人形机器人商业化不再是梦。智在无界这技术,可能撬动医疗家政工业等领域,让机器真正活起来。但这路上还有坑伦理问题别忽视,别让机器人变监控工具用户体验得优化,别整得像冷冰冰的机器。总之,卢宗青团队的创新给行业打了强心针,老田我作为营销老炮,就一句建议脚踏实地,少炒作多落地!听众朋友们,你们怎么看?欢迎留言唠唠。好了,今天先到这儿,我是敢想老田,下回再聊更劲爆的!

6个月前
5分钟