AI时代的产品经理手册
Technology
Education
Courses

AI时代的产品经理手册

作者: PM熊叔
最近更新: 2024/4/26
<p style="color:#333333;font-weight:normal;font-size:16px;line-height:30px;font-family:Helvetica,Ari...

Recent Episodes

一起微调llama3,做自己的大模型!

一起微调llama3,做自己的大模型!

随着Llama 3的发布,国内各路英雄豪杰纷纷开启了炼丹之旅。Llama-3 8b在惊人的15万亿令牌上训练,而Llama-2仅为2万亿。毋庸置疑,Llama 3目前是开源大模型中能力最强的!其跑分成绩已经赶上了GPT-4。然而,Llama3的优势不仅限于此。作为开源大模型,每个人都可以对其进行个性化的定制,这意味着相比GPT,它具有更强的定制性和安全性。另外,Llama3 8B的模型可以在内存只有8G的树莓派上运行,对于计算机资源的依赖比以往都要低,人人都可以本地部署Llama3,可应用于针对B端企业和各种场景下的自然语言处理、机器翻译、文本生成、问答系统、聊天机器人等场景。目前,我们主要通过微调(Fine-Tuning)来定制所需的模型。例如,Llama 3原生不支持中文,但我们可以通过微调让它支持中文。什么是微调(Fine-tuning) ?这是机器学习和深度学习中的一个术语。它指的是在预训练模型的基础上,使用特定任务的数据集进行额外训练的过程,目的是让模型更好地适应特定的任务或问题。通过微调,我们可以调整模型的参数,使其更精准地解决特定问题。就像一个已经非常了解世界的成年人。现在,我们需要它去学习一些更专业或更具体的知识。微调的过程,就像是对这个成年人进行一些专业培训,使其在特定领域更加精通。为了帮助大家更好的理解什么是“微调”,我前天写了一篇轻松的入门教程《Llama3微调教程:超简单,人人都可以打造属于自己的GPT!》:地址:https://mp.weixin.qq.com/s?__biz=MjM5NDIzOTg0Mw==&mid=2448257753&idx=1&sn=627c94e8b0d66bc9866ab4a42edaaa73&chksm=b29316d585e49fc312553b5efaca684af566be55237b8c4e2a1d9a472dd31f7ee74157c08163&token=1764237450&lang=zh_CN#rd就算你不懂技术也没有关系,通过这个简单的Llama 3微调案例,我们可以免费体验整个大模型微调的过程。你可以学习到AI工程师是如何进行环境配置、数据准备、模型训练、模型运行、模型保存以及本地模型使用。这对于大多数普通人来说,这是一个免费体验AI工程师工作方式的机会;如果你想转入AI行业,这也是一个很好的入门案例。你可以通过我的微信公众号“PM熊叔”浏览。另外在Shownots中,我列出了目前已经微调好的Llama3作品,大家如果有兴趣可以体验一下。愿每个人都能从中受益,开启自己的AI探索之旅!以下是一些微调的llama3的作品:llama3-Chinese-chat-8b:https://wisemodel.cn/models/shareAI/llama3-Chinese-chat-8bInstruct + 进行中的中文sft版本:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary联通微调版本:https://www.modelscope.cn/models/UnicomAI/Unichat-llama3-Chinese/summaryOpenbuddy微调版本:https://www.modelscope.cn/models/OpenBuddy/openbuddy-llama3-8b-v21.1-8k/summary破解安全限制系列(目前仅支持英文):Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8Bneural-chat:https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b聊天机器人:https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8bBunny-Llama-3-8B-V(多模态图文版本):**https://wisemodel.cn/models/BAAI/Bunny-Llama-3-8B-V我的公众号:

2024/4/26
02:44
人工智能经典《苦涩的教训》聊聊背后的思考

人工智能经典《苦涩的教训》聊聊背后的思考

今天要介绍的这篇文章《The Bitter Lesson 苦涩的教训》是由知名计算机科学家,阿尔伯塔大学、DeepMind的神经网络专家Rich Sutton 在 2019 年发表的,主要讨论了在人工智能研究中一个重要的观察:当简单的算法能够利用大量的计算资源时,往往会胜过依赖于人类专家洞察力的复杂算法。在回顾AI历史上一些关键进展时,Sutton指出,虽然研究人员曾多次尝试通过设计复杂且模仿人类理解的算法来提升机器学习模型的表现,但通常更简单、更基本的方法,只要能通过增加计算能力进行扩展往往能取得更佳效果。他强调了规模和算力的重要性,并认为未来的研究应该更多依赖于扩算力,而非复杂的设计。OpenAI 在2021年的论文《神经语言模型的缩放法则 Scaling Laws for Neural Language Models》讨论了AI模型的性能如何随模型大小、数据集大小和训练计算量的规模提升而提升。今天,在缩放法则(Scaling Laws)的加持下,简单的Transformer架构让GPT等大语言模型涌现出了“智能”,也展示出了AGI通用人工智能的可能性。现在就让我们来读一读,回顾这篇经典文章。苦涩的教训Rich Sutton  2019年3月13日我们从70年的人工智能研究中可以得出的最大教训是,利用计算的通用方法最终是最有效的,而且差距很大。其根本原因在于摩尔定律,即集成电路上可容纳的晶体管数量每隔18-24个月会翻倍,从而使芯片性能指数倍增。大多数人工智能研究都是在假设智能代理可用的算力资源是恒定,在这种情况下,利用人类知识是提高性能的少数行之有效的方法之一,但在略长于典型研究项目的时间内,大规模的计算量又不可避免地会变得可用。研究人员寻求在短期内实现改进,试图充分利用他们对特定领域的人类知识来节省算力成本,但从长远来看,唯一重要的是利用计算资源。这两者不必相互对立,但实际往往如此。由于对一种方法的投资存在心理承诺,我们在一个东西上花费大量的时间,就不会在另一个上花费更多时间。而且,基于人类知识的方法往往会使方法复杂化,使其不太适合利用计算的通用方法。这些案例不胜枚举,我称之为苦涩的教训。作为人工智能研究者,我们学习这些教训是有指导意义的。下面,我们来回顾其中一些最知名的案例。在1997年,计算机国际象棋领域见证了一个历史性的事件——计算机通过大规模深度搜索击败了世界冠军卡斯帕罗夫。当时,大部分研究者都倾向于利用人类对棋局结构的深入理解来设计算法,这一失败让他们颇感挫败。当一个相对简单的基于搜索的方法,结合先进的硬件和软件展示出惊人效力时,依赖人类知识的方法显得力不从心。这些研究人员对于“蛮力”搜索的胜利持怀疑态度,认为虽然这次有效,但它并非一种普遍适用的策略,也不符合人类下棋的风格。他们曾希望能通过更贴近人类思维的方法取得胜利,因此对结果感到失望。计算机围棋的研究历程展示了一种类似的发展模式,但这一过程比其它领域晚了大约20年。初期,研究者们尝试通过利用人类的棋局知识和游戏特征来减少搜索需求,但随着搜索技术在规模上的有效应用,这些努力最终被证明是无效甚至有害的。同样,自我对弈的方式学习价值函数也显示出其重要性,这种方法不仅应用于围棋,在国际象棋等许多其他游戏中也同样适用,尽管在1997年首次战胜世界冠军的程序中,学习的作用不大。自我对弈不仅是学习的一种方式,它像搜索技术一样,使得可以利用大量计算资源。搜索和学习是利用大规模计算的两个关键技术,在计算机围棋和国际象棋的研究中,尽管研究人员最初依赖于人类的理解来减少搜索的需要,但最终还是通过采用搜索和学习技术取得了显著的成就。在语音识别领域,20世纪70年代DARPA主办的早期比赛中,参赛者采用了包括人类发音知识在内的各种特定方法,例如对单词和音素的认识。相对的,一些新的统计方法采用了更多的计算,并基于隐马尔可夫模型(HMMs)进行操作。结果显示,统计方法优于那些基于人类知识的方法,这一发现推动了自然语言处理领域的重大变革,并在随后的几十年中逐渐成为主流。深度学习在语音识别中的崛起标志着这一发展方向的进一步演进。深度学习方法较少依赖人类知识,而是利用大量计算资源,通过在庞大的训练数据集上进行学习,显著提升了语音识别系统的性能。研究人员原本希望开发出能模仿人脑工作方式的系统,并尝试将这种理念应用于他们的系统设计中,但这种方法最终被证明是适得其反,甚至是对时间的浪费。尤其是在摩尔定律推动下计算能力大幅提升并找到有效利用方式的背景下,这种做法更显得没有必要。计算机视觉领域也遵循了相似的发展模式。在早期,研究者们试图通过识别边缘、圆柱形等广义结构,或使用SIFT特征来处理视觉信息。然而,这些方法如今已被淘汰。现代的深度学习神经网络主要采用卷积技术和某些类型的不变性处理,并且在性能上有了显著提升。这一趋势给我们的教训是深刻的。作为一个领域,我们似乎还没有完全吸取这一教训,因为我们依然重复着相同的错误。要真正理解这些错误的诱惑,并有效地避免它们,我们需要认识到依据我们所认为的思考方式构建方法最终可能不会奏效。这是一个我们必须接受的苦涩教训。从这些历史经验中,我们汲取了一些重要教训:1 )人工智能研究人员经常尝试将人类的知识整合到他们的智能系统中。2) 短期内,这种方法似乎总是有益的,并且能给研究人员带来满足感,但长远来看,它可能导致发展停滞,甚至阻碍进一步的创新。3) 真正的突破通常来自于完全相反的策略,即通过扩展搜索和学习能力来充分利用计算资源。尽管成功令人欣慰,但这种成功往往带有苦涩,因为它是在放弃了受青睐的、以人为中心的方法后才实现的。从这些经验中我们应该学习到的第一个重要启示是,通用方法的强大力量在于其扩展性,即使在可用计算资源极大增加的情况下也能持续有效。搜索和学习是目前看来能在这种环境下无限扩展的两种方法。第二个重要启示是,关于大脑的实际工作原理的极端的复杂性;我们应该放弃试图以简化的方式来理解大脑的工作,如简单地处理空间、物体或对称性等。这些概念都是外部世界中复杂性的一部分,本质上是难以简化的。试图将这些复杂性内置于系统中是不切实际的。相反,我们应该专注于内置能够探索并捕捉这种任意复杂性的通用方法。这些方法的核心优势在于它们能找到有效的近似解决方案,但寻找这些解决方案的过程应该是自动的,而不是依赖于我们的直接输入。我们希望人工智能代理能够自主探索和发现,就像我们一样,而不是仅仅复制我们的现有知识。将我们的发现硬编码到AI系统中,不仅限制了系统的学习潜能,还加重了我们理解这些发现过程复杂性的困难。观点Rich Sutton《苦涩的教训》原文到这里就结束了,我想聊聊我自己的观点和感悟:人类总是习惯将自己对于世界的认知注入于亲手打造的系统之中,但是历史一次又一次的证明这种有效性只是短期的,从地心说到日心说,从经典力学到量子力学,从专家系统到大语言模型,当每一次科学革命到来之时,那些越是符合直觉的经典理论越是岌岌可危。《金刚经》有云:“一切有为法,如梦幻泡影”,我们当前观察到现象和规律,可能都只是暂时的。那这个世界运转的逻辑到底是什么?设想一下,如果你是这个宇宙的程序员,拥有无穷的时间和算力资源,你会如何设计这个世界? 智能设计论者说:沙漠中不会凭空产生精美的手表,所以精密的人体一定是被有意设计出来的。但是你作为一个想要摸鱼的程序员,其实对于细致入微的设计全宇宙中所有的生命体可能并没有太大兴趣,你只关心能否用最简单的算法让DNA持续地演化,演化出智能体,再让他们做那些你不想做的事情。遵循“缩放法则(Scaling Laws)”依然是你最佳的选择,因为你不用操心这个宇宙的每一个角落的细节,你只要设计最基本的法则,并允许系统在这些法则指导下自我组织和进化,剩下的事情交给无限的时间和算力就好了。正如480年前,哥白尼坚信上帝相信简洁优雅的规则,因此有了日心说:“天体运动的真实模型应该是基于数学的完美和简洁,而日心模型相比地心模型在数学上更为简洁和优雅”。而今天,AI领域的进展告诉我们“简洁优雅的数学模型”依然有效,只要简洁的设计和上大尺度的数据训练,就能拥有强大的鲁棒性和智能性的系统。佛法有云:“缘起性空;自见成佛”。这可能才是我们这个世界的本来面目。欢迎订阅我的播客和知识星球。

2024/4/17
10:57
聊聊Mixlab Node:AI时代如何重塑内容创作产品与社区生态

聊聊Mixlab Node:AI时代如何重塑内容创作产品与社区生态

前天,我参加了洪宇的《遇见AIer》的播客节目的录制,聊了聊ComfyUI的Mixlab Node背后的故事和AI产品经理关心的一些话题。如果感兴趣,大家可以去听下这期节目。# 缘起2023年10月,我和Shadow一拍即合,共同发起了“ComfyUI中文爱好者社区”,并把Mixlab Node纳入了议程。目前,社区已聚集了超过1000名ComfyUI创作者,包括行业内的ComfyUI大咖。Mixlab Node目前已获得600多个星标。https://github.com/shadowcz007/comfyui-mixlab-nodes我和Shadow都对AI创作工具及社区抱有浓厚兴趣。去年,我们见证了AnimateDiff和ComfyUI的崛起,并意识到国内迫切需要一个ComfyUI学习社区。这不仅为AI创作爱好者提供了一个交流和学习的平台,也吸引了一批热情的开发者和创意人才来共同开发ComfyUI的插件和工作流,这也促成了Mixlab Node的诞生。# 社区驱动型产品简而言之,Mixlab Node是基于Stable Diffusion和ComfyUI构建的节点工具。它的核心特色在于ComfyUI的高度灵活性,通过模块化设计让各种插件(或称为节点)能够无缝串联。这种设计使得用户可以轻松调用各类AI模型和处理模块,完成从图片生成到视频制作,甚至是接入大语言模型进行互动游戏的多样化工作流程。ComfyUI的开放性和模块化让开源社区的开发者能够迅速整合最新技术和模型到用户的工作流中,而我们的MixLab Node就是其中之一。Mixlab Node最大的特点就是“社区驱动开发”,在我们社群里面,开发者和创作者每天都会讨论大量的新技术动态和使用需求。我们的功能往往源自社区内部的实际反馈,确保了产品的实用性和创新性。例如,Mixlab Node加密功能正是基于社区反馈而生。当时我们社群中的一些大佬的工作流被一些人冒名顶替,引起了社群内的广泛关注。开源并不是做慈善,一个良性的生态环境,既要开放共享又要尊重个人创作权益,这样开源才有持续发展的动力。所以我们想有些工作流只有通过原作者提供密码才能继续使用。通过这种方式,不仅可以让创作者的原创作品免受盗用,还可以让优秀的创作者更好地活下去。相似的案例不胜枚举。Mix Node正是在这样一个开放、共享的环境中不断成长和优化的。通过与社区成员的紧密合作,形成了一个积极的、自我增强的闭环系统。这不仅推动了MixLab Node不断完善和进步,也为开源的AI创作贡献了自己的一份力量。# JUST DO IT的开发模式我和Shadow的首先达成的共识是,在AI时代我们必须要抛弃掉传统的思维方式。在传统的软件和互联网产品开发过程中,从需求收集到产品发布通常需要经历多个步骤,包括需求分析、文档撰写、评审会议,以及最终的开发迭代,这一系列过程往往耗时长达数周,然而,由于AI技术快速迭代,这种模式很难跟上技术进步的步伐。我们更提倡“Just do it”——有好的想法,那就先做了再说。我们直接从社区收集到好的创意就可以开始动手做开发,不需要给领导写报告,不需要撰写需求文档,更不需要走评审流程,做好后交给社群中的小伙伴们测试反馈。只有这样我们才能打造出更酷的节点。另外,通过使用GPT,可以把开发的时间极限压缩。例如,我们在GPT的帮助下,只花了1到2天内完成录屏工作流的开发和上线,这放在传统企业,起码两周才能搞定。录屏的需求的灵感来源于我们自己的创作视角的切换,我和Shadow都曾做过设计师,我们都想把自己的草图让AI重新渲染,但是主要的创作工具都在PS等传统软件上 ,因此想了个录屏功能,然后再考虑如何通过技术手段来实现。最后,我们发现录屏节点搭配LCM模型可以快速将草图变成精美的图片,这个功能出了以后,社区里面创作者也反馈非常积极,得到了很好的验证,也给我们带来了极大的成就感。“Just Do It”模式并不完美。随着MixLab Node功能的不断丰富,产品逐渐变得庞大,这引发了关于用户认知清晰度的担忧。Shadow建议是先集中实现功能,然后再考虑精简和优化。我们最终的期望是提供更完整的软件产品体验,而不仅仅是单一功能的模块。虽然初期采取“Just do IT”的策略有其必要性,但随着时间的推进,我们也会考虑如何降低用户的学习门槛。因此,在接下来的发展方向上,将包括开发教程和案例,帮助用户更好地理解和利用MixLab Node,同时也探索新的商业模式以确保项目的可持续性。# AI赋能个人成长在开发MixLab Node过程中,ChatGPT和GPT-4在提升开发效率中起到了关键作用。我以前做过前端开发,熟悉Javascript,但是对于Python一直都是一知半解。从前要掌握新的技术领域,我通常需要购买在线课程或书籍,先自学清楚然后才能动手实践。但是今天,我们只要向AI提出功能描述,它就能生成代码。通过持续地调试和优化,我们就可以实现所需要的功能。这种方法极大地缩短了学习与开发周期,仅仅三年前,这样的场景还是难以想象的。通过与AI工具的协作,即使是非专业程序员也能拓展自己的技术领域,提高对新技术的适应能力和问题的解决能力。在未来,真正能够称之为“精英”的,将是那些具备鲁棒性和深刻业务理解的人。鲁棒性也是称之为说泛化能力,是指你不会将自己限定在特定的岗位角色中。通过有效利用AI,你可以跨领域地解决问题。此外,深刻业务理解能力也依然重要,这样你才能识别并聚焦于有价值的真问题。这样全面的技能和视野,将使你在AI时代中突破重围,不仅仅是完成别人给你的任务,而是成为解决关键问题的关键人物。# 成为AI产品经理首先,无论是哪个领域的产品经理,基本功是必不可少的。这包括但不限于对需求的深刻分析与洞察、对用户和产品的深入理解。这些技能对所有产品经理来说都是共通的。当然,AI领域的特殊性在于,你需要对底层的技术手段有所了解,了解它们的潜力和限制。其次,运用AI能力不能异想天开。许多人有过高的期待,认为AI可以做到任何事,但实际上它的能力是有限的。我们需要理解这一点,并能基于此制定合理的产品策略,是AI产品经理的重要技能之一。因此 ,产品经理需要掌握目前流行的AI工具和“提示工程(Prompt Engineering)”。因为在AI的世界里,你需要知道如何与AI进行有效地交流,才能扮演好“用户与AI之间的桥梁”。更重要的是,当AI的回答不尽如人意时,需要知道如何调整你的产品方案,让它能获得更好的结果。这背后的逻辑和优化技巧,是很多传统产品经理所缺乏的。然后,培养自己的对社群的感知能力。AI产品的开发和迭代,往往需要用户的直接参与和反馈,需要建立和维护一个活跃的创作者社群。只有更接近用户,更好地理解他们的需求和期望,从而共同创造出更符合用户需求的产品。AI产品经理不仅要有坚实的基本功,还要懂得如何与AI合作,如何与用户合作,搭建AI与用户的桥梁。我相信,只要你愿意不断学习、实践并保持开放的心态,你一定能在AI时代的产品管理领域中找到属于自己的位置。# 尾声在这个迅速变化的时代,开放的创新文化和社区的集体智慧将成为推动技术前进和个人发展的核心力量。这不单单局限于开源AI工具或社区的构建,而是关于在AI的浪潮中我们如何持续创新、适应变革,并推动个人的成长。我们不仅需要重新审视传统的开发模式、学习方法和工作理念,还思考如何作为个体和社区共同前进。这对于任何在快速演进的世界中寻找自己定位的人来说都是深刻的思考题。我们不仅只是学会适应,还需要积极参与到变革过程中。我们既是技术进步的贡献者,也是个人及社区繁荣发展的推动者。欢迎加入“ComfyUI中文爱好者社区”!

2024/4/8
09:56
AI时代,程序员会失业吗,还需要学习编程吗?

AI时代,程序员会失业吗,还需要学习编程吗?

最近越来越多人在问类似的问题,AI都那么厉害了,还需要学编程吗?计算机专业依然吃香吗?特别是昨天很多人看到了Devin AI,更是产生了一种“是不是程序员要失业了?”的疑问。# AI 程序员能做什么?就在前几天,仅仅成立两个月的公司Cognition发布了一款Devin AI 的产品。它被宣传为史上第一款AI程序员。在演示中,Devin AI拥有自己的命令行、代码编辑器和浏览器等工具,可以自己制定计划、执行任务和解决问题,它可以独立完成整个软件的开发和构建的工作。另外,根据官方宣传,Devin甚至拥有“成长”的能力,它可以通过阅读文章,学习原先不懂的技术,还会自主寻找程序中的错误,并且进行修正。从宣传来看,Devin要比之前Copilot类似的AI编程助手要更进一步,更像一个能够独立完成开发任务的程序员。这不仅代表着AI独立完成开发工作的可行性,也激发了公众对“AI是否能替代程序员”的讨论。也有网友分析,其实Devin AI并没有想象中的那么厉害:首先,Devin的底层技术是基于GPT4,它的使用成本比普通程序员更高;其次,程序员的面试题并不难,ChatGPT也能胜任;还有就是执行的任务过于简单,和人类相比还是有较大差距。所以,人类程序员目前还是比较安全的。虽然如此,但是随着大语言模型的性能越来越好,在可预见的未来,AI程序员必然将软件开发过程中起到关键性的作用。# 有了AI还需要学编程吗?会不会现在学了编程,以后就没用了?我想这个问题可以类比为“有翻译软件了还需要学英语吗?”我相信很多人回答是:学习英语依然重要。诚然,英语已经成为许多人综合素质的一部分了。翻译软件不能百分百解决我们的需求。例如,要查询最新最全的论文和资料,懂英语可以让我们无损获得原本的信息,而翻译软件只是方便我们快速的浏览和过滤信息的工具。另外,学习英语不仅仅是学习语言,也是学习一种文化和思维方式。这样我们才能更好地与世界接轨。同样的逻辑也适用于AI和编程。首先,编程只是软件开发的一部分,编程是打开计算机世界的一把钥匙,计算机科学的复杂性远远超出了编程本身。它包括系统架构设计、网络安全、需求分析、用户体验和项目管理等诸多方面。这些综合性的知识和技能,才是软件创新基础。即使AI能够自动化编程任务,也需要人类来解决更复杂的问题,需要人类保持对行业趋势的敏锐洞察,他们需要理解业务需求,与非技术背景的团队成员进行有效沟通,确保技术解决方案能够满足业务目标。另外,编程不仅仅是写代码,它是解决问题的一种方式,也是一种思维训练。学习编程能够帮助人们培养逻辑思维、系统思维、创新思维以及动手解决能力。这些能力在AI时代尤为重要,不仅限于技术领域,同样适用于生活的各个方面。随着技术的不断进步,新的工具和平台层出不穷,个人需要能够适应这些变化,还要能在变化中找到创新的机会。这种适应力和创新力对于个人发展、职业生涯乃至企业的竞争力都是宝贵的资产。除此之外,编程并不是计算机学科的专利,它也是一种跨学科学习工具。在尝试解决来自不同领域的复杂问题时,编程能够通过数据分析、可视化、机器视觉和仿真模拟等技术手段,帮助整合和应用多学科知识,从而促进创新解决方案的产生。这种跨学科的视角不仅拓宽了我们的思维,也为AI程序员的任务分配提供了更加清晰的指导。让我们能够从更综合的视角理解和应用技术,进而更有效地推进项目和研究工作的进展。其实,AI本身还有很多需要迭代的地方。例如,AI科研论文、设计AI算法、提升AI性能、定制AI模型以及AI伦理安全方面,人类依然扮演着无可替代的角色。换句话说,正是因为AI的发展,为计算机专业人才创造了更多的挑战和机会。对于准备想实现自己的想法人来说,现在是学习编程的最好时机,学习编程可以更好地应用AI的能力,帮助我们实现很多的创意和想法。因此,面对“有了AI还需要学编程吗?”这个问题,我的回答是:绝对需要。# 讲讲我的经历我大学是学工业设计的,算理工科中的文科专业。原本编程这件事情对我来说是一件很有畏惧感的事情,大学仅有一门C语言差点挂科。但由于我对于互联网一直感兴趣,还有自己做产品的冲动,所以我临近毕业的时候,去学习了编程和软件工程相关知识。而之后又做了程序员、产品经理还有创业者,一路走来,有挫折也有收获。过去,我经常刻意隐瞒自己做开发的经历,生怕别人认为我的职业定位不够专注。但是多年以后发现能帮助到我的恰恰是跨学科能力。如果今天你是一位想自主创业的产品经理,究竟学过编程和不会编程的人在做产品方面到底有什么区别?首先,学过技术的产品经理在理解技术层面的细节上有明显优势。能更好地与研发团队沟通,能更精确地传达需求,能更好地理解团队面临的挑战,并在技术可行性和资源分配方面做出更合理的决策。这种深入的理解有助于建立团队成员间的信任和尊重,从而促进团队合作和项目的顺利进行。在这些年里,我和大部分开发同事之间都维持着不错的关系,因为团队合作没有什么比理解更重要了。其次,具备编程背景的产品经理在设计产品时,能更好地考虑到实现的复杂性和成本,会更重视需求价值,可以更好地制定MVP(最小化可行性产品)策略。特别在产品的早期规划阶段,你就能预见到某些功能的实现可能会遇到的技术障碍,不会把产品功能设计得过于复杂或者理想化,从而在设计上做出更加现实和经济的选择。让产品赢得了低成本地快速验证市场的时间。这种前瞻性不仅能够节省开发时间和成本,还能避免在项目后期进行大幅度的修改,提高了产品开发的效率和成功率。再者,了解技术原理,也能够让我们更好地把控产品体验。会去主动思考影响产品体验的技术指标,不会想当然地做一些脱离实际场景的理想化的功能。通过能够更好地评估不同设计方案的技术实现难度,能在设计和功能性之间找到最佳平衡点。这样的产品经理能够推动设计和技术团队更紧密地协同工作,共同创造出既美观又高效的产品。此外,编程经验还赋予了产品经理对新兴技术的敏感度和适应能力。AI时代,新技术层出不穷,具备技术背景的产品经理拥有较强的技术的敏锐度,能够更快地理解这些新技术如何被应用到产品中,以及它们对市场和用户体验可能带来的改变。例如,我经常会去Github上查看一些有趣的开源项目,学习一些新的技术课程,也会思考如何把它们应用到自己的项目和工作中。这种能力使得产品经理能够领导团队走在技术发展的前沿,创造出创新和有竞争力的产品。最后,通过学习编程,我还获得了一系列强大的思维工具,包括面向对象的编程思想、设计模式、以及统一建模语言(UML)等。这些工具提升了我的逻辑思维和系统思考能力,教会了我如何将复杂问题逐步分解成可管理的小任务,帮助我们对问题进行抽象和建模,让我更好地理解事物的运转模式,从而找到机会点。这在产品规划、市场分析还是项目管理中,都极大地帮助了我。步入生成式AI时代,大语言模型已经成了我不可或缺的助手。以往有很多灵光一现的创意,因为我的技术视野的限制而无法实现,它们最终只能沉睡在我的思绪中,逐渐被遗忘。但如今,我的一些突发奇想的灵感交给了GPT之后,它能很快地生成代码。虽然代码可能充满了错误,但GPT帮我快速拓展了技术视野,引导我去深入研究,并让我能对代码进行细致优化。例如,我在ComfyUI的Mixlab-Node的开源项目的开发过程中,有很多想法的实现就是通过与GPT协作来完成。因此,作为一名独立开发者或产品经理,我们应当把AI程序员视作一位协作伙伴。正是因为有了它的帮助,让我们可以在实现更有趣的功能的同时,节省下更多时间,让我们可以用来考虑赚钱的事情。# 总结当我们面对Devin这样的AI程序员的时候,我们并不要为程序员岗位感到过于的担忧。编程将会变成像外语一样的普遍性能力,人类通过学习编程,我们可以更好地发挥机器的能力。在AI的帮助下,越来越多的普通人可以实现自己的创意和想法,成为自己事业的掌舵人。在AI时代,必然是超级个体崛起的时代。在传统企业管理中,员工们扮演的是流水线上的零件。但是在这个AI变革的新时代,我们不应当把自己角色局限在某个零部件上,拥有灵活的思维、开阔的视野和敏锐的洞察力显得更为重要。只要我们把握好时代趋势,技多并不会压身。请快行动起来吧!欢迎加入ComfyUI中文爱好者社区,ComfyUI是一套灵活的AIGC工作流搭建工具。目前我们集结了一群跨界的设计师、程序员 产品经理和创业者。我们正在探寻AI的生成技术在各行各业的解决方案,每日社群里面都会有高质量的讨论。

2024/3/21
11:17
SORA会是职业发展的革新引擎吗?【下】

SORA会是职业发展的革新引擎吗?【下】

窜台参与麦田老师的播客录制,欢迎大家订阅她的播客专辑《麦田的职场圆桌会议》AI能成为你的小情人吗?AI如何感知我们的情绪?科技飞速发展下,我们如何抓住机遇,而不被AI?本期播客带你深入探讨AI时代,我们该如何勇敢面对挑战,拥抱变革,用知识赋能自己的人生旅程!跟我一起思考,变得不可替代!【本期嘉宾】郝俊慧: 《IT时报》主编 资深媒体人  在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。鑫声心生  :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。      曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人02:01 AI的快速发展:挑战与机遇并存,我们应该怎么办?04:04 AI监管与安全性:全球共识的挑战与前景展望06:05 人工智能带来的变革:找到共识的挑战与前景展望09:03 人工智能工具的崛起对影视制作行业的影响及未来职业变革12:05 AI时代的创意表达:掌握AI技能,成为多功能手的可能性15:10 人工智能时代的个人成长:如何提升效率与竞争力?18:09 培养孩子独立思考能力:保持想象力与逻辑分析能力的平衡21:13 培养孩子立体人格:中学阶段学习的重要性与魅力24:15 通用能力与专业能力:职场中的人才选拔与培养27:18 培养孩子自主学习的能力:AI时代的关键竞争力30:20 拓展认知,提升独立判断能力,迎接人工智能时代挑战33:22 勇敢拥抱人工智能,迎接时代的变革!

2024/3/3
36:40
SORA会是职业发展的革新引擎吗?(上)

SORA会是职业发展的革新引擎吗?(上)

窜台参加麦田老师的《麦田的职场圆桌会议》欢迎大家订阅她的播客专辑。【本期嘉宾】郝俊慧: 《IT时报》主编 资深媒体人  在科技报道领域深耕近20年,长期关注互联网、信息通信、人工智能等前沿科技。《IT时报》是中国最早的通信类媒体之一,前身为《上海邮电报》,具有近60年的产业传播历史。鑫声心生  :化学博士,双一流大学材料学科博士生导师,喜马拉雅播客智库成员,在职业规划,前沿科技方面著有多部学术著作,喜马拉雅《七点早知道》、《消息拌饭》等栏目担任特约嘉宾。      曾主持多项国家与省部级科研项目,在国际高水平期刊发表论文50余篇,授权国家发明专利5项,受邀在国际学术会议作报告10余次,担任碳中和领域知名期刊Carbon Capture Science & Technology(碳捕集科学与技术)创刊编委。生物质产业碳中和技术联盟东北区负责人,国际碳捕集协会(IACC)执委。PM熊叔:产品经理/设计师/程序员,研究方向是AI创作工具和创作社区Mixlab无界社区和ComfyUI爱好者社区发起人【精彩观点】02:02 AI时代来临,对职业发展和创业的影响有多大?04:04 AI生成视频:从拼图到动画的突破之路06:06 SORA视频生成技术的突破:从拼图到现实世界的模拟器09:12 技术的飞跃:从三维建模到真实世界模拟的突破12:16 真相与谎言:人工智能改变我们对现实的认知15:19 职业规划与人工智能:拥抱变化,迎接挑战!18:23 人工智能时代下的专业型人才培养:挑战与机遇24:32 AI时代的就业挑战:如何寻找新的创意与发展机会?27:35 AI时代的独立思考与持续学习:文科生、程序员、咨询师的就业前景30:34 文科生的春天来了:人工智能时代下的新职业机会33:43 AI时代的共情能力:文科生的的优势与挑战

2024/3/2
37:21
给大家看的AI绘画教程:如何使用AI来设计炫酷的产品概念图

给大家看的AI绘画教程:如何使用AI来设计炫酷的产品概念图

这周,我的AIGC作品《赛博机甲AIPC笔记本》被比赛主办方联想官方账号转发和点赞了!真是万分荣幸!其实,使用AI绘图工具做产品设计并没有想象中的难。关于如何使用AI设计产品概念图,我专门写了一篇零门槛的教程,希望能够帮助大家参赛拿奖。学完这篇文章你可以掌握:1.了解目前有哪些好用的AI绘画平台2. 学习如何写提示词来设计自己的产品3.参加AIGC比赛,提升中奖概率现在,让我们马上步入正题。一、有哪些可以好用的AI绘画平台?无论是在线服务还是本地应用,AI绘画工具的多样化和易用性为创意表达打开了新的大门。从初学者到专业艺术家,每个人都可以找到适合自己的工具,将想象力转化为令人惊叹的艺术作品。在线使用的平台,主要有如下几个:1. Midjourney (https://www.midjourney.com/)   - 特点:极为优秀的AI绘画能力,但需付费使用。   - 是否有免费额度:否。2. DALL-E (https://labs.openai.com/)   - 特点:同样提供顶级的AI绘画服务,属于付费范畴。   - 是否有免费额度:否。3. Bing (https://www.bing.com/images/create)   - 特点:优秀的AI绘画工具,且完全免费。   - 是否有免费额度:有。4. Leonardo.AI (https://leonardo.ai/)   - 特点:提供良好的AI绘画体验,免费使用。   - 是否有免费额度:有。5. Mage.Space (https://www.mage.space/)   - 特点:良好的AI绘画能力,免费且提供多种模型选择。   - 是否有免费额度:有。6. 百度文心一阁 (https://yige.baidu.com/)   - 特点:支持中文   - 是否有免费额度:有。7.  阿里通义万象 (https://tongyi.aliyun.com/wanxiang/creation)   - 特点:支持中文,   - 是否有免费额度:有。总的来说,如果你想要有良好的创作体验Midjourney和DALL-E是最理想选择,其卓越的创作能力是业内公认的。而对于预算有限或希望免费体验AI绘画的用户,可以尝试BingAI的绘画生成能力,因为BingAI绘画接入的就是GPT的DALL-E。另外如果想体验稍微完整的AI绘图能力Leonardo AI也是不错的选择。如果我们受网络所限,百度文心一阁和阿里通义万象也是目前国内用户的选择。如果你更倾向于在本地设备上使用AI绘画工具的用户,首选 Stable Diffusion,主要有Auto11111的WebUI和ComfyUI。另外,还有一些开箱即用的客户端工具,例如,Draw Things和Diffusion Been等。二、如何撰写AI绘图的提示词?我们在使用Midjourney、DALL-E、Stable Diffusion等文本生成图像工具的时候,我们需要设计文本提示词(prompts)来指导AI生成图像过程,最终获得我们想要的效果。我们可以将AI想象为一名正在学画画的中学生,你现在正在扮演一位美术老师,为他布置作业。我们应该怎么出题呢?下面是一些方法:1. 需要明确具体:描述你想要的图像时,尽可能具体和详细,包含场景描述、物体、颜色、情感氛围、风格等。例如,我们出题的时候不说“一辆车”,而是说“一辆红色的跑车在沙滩上”。另外,需要尽量不要有抽象的隐喻,这位学生有可能无法理解。2. 使用关键词:使用关键词来描述图像的主要元素,如对象、颜色、环境、气氛,虽然有些比较聪明的学生(如Dell-E和Midjourney V6)已经可以理解完整的句子所表达的语义,但是关键词依然是核心。如果我们通过特定的关键词可以帮助AI更明确的表达,特别是一些艺术风格术语,如“印象派”、“超现实主义”或具体的颜色和纹理描述。3. 不要过于复杂:虽然要具体,但是过于复杂的提示词可能会使模型难以理解和执行,我们需要找到描述清晰具体但又不过分复杂的平衡点。4. 渐进式迭代:不用一次到位,我们可以通过实验和调整描述来获得更好的结果。5. 结构性陈述:好的提示词包含不同方面的描述,如主题、媒介、风格、艺术家、细节、颜色和光照等等,如果我们遵循一定的结构,我们可以写出更明确具体的提示词,帮助这位考生更好地理解你的需求。下面是一个比较常用的提示结构:Prompt = (主体内容) + (环境设定) + (气氛/灯光) + (构图) + (风格参考)1. 主体内容:一款未来风格的电动汽车。基础:一款电动汽车。基础+修饰:一款具有流线型设计的电动汽车。基础+进一步修饰+画面故事:一款流线型设计的电动汽车,在光滑的公路上高速行驶,车身表面反射着周围的城市光线。2. 环境:车辆行驶在一条现代化的高架桥上,背景是一个繁华的未来都市,高耸的摩天大楼和光滑的玻璃幕墙反射着夜晚的灯光。3. 气氛:一种科技感和速度感的结合,展现出未来交通的便捷和高效。4. 灯光:选择高对比度的照明,强调汽车的轮廓和流线型的设计,同时反映出城市的繁华夜景。5. 色彩:使用富有科技感的冷色调,如银灰色、深蓝色和白色,以突出未来感和清洁能源的概念。6. 构图:采用动态的角度,如斜视角或低角度视图,以强调汽车的速度和运动感。7. 风格参考:参考现代汽车设计和科幻电影中的未来城市景象。最后,我们将这些描述的关键词整合成一段文本描述:电动汽车,流线型设计,高速公路,未来城市,夜景,摩天大楼,光滑玻璃外墙,高对比度照明,冷色调,科技感,银灰色,深蓝色,白色,干净能源,动态视角,斜角,低角度视图,现代汽车设计,科幻电影风格。如果使用国外的平台,我们可以使用翻译软件将提示词变成英文:Electric car, streamlined design, futuristic city, night scene, skyscrapers, smooth glass facades, high-contrast lighting, cold color tones, technology theme, silver-grey, deep blue, white, clean energy, dynamic perspective, oblique angle, low-angle view, modern car design, sci-fi movie style这里是我在Mage.Space的使用SDXL模型效果如下图:如果条件有限,你可以尝试国内的平台,像百度文心和阿里通义都支持中文,下面是我这两家平台生成的效果,如果有兴趣可以点击查看大图。三、如何使用AI进行产品设计?当我们要做产品设计的时候,我们需要对上面的基本结构拓展:Prompt = (产品功能 + 风格外观 + 材料构造 + 特殊要求 + 设计灵感)+ (环境设定) + (气氛/灯光) + (构图) + (表现风格)首先,我们的产品主体描述需要更加具体,可以包含面几个维度:产品功能:描述产品的主要用途或功能。风格外观:指定设计风格或外观特征。材料构造:提及所使用的材料或构造方法。特殊要求:任何特定的设计要求或限制。设计灵感:参考某些著名产品或设计的风格特征。另外,我们可以加上一些工业设计常用表现手法:3D渲染风格、CG渲染、手绘、马克笔、彩色铅笔、设计草图等,下面是不同的表现手法。内容主体: 1. 产品功能:AI强大个人助理笔记本电脑 2. 风格外观:融合《新世纪福音战士》初号机的设计元素,动态棱角设计,霓虹绿和紫色高光 3. 材料构造:光滑金属外壳,带有在不同光线下变色的异彩效果 4. 特殊要求:先进的全息触摸屏技术,3D全息交互 5. 灵感参考:高科技的个人电子设备,科幻电影中的设备,如《银翼杀手》中的未来科技表现风格:CG渲染、高科技、未来感环境设定:高科技的未来实验室,多面全息显示屏,浮动的交互式面板,赛博朋克风格的未来城市背景气氛灯光:神秘的蓝色和紫色背光,营造出高科技和未来感的氛围构图:高角度俯瞰,笔记本电脑位于中心,周围环绕着先进的设备和充满活力的城市景观我们得到以下提示词:未来风格AI强大个人助理笔记本,融合《新世纪福音战士》初号机设计元素,动态棱角设计,霓虹绿紫色高光,光滑金属外壳,异彩变色效果,先进全息触摸屏技术,3D全息交互,高科技未来实验室,多面全息显示屏,浮动交互式面板,赛博朋克风格未来都市背景,神秘蓝紫背光,高科技感,未来感,高角度俯瞰,中心位置笔记本,周围环绕先进设备和动感城市景观我们可以使用翻译软件将提示词翻译成英文:Futuristic AI-powered personal assistant laptop, integrating design elements from Neon Genesis Evangelion's Unit-01, dynamic angular design, neon green and purple highlights, sleek metal casing with iridescent color-changing effect, advanced holographic touchscreen technology, 3D holographic interaction; set in a high-tech future laboratory with multi-faceted holographic displays, floating interactive panels, against a cyberpunk-style futuristic city background; mysterious blue and purple backlighting, high-tech and futuristic atmosphere; high-angle overview composition with the laptop at the center, surrounded by advanced equipment and a dynamic cityscape下图OpenAI的DALL-E的生成结果,这是目前表现最到位作品,我们不得不佩服业界顶流的创造力。这个是Stable diffusion的SDXL模型生成的结果,虽然环境氛围表达到位了,但是缺少创造力。百度文心和阿里通义万象,效果大家自行评价。百度文心:https://yige.baidu.com/阿里通义万象:https://tongyi.aliyun.com/wanxiang/creation另外,优秀好的作品介绍也很重要。我们可以使用ChatGPT或百度的文心一言来帮助我们写设计介绍,将这个文字复制给大语言模型:请扮演一位网络营销高手,帮我写条微博,要求请根据以下产品的描述,从这款作品的作者的角度介绍作品```[这里写上你刚刚在创作过程中使用的Prompt...]```四、参加比赛,准备拿奖目前,联想正好在做一个AI PC的设计比赛,奖品还不错,而且作品提交次数没有限制,非常适合我们这些掌握AI绘图的普通人参赛。关于这个活动介绍,请参看我们之前相关的文章:2024年会否进化为 AI PC 产业元年?Mixlab&WebN 喊你来组队比赛,奖品如下:一等奖 1 位ThinkPad X1 carbon AI 超级本 2024二等奖 3 位联想小新 Pro16 AI 超能本 2024三等奖 10 位 价值 1999 AI 礼包荣誉奖/最具传播力  5 位 价值 999 AI 礼包为了更好的帮助大家,我们专门搭建了专门为大赛文生图服务,你也可以尝试通过这个服务来体验文生图的魅力,文末有扫码入群,免费使用:然后,我们把作品和介绍发到微博或者小红书,记得带上:“#一起联想AIPC#” 并 “@联想中国 ”。最后,为了提升中奖几率,我们可以把微博地址发群里,让大家一起点赞、评论、转发!最后,欢迎大家加入我们的比赛互赞群。如果你有兴趣学习更具有专业性的AI绘画技能,欢迎请加入我和Shadow发起的ComfyUI的知识星球。

2024/1/14
09:35
AI时代下的超级个体:与Rui畅聊AI实时互动游戏

AI时代下的超级个体:与Rui畅聊AI实时互动游戏

上周日,我、Shadow和Rui做了一次在线连麦的直播,背景是Rui在上周发布并开源了一款名为《西游大绘战》的AI实时互动游戏。这款游戏在我们ComfyUI中文社区产生了轰动,许多人都没有想到ComfyUI还能这样玩。Rui的工作流发布地址:https://openart.ai/workflows/profile/rui400# 什么是AI实时互动游戏?AI实时互动游戏,主要是以大语言模型为核心驱动,用户通过与游戏实时互动生成具有无限可能性的剧情。AI实时互动游戏不仅限于文字,还可以结合Stable Diffusion图像生成能力,创造一个丰富的多模态游戏世界。Rui在《西游大绘战》的开发中,利用ComfyUI的节点整合GPT、SD模型和TTS等AI技术,创造了具有独特游戏体验的Workflow(AI工作流)。也再次证明了ComfyUI的灵活性和无限可能性。他首先利用 GPT 生成每一话的故事文本和选择,同时,将故事文本转换为自然生动语音,增强了玩家的沉浸感。另外,还通过GPT生成Stable Diffusion的Prompt(提示词),用于创造游戏故事场景对应的画面,使得游戏画面能够根据玩家的选择动态变化。但将AI技术融合到这种全新游戏设计中也面临了诸多挑战。对于如何处理和控制好AI生成的内容,Rui需要学习大量的跨领域知识,做大量的技术调研,并且还需要像工程师一般不断调试Prompt和参数,才能把控好自动生成的游戏体验。# AI时代下的“黑客与画家”在保罗格雷姆的《黑客与画家》书中,提到了黑客与画家的诸多相似性:他们都是伟大的创作者,但伟大的作品并不都是事先严密设计好的,他们为了实现一个创新的灵感,能够反复调试和打磨,他们不会因为困难而退缩,他们总能找到常人不曾想到的解决方案,在作品完成的那一刻就注定了它的杰出和伟大。面对如此超前和复杂的游戏项目,Rui在《西游大绘战》项目中一个人扮演了一个团队的角色,从策划、设计再到开发制作。但令人惊讶的是,作为一名有十几年游戏原画设计经验的设计师,Rui之前并没有任何编程经验。今年随着生成式AI的技术崛起,在SD和ComfyUI影响下,游戏行业正在使用AI工作流快速地生成原画设计来提高设计创作的效率,为游戏行业带来了颠覆性的变革。对于很多传统设计师来说这可能是个威胁和挑战,但Rui意识到这是一个转型和探索新领域的机会。他开始研究如何将AI技术融入游戏设计。Rui制作的Workflow堪称艺术作品,为了达到精细的效果,使用了大量的高级节点和控制流程,将技术与艺术完美地结合在了一起,他最新发布的AI工作流作品“Cute You”,由AI生成的名人卡通形象栩栩如生,又一次引起了ComfyUI创作者们的广泛学习和关注。Rui是如何掌握这些能力的?他提供了一些学习建议:首先,他强调了获取信息源的重要性。他建议使用ComfyUI管理器作为了解节点信息的主要入口。并且定期在GitHub搜索ComfyUI相关节点更新。同时关注知名博主和官方博客分享的使用技巧。其次,深入理解SD的图像生成的流程和原理,这是灵活使用ComfyUI的基础 。对于非程序员,特别是设计师而言,学习ComfyUI是一个跨界挑战,需要改变过去的学习方式,需要多加实践探索 。另外,要多做实验。开始时不要过于雄心勃勃,因为教程更新也是滞后的,为了防止踩坑我们需要从基础开始,选择小项目,逐步增加复杂性。过程中,我们不要害怕失败,最终我们可以把这些实验经验整合到实际项目中。最后,加入专业的群和社区,在社区中提问和分享经验是学习的重要部分,这是学习新技能和解决问题的重要方式。在《西游大绘战》的工作流创作过程中,Shadow就给了很大的技术支持,帮助他解决很多自定义节点的问题和需求,这种合作也是一种前所未有的体验。除了以上四点,我认为Rui的能力,更关键在于他的探索未知的创新精神和不断精益求精的匠人精神。正是因为这些品质,让他编排的每个AI工作流都能成为优秀的作品,兼具科技与审美。也让他成为了黑客与画家的结合体。在对谈过程中,有社群的小伙伴提到了“超级个体”这个词,我想“黑客与画家”的精神就是AI时代下的超级个体的核心精神。# 如何成为AI时代的超级个体?在AI时代下的超级个体都是具有匠人精神的产品经理。他们兼具黑客与画家的品质,追求自由的创作精神和产品理想,能够打破社会分工的枷锁,勇于走出自己的舒适圈,能够不断探索和应用前沿的新技术,打造出一件件让人惊叹的作品。成为AI时代的超级个体,需要有以下这5个方面的能力:首先,需要是终身学习者。他们主动追踪技术发展的最新动态,以及这些技术如何应用于不同行业。他们通过自主学习和项目实践,不断增强自己的技术能力和理解力。其次,需要有很强的跨学科思维。Rui给我们起了一个很好的表率作用,他能够灵活的切换设计师和工程师的思维方式,他将艺术设计与AI技术相结合,创造出独特的游戏体验。超级个体通常能串联不同领域的知识,利用这些交叉点来创新和解决问题。另外,需要有创新和实验精神。在新兴领域中,不断实验是创新成功的关键。Rui的例子告诉我们,通过熟悉掌握AI工具,即使没有编程背景,也可以通过实验和探索获得实践的成功。这种实验精神,需要我们不畏风险勇于尝试。还有,就是解决复杂问题的能力。AI技术本身就是解决复杂问题的工具。超级个体需要具备分析复杂系统的能力,并使用AI作为解决方案的一部分。这要求具备良好的逻辑思维能力和系统化思维。最后,是建立强大的社会链接能力。虽然AI技术强大,但在实际应用中,跨领域的合作是必不可少的。超级个体通过加入社区参与分享和交流,传递更多关于学习方法、行业洞察以及社会发展趋势的思考。通过强化自己的个人品牌,能够获得更多与能力互补的超级个体的合作,拓展出更多职业发展和创作的机遇。总之,成为AI时代的超级个体,需要我们能够在快速变化的技术环境中,不断学习和成长,同时需要具备创新精神、跨学科思维和强大的问题解决能力。超级个体不仅关注技术实践的本身,还关注技术如何影响行业和社会发展。通过分享和交流,从而获得更加广泛的社会影响力,成为一个标志性的个人品牌。# 结语在前天,Rui为了实现自己新的工作流逻辑,在ChatGPT的帮助下编写了一个自定义节点,并提交到了Github开源。地址:https://github.com/rui40000/RUI-Nodes这是《黑客与画家》精神的最直接体现。也鼓舞了许多在ComfyUI中文社区中不擅编程的设计师。Rui勇于探索的精神和杰出的创作力,让他打破了传统分工角色的限制。绘画不再是画家的专属,编程也不再是程序员的专属。在AI的帮助下,任何人都可以通过学习和实践,创作自己的杰出作品。在AI的加持下,超级个体的崛起将打破现有的职业分工体系。它鼓励个体追求创新,拓展知识边界,实现个人和职业成长。他们产生的价值是广泛的行业价值和社会价值。未来的工作场景中,将会越来越重视跨学科知识和创造性思维。这不仅为超级个体提供了更广阔的发展空间,也为企业和社会带来了更丰富的创新资源。AI时代,需要我们打破过去那套旧规则,只有拆掉思维里的墙,我们才能获得进化。欢迎加入Mixlab ComfyUI中文社区与大佬们一同成长!最后,欢迎大家加入ComfyUI的知识星球。

2023/12/17
09:17
AIGC产品经理:传统产品经理转型的时代机遇与挑战

AIGC产品经理:传统产品经理转型的时代机遇与挑战

今年年初,随着GPT、Midjourney大语言模型的火爆,也带火了AIGC(人工智能生成内容)的潮流。随之而来的是越来越多的AIGC产品经理的招聘需求。AIGC产品经理是一个崭新的角色,同时也面临着一系列独特的挑战和机遇。到底什么是AIGC产品经理,他和传统的产品经理又有什么不同?就在前几天,我和西坡、小李子对于什么是AIGC产品经理做了一些探讨。(他们都是我的知识星球成员)# 1. AIGC产品经理的独特性这是某个大厂招聘需求,乍看一下和传统产品经理的招聘需求还是非常相似:其实,AIGC根据场景和领域不同,对于产品经理的要求也不同。下图绿色的是应用场景,蓝色的部分是每个应用场景对应的模型技术,AIGC产品经理可以根据下图按图索骥地了解相关的技术知识。西坡作为工作在一线的AIGC产品经理,他首先发表了观点。虽然AIGC产品经理的工作流程在很大程度上与传统产品经理相似,涵盖需求调研、分析、原型设计等环节,但AIGC产品经理在技术调研和产品功能设计方面的要求更高。这是因为大模型使得产品和研发人员处于同一起跑线。因此,AIGC产品经理需要对技术有更深的理解和洞察能力。在这一年里,大模型的技术迭代非常快。它需要产品经理很强的自主学习能力,要能够将新的技术能力与具体产品需求相结合。在日常的工作中,西坡除了撰写需求文档之外,也会使用提示工程调试数据,这样才能够将技术能力与产品需求有效结合。同时他每天也会查看大量的前沿动态,并从中发现机会点。另外,在传统的产品管理和AI项目中,我们管理的是确定性,用户需求是明确的,功能目标是明确的,性能指标也是明确的,在产品需求文档撰写时候就已经解决了80%的不确定性问题,剩下20%是项目执行。但在AIGC项目中却相反,我们管理的是80%的不确定性。因为用户会把AI当做人来使用,会提任何意想不到问题,但用户都期望AI要能够给出很好的回应。这种不确定性不光是用户带来的,也受数据、模型、提示工程的影响。AIGC产品经理需要能感知到这些不确定性,并让它们控制在用户预期范围内。很多2C类型的AIGC产品还要求产品经理要有社区产品经验,因为AI内容创作的驱动力还是来源于人,而在线社区是最好的创作者运营方式,在国外Discord社区已经是AIGC产品的标配。因为在AIGC社区里,创作者们可以相互学习和相互激发。而产品经理只有真正理解了这群AIGC创作者才能更好地知道AIGC产品应该怎么做。因此,在AIGC产品管理中,产品经理更需要近距离地观察用户和亲身体验。因为AIGC产品并没有可以直接可抄袭的功能和交互逻辑,很多问题需要亲身体验才能知道。所以这要求产品经理具有强烈的用户同理心,并能够将自己置入用户的情境中。通过近距离观察和体验,才能更好地理解市场动态和用户行为。# 2. 快速市场响应与商业能力在AIGC领域,产品经理面临的主要挑战之一是快速响应市场变化。这不仅要求他们敏锐地捕捉行业趋势和机遇,还要能够进行快速的市场验证。有效的MVP(最小化可行性产品)策略对于确定产品方向和迭代至关重要。此外,产品经理的商业理解能力也至关重要。在产品设计过程中,必须充分理解商业运作逻辑和实现成本。避免过于复杂和无效的需求设计,确保产品在有限的资源成本下能够有的放矢,步步为营地达到产品与市场的匹配。在11月7日凌晨,OpenAI举行了一场全球注目的开发者大会,CEO山姆·奥特曼隆重地介绍了GPTs的功能,人人都可以定制自己的GPT助理,还能通过链接分享给朋友。但是目前由于官方GPTs商店还没有上线,许多优秀的GPTs很难被发现。为此,Mixlab的小伙伴在11月15日还组织了一场名为《GPTs商店,普通人能挣到钱吗?》在线连麦讨论,当我们讨论到是否值得做GPTs精品推荐网站时,西坡认为还是存在一定的机会的,但有另一些朋友表示并不看好这种推荐网站,因为只要官方GPTs商店上线以后,这种网站结局就是昙花一现。在第二天,西坡的团队就上线了名为“GPTs伙伴”的精品推荐网站(www.gptspt.com),同时西坡启动了社群运营,GPTs创作者和用户开始涌入。社群里的小伙伴都惊呼动作真快。目前,他们团队只用了一周不到的时间就收集到了四千多个GPTs。一周的时间,对许多大厂团队来说就是给老板写PPT和做汇报的时间。当我们还在担心官方的GPTs商店即将上线的时候。上周末OpenAI的CEO山姆·奥特曼被戏剧性地驱逐出了公司。这家顶尖的AI公司已变成了一团乱麻。当我们认为接下来GPTs官方商店的项目推进应该会被搁置的时候,在昨天山姆奥特曼又回到了公司。我给西坡的总结就是“天下武功,唯快不破”。在飞速发展的行业里面,每天都有新变化,反复的犹豫和纠结会让机会转瞬即逝。对于创业者来说这是一个动态博弈的过程,你能做的就是用最低的成本来验证你的想法,用最快的速度来拿到结果,然后再去迎接下一步挑战,只有快速应变和步步为营,你才更有可能获得成功。如果你有兴趣可以扫码收听我们上周二的讨论:3. 产品经理的职业风险与机遇随着互联网行业增量市场向存量市场的转变,科技公司的运营模式也从资本驱动转变到投资回报率(ROI)驱动,产品经理面也临着全新的挑战。这不仅对企业盈利模式提出了更严格的要求,也对传统分工体系下偏安一隅的产品经理们提出了更高的要求。项目的ROI和公司财务状况成为决定职位稳定性的关键因素,产品经理需要具有在短期内验证产品的商业价值和潜力的能力,否则自身岗位也岌岌可危。在这个多变的职业环境中,产品经理应成为斯坦尼斯拉夫斯基的“体验派”。通过亲身体验,深入实际应用场景,亲历市场和产品的起伏变化。这种近距离的观察和体验能够帮助他们理解复杂问题的本质,更透彻地理解市场、用户需求、项目运营和管理。另外,在职场中,追求财务收益和发展机遇应当不相冲突。产品经理需要明确自己的阶段性职业目标,同时不失对终极理想的追求。只有如此,产品经理才能在不断变化的市场中找到稳固的立足点,并在职业道路上实现持续的成长和成功。# 结语AIGC产品经理是一个崭新的岗位,这个岗位的定义也会随着技术飞速发展而更新,产品经理还有很多东西需要学习。面对技术的复杂性和市场的不断变化,新兴的产品经理们,需要具备深厚的技术理解、敏锐的市场感知、强大的商业能力,以及不断地学习和适应能力。通过持续的努力和专业发展,AIGC产品经理不仅能够引领产品成功,还能在职业生涯中取得显著成就。如果你是传统产品经理,这也是一次难得的职业转型的机会。如果你已经跃跃欲试,请迈开你的第一步,学会使用ChatGPT,构建自己的GPTs,并把他们带到自己的工作和生活中。你可以尝试一下我构建的“高级产品管理专家”GPT,它除了能帮助你处理日常的产品管理工作外,也会告诉你AIGC产品经理需要掌握哪些技能。希望它能够更好的帮助到你,访问地址:https://chat.openai.com/g/g-amlOc6xcY-gao-ji-chan-pin-guan-li-zhuan-jia在后续内容中,我会告诉大家如何构建属于自己专业领域GPTs,你可以给我留言你的问题。最近,我们正在组建ComfyUI中文社区,如果你还不了解什么是ComfyUI,请查看我的上一篇文章《AIGC工作流: 新时代产品经理和创业者的秘密武器》。目前群已经加满,后台回复我“ComfyUI入群”。另外,我们正在与Openart.com招募更多优秀的ComfyUI工作流创作者,详情请查看文章《ComfyUI工作流:AI创作者的新名片#OpenArt联手Mixlab、ComfyUI中文社区》关于AIGC产品经理的更多内容和资料可以关注我的星球。

2023/11/23
09:46
比尔·盖茨:AI代理人将彻底改变人们使用电脑的方式

比尔·盖茨:AI代理人将彻底改变人们使用电脑的方式

翻到Shownotes的最底部有价值128元的福利可以免费领取。这是一篇比尔·盖茨在最近写的文章,主要强调了人工智能技术的未来潜力和影响。他认为AI将深刻改变我们的生活方式,特别是通过高级AI助手(或称之为代理),这些代理能够理解复杂的请求并执行多种任务。他强调了AI在提高效率、解决复杂问题以及改善人类生活质量方面的巨大潜力。同时,他也提到了随之而来的挑战,如数据隐私、安全性和伦理问题。总的来说,盖茨对AI技术的未来持乐观态度,同时也认识到需要解决的关键问题。00:10即使到了今天,我对软件的热爱仍与当年我和保罗·艾伦一起创立微软时一样浓烈。但即便在这些年间软件有了很大的进步,从很多方面来说,软件仍然相当“愚蠢”。要在电脑上完成任何任务,你必须告诉你的设备使用哪个应用程序。你可以使用微软Word和谷歌文档来起草商业提案,但它们无法帮助你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。即使是最好的网站也对你的工作、个人生活、兴趣和人际关系理解有限,而且在使用这些信息为你服务方面能力有限。这种事情在今天只有通过另一个人,比如一个亲密的朋友或个人助理,才能实现。在未来五年内,这一切将完全改变。你不需要为不同的任务使用不同的应用程序。你只需用日常语言告诉你的设备你想做什么。根据你选择与它分享多少信息,软件将能够做出个性化响应,因为它将对你的生活有着丰富的理解。在不久的将来,任何在线的人都将能够拥有一个由人工智能驱动的个人助理,其能力远远超出今天的技术。这种类型的软件——能够响应自然语言并根据对用户的了解完成许多不同任务的软件——被称为“代理”。我已经思考代理近30年,并在我的1995年的书《未来之路》中写到了它们,但直到最近因为人工智能的进步,它们才变得实用。代理不仅将改变每个人与电脑互动的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来计算机领域最大的革命。每个人的私人助理一些批评家指出,软件公司以前提供过类似的东西,但用户并没有真正接受它们。(人们仍然在拿微软Office中曾经包含后来又放弃的数字助手Clippy开玩笑。)为什么人们会使用代理?答案是它们会好得多。你将能够与它们进行微妙的对话。它们将更加个性化,并且不仅限于相对简单的任务,如写信。Clippy与代理的共同之处,就像旋转电话与移动设备的共同之处一样。如果你愿意,代理将能够帮助你处理所有活动。通过允许它跟踪你的在线互动和现实世界的位置,它将对你参与的人、地点和活动有强大的了解。它将了解你的个人和工作关系、爱好、偏好和日程。你将选择它何时介入帮助某事或要求你做出决定。于下午 13:40 的时候发布了一些关于为了看到代理将带来的巨大变化,让我们将它们与今天的AI工具进行比较。这些工具大多是机器人。它们限于一个应用程序,并且通常只在你写下特定单词或寻求帮助时介入。因为它们不记得你上一次如何使用它们,所以它们不会变得更好或学习你的任何偏好。Clippy是一个机器人,而不是一个代理。代理更聪明。它们是主动的——能够在你提出要求之前就提出建议。它们能够跨应用程序完成任务。它们会随着时间的推移而改进,因为它们记住了你的活动,并识别出你行为中的意图和模式。基于这些信息,它们会提供它们认为你需要的东西,尽管最终决定权始终在你手中。想象一下你想要计划一次旅行。一个旅行机器人会识别出符合你预算的酒店。而一个代理则会知道你将在哪个季节旅行,并根据它对你是总是尝试新目的地还是喜欢重复访问同一个地方的了解,它将能够提出地点建议。当被问及时,它将根据你的兴趣和冒险倾向推荐活动,并在你喜欢的餐厅预订位置。如果你想要今天这种深度个性化的规划,你需要支付旅行代理费用并花时间告诉他们你想要什么。AI代理最令人兴奋的影响是它们将使今天对大多数人来说太昂贵的服务民主化。它们将在四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐和购物。医疗保健今天,AI在医疗保健中的主要作用是帮助处理行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获音频,然后为医生撰写笔记。真正的转变将在代理能够帮助患者进行基本分诊、获取如何处理健康问题的建议以及决定他们是否需要寻求治疗时发生。这些代理还将帮助医疗工作者做出决策并提高生产力。(已经有像Glass Health这样的应用程序可以分析患者摘要并为医生提出诊断建议。)帮助患者和医疗工作者将特别有益于那些在贫穷国家的人们,因为那里许多人根本就看不到医生。这些临床代理的推出将比其他代理慢,因为做对事情是生死攸关的。人们需要看到证据表明健康代理总体上是有益的,即使它们不会完美并且会犯错误。当然,人类也会犯错误,而且没有获得医疗保健也是一个问题。心理健康护理是另一个代理将使之几乎对每个人都可用的服务的例子。今天,每周进行一次治疗会话似乎是一种奢侈。但存在大量未满足的需求,许多需要治疗的人无法获得它。例如,兰德公司发现,所有需要心理健康护理的美国军事退伍军人中有一半没有得到治疗。在心理健康方面受过良好训练的AI代理将使治疗更加负担得起且更容易获得。Wysa和Youper是这里的早期聊天机器人。但代理将走得更深。如果你选择与心理健康代理分享足够的信息,它将了解你的生活历史和你的人际关系。它将在你需要时随时可用,并且永远不会变得不耐烦。它甚至可以在你的允许下,通过你的智能手表监测你对治疗的生理反应——比如当你谈论与老板的问题时心跳加速——并建议你何时应该看人类治疗师。教育几十年来,我一直对软件将如何使教师的工作变得更轻松并帮助学生学习感到兴奋。它不会取代教师,但它将补充他们的工作——为学生个性化工作并解放教师免于文书工作和其他任务,以便他们可以花更多时间在工作的最重要部分上。这些变化终于开始以戏剧性的方式发生。目前的最先进技术是由可汗学院创建的基于文本的机器人Khanmigo。它可以在数学、科学和人文学科中辅导学生——例如,它可以解释二次公式并创建数学问题供练习。它还可以帮助教师完成如编写课程计划等任务。我长期以来一直是Sal Khan的工作的粉丝和支持者,并最近在我的播客上邀请他谈论教育和AI。但基于文本的机器人只是第一波——代理将开启更多学习机会。例如,很少有家庭能支付一对一辅导学生以补充课堂学习的家教费用。如果代理能够捕捉到使家教有效的因素,它们将为每个需要的人解锁这种补充教学。如果一个辅导代理知道一个孩子喜欢Minecraft和泰勒·斯威夫特,它将使用Minecraft教他们计算形状的体积和面积,使用泰勒的歌词教他们讲故事和押韵。与今天的基于文本的辅导相比,体验将更丰富——例如,具有图形和声音——并且更加个性化。生产力这个领域已经有很多竞争。微软正在将其Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用Assistant、Bard和其生产力工具做类似的事情。这些副驾驶可以做很多事情——比如将书面文件转换成幻灯片,使用自然语言回答有关电子表格的问题,并在代表每个人的观点时总结电子邮件线索。代理将做得更多。拥有一个代理就像拥有一个专门帮助你完成各种任务并在你愿意的情况下独立完成它们的人。如果你有一个商业想法,代理将帮助你撰写商业计划,为其创建演示文稿,甚至生成你的产品可能的外观图像。公司将能够使代理直接为其员工提供咨询,并成为每次会议的一部分,以便它们可以回答问题。无论你是否在办公室工作,你的代理都将能够以与今天个人助理支持高管相同的方式帮助你。如果你的朋友刚做了手术,你的代理将提议发送鲜花,并能为你订购。如果你告诉它你想要与你的大学室友联系,它将与他们的代理合作找到见面的时间,并在你到达之前提醒你,他们的大孩子刚刚开始在当地大学上大学。娱乐和购物AI已经可以帮助你挑选一台新电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它允许你提问(“我会喜欢哪些罗伯特·雷德福的电影,我在哪里可以看?”),然后根据你过去喜欢的内容做出推荐。Spotify有一个AI驱动的DJ,不仅根据你的偏好播放歌曲,还会与你交谈,甚至可以叫你的名字。代理不仅会提出建议;它们还会帮助你采取行动。如果你想买相机,你将让你的代理为你阅读所有评论,总结它们,提出建议,并在你做出决定后下订单。如果你告诉你的代理你想看《星球大战》,它会知道你是否订阅了正确的流媒体服务,如果没有,它会提议帮你注册。如果你不知道你想看什么,它会提出定制化建议,然后找出如何播放你选择的电影或节目。你还将能够获得根据你的兴趣量身定制的新闻和娱乐。CurioAI,它可以根据你询问的任何主题创建定制播客,是即将到来的东西的一瞥。科技行业的震荡波总之,代理将能够帮助几乎任何活动和生活的任何领域。它们对软件业务和社会的影响将是深远的。在计算行业,我们谈论平台——应用程序和服务构建在其上的技术。Android、iOS和Windows都是平台。代理将是下一个平台。要创建一个新的应用程序或服务,你不需要知道如何编写代码或进行图形设计。你只需告诉你的代理你想要什么。它将能够编写代码,设计应用程序的外观和感觉,创建一个logo,并将应用程序发布到在线商店。OpenAI本周推出的GPTs为非开发者可以轻松创建和分享他们自己的助手的未来提供了一个窥视。代理将影响我们使用软件的方式以及软件的编写方式。它们将取搜索网站,因为它们在为你找到信息并为你总结它方面会更加出色。它们将取代许多电子商务网站,因为它们会为你找到最佳价格,并且不会仅限于几个供应商。它们将取代文字处理器、电子表格和其他生产力应用程序。今天是独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将成为一个业务。我不认为任何单一公司将主导代理业务——将有许多不同的AI引擎可用。今天,代理嵌入在其他软件中,如文字处理器和电子表格,但最终它们将独立运行。尽管一些代理将免费使用(并通过广告支持),但我认为你将为大多数代理付费,这意味着公司将有动力使代理为你的利益工作,而不是广告商的利益。如果今年开始从事AI工作的公司数量有任何迹象,那么将会有异常多的竞争,这将使代理非常便宜。但在我所描述的复杂代理成为现实之前,我们需要面对关于技术及其使用方式的许多问题。我之前已经写过AI引发的问题,所以我将在这里专门关注代理。技术挑战目前还没有人弄清楚代理的数据结构将是什么样的。为了创建个人代理,我们需要一种新型数据库,能够捕捉你的兴趣和关系的所有细微差别,并在保持你隐私的同时快速回忆信息。我们已经看到了存储机器学习模型生成的数据的新方法,例如向量数据库,这可能更适合存储数据。另一个悬而未决的问题是人们将与多少代理互动。你的个人代理是否与你的治疗师代理和你的数学家教代理分开?如果是这样,你什么时候希望它们相互合作,什么时候应该保持各自的领域?你将如何与你的代理互动?公司正在探索各种选项,包括应用程序、眼镜、吊坠、别针,甚至全息图。所有这些都是可能性,但我认为人类与代理互动的第一个重大突破将是耳机。如果你的代理需要与你联系,它将对你说话或在你的手机上显示。(“你的航班延误了。你想等待,还是我可以帮你重新预订?”)如果你愿意,它将监控进入你耳朵的声音,并通过阻挡背景噪音、放大难以听到的语音或使听起来带有浓重口音的人更容易理解来增强它。还有其他挑战。目前还没有一个标准协议,允许代理相互通信。成本需要降低,以便代理对每个人都负担得起。需要更容易地提示代理,以便为你提供正确的答案。我们需要防止幻觉,特别是在像健康这样的领域,准确性非常重要,并确保代理不会因其偏见而伤害人们。我们不希望代理能够做它们不应该做的事情。(尽管我对流氓代理的担忧比对使用代理进行恶意目的的人类犯罪分子的担忧要少。)隐私和其他重大问题随着所有这些事情的发展,在线隐私和安全问题将变得比现在更加紧迫。你将希望能够决定代理可以访问哪些信息,以便你有信心你的数据只与你选择的人和公司共享。但是你与代理共享的数据归谁所有,你如何确保它被适当使用?没有人希望开始收到与他们告诉治疗师代理有关的广告。执法部门可以使用你的代理作为对你不利的证据吗?你的代理何时会拒绝做可能对你或他人有害的事情?谁来选择内置于代理中的价值观?还有一个问题是你的代理应该分享多少信息。假设你想见一个朋友:如果你的代理与他们的代理交谈,你不希望它说,“哦,她周二要见其他朋友,不想让你加入。”如果你的代理帮你写工作电子邮件,它将需要知道不应该使用关于你的个人信息或你以前工作专有数据。这些问题已经成为科技行业和立法者的首要关注点。我最近参加了由参议员查克·舒默组织的一次AI论坛,与其他技术领袖一起,许多美国参议员也参加了此次论坛。我们分享了关于这些和其他问题的想法,并讨论了立法者采纳强有力的立法的必要性。但是,其他问题不会由公司和政府决定。例如,代理可能会影响我们与朋友和家人的互动方式。今天,你可以通过记住他们生活中的细节——比如他们的生日——来向某人表达你对他们的关心。但当他们知道你的代理可能提醒了你这件事并负责发送鲜花时,这对他们来说是否还有意义?在遥远的未来,代理甚至可能迫使人类面对关于目的的深刻问题。想象一下,代理变得如此出色,以至于每个人都可以在几乎不用工作的情况下拥有高质量的生活。在这样的未来,人们会如何利用他们的时间?当代理拥有所有答案时,还有人会想要接受教育吗?当大多数人都有大量空闲时间时,你能拥有一个安全繁荣的社会吗?但我们距离那个时刻还很遥远。与此同时,代理即将到来。在接下来的几年里,它们将彻底改变我们的生活方式,无论是在线上还是线下。[原文完]观点人工智能的发展正处于一个关键的十字路口。一方面,AI展现出了巨大的潜力,能够在教育、医疗保健、环境保护等多个领域带来革命性的改变。它有可能极大地提高生活质量,解决一些长期以来人类难以克服的问题。然而,另一方面,这种技术的快速发展也带来了一系列复杂的伦理、隐私和安全问题。数据的控制权、AI决策过程的透明度,以及其对就业和社会结构的影响,都是我们必须认真对待的问题。特别是在AI技术可能加剧社会不平等的情况下,我们需要谨慎行事,确保技术进步能够惠及所有人。此外,我也认为人工智能的发展不应仅仅被视为技术进步的问题,而应该是一个更广泛的社会、文化和伦理议题。我们需要跨学科的合作,包括技术专家、社会学家、伦理学家和政策制定者,共同探讨和制定相应的法律法规,以确保AI技术的健康发展。最后,我对人工智能未来的发展持谨慎乐观的态度。我相信,通过全人类的合作和负责任的创新,我们可以利用AI的潜力来改善人类的生活,同时有效地应对其带来的挑战。福利:北京虎嗅F&M创新节价值125元的门票,关注PM熊叔公众号可以免费领取:微信后台私信我获得兑换密码,即可免费领取。

2023/11/14
18:17
AIGC工作流:新时代产品经理和创业者的秘密武器

AIGC工作流:新时代产品经理和创业者的秘密武器

在我过去的文章里有说过,产品经理是“帮助团队交付正确产品给用户的人”。从客户需求挖掘到最后产品使用体验,产品经理要确保产品价值能够端到端地传递给用户,产品经理需打破团队成员的分工壁垒,这考验着产品经理综合能力和素质,这也是产品经理的领导力的体现。如今,随着ChatGPT、Midjourney、StableDiffusion等生成模型带动起来的热潮,AI大模型正逐渐渗透到各种产品和服务中,越来越多的产品经理也在考虑将AIGC(AI生成内容)能力融入到自己的产品中,然而这并非易事,在项目实践的过程中产品经理面临着诸多的挑战和困惑……# 一、AIGC的产品管理挑战在传统的互联网产品的开发流程中,产品原型图是不可或缺的工具。产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具,投入主要的时间绘制线框图,并通过页面流程图来阐释产品的交互逻辑。通过这种方法,团队成员能直观地理解产品的最终呈现效果,方便地讨论问题并形成共识,从而保证最终交付的产品体验与预期保持一致。这是过去十几年来,互联网和软件行业一直奉行的最佳实践。然而在AIGC产品中,用户更关心的是AIGC的数据体验,而不是界面的交互体验,传统的体验设计范式已经不再适用。例如,著名图片生成工具Midjourney以对话机器人的形式呈现,用户只要在Discord中和它对话就能获得高质量的图片,因为Midjourney很清楚地知道:用户更关心的是我们能不能根据提示词生成优质的图片,而不是别的什么东西。题外话:“知道自己应该做什么,并把它做到极致”——正因如此才让这只有十几人的小团队能完成1亿美元的年营收。这是我们每一个创业者和产品经理都需要学习的能力。因为AIGC产品体验的重心已从界面转向了数据。由于许多产品经理对数据和AI算法了解不足,让他们在技术沟通上遇到了极大的挫败感,而且传统的原型设计工具在应对AI产品时也显得力不从心,无法保证最终的交付效果和预期的一致性。对于一些想应用AIGC能力的产品经理而言,不仅AI模型是个不可解释的黑盒,连AI产品的研发过程也变成了一个不可知的黑盒。正所谓“拿着旧地图无法抵达新大陆”,在新时代,我们应该放弃旧的思维方式拥抱新的工具和新方法。# 二、AIGC工作流(Workflow)Stable Diffusion,作为一款广受欢迎的图片生成的开源项目,为AIGC内容创作者提供了强大的助力。ComfyUI进一步拓宽了Stable Diffusion的创作可能性。ComfyUI通过节点流程的界面设计,让用户可以轻松拖拽、连接不同的模型、模块和参数,形成高度定制和可复用的Workflow(AIGC工作流),而用户无需编写任何代码。它可以帮助我们实现更加丰富和定制化的数据体验。另外,ComfyUI还有以下优势:易于共享与协作:支持工作流的导出和分享,不仅加速了项目开发,也为团队间的学习和交流创造了条件。良好的性能优化:其内存管理和按需加载机制确保在资源受限的环境下,仍能加载大模型生成高质量图像。可扩展性:用户可以轻松添加自定义节点、插件和模型,社区已贡献了200多个自定义节点,为工作流的设计和优化提供了丰富的选择。ComfyUI本质上是AIGC的Pipeline(数据处理管道)的可视化构建工具,它将Stable Diffusion的运行机制显性化的展示在我们面前。在图形生成的过程中,ComfyUI能够实时为我们呈现数据处理的过程。让我们在设计和调试的时候,可以快速定位和解决问题。ComfyUI不仅仅是让AIGC创作者可以更自由地创作,它的流程逻辑的可视化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么?在产品融图、营销海报和视频素材等应用场景中,AIGC正在发挥极大的价值。目前,一些前沿的团队已经在使用ComfyUI改进他们的工作方式,产品经理将ComfyUI作为产品原型设计工具,深度参与到模型训练和AIGC工作流的构建中,然后再交由开发人员和算法工程师进一步优化,最后转化成可稳定运行的Pipeline部署到正式环境中。通过ComfyUI的可视化节点式工作流,产品经理和开发团队的沟通与协作得到了促进,使项目团队能在早期快速搭建和验证项目原型,缩短开发周期,降低试错成本,确保产品需求和体验目标的一致性,从而更好地实现端到端的产品体验目标。# 三、UE蓝图系统的启示拖拽式的节点编程并不是ComfyUI的独创,例如,Blender、Maya和Unreal Engine(虚幻引擎)也提供了类似的功能。虚幻引擎的蓝图系统通过提供丰富的节点库和强大的可视化编程环境,使用户能够在无需编写代码的情况下构建复杂的游戏逻辑。蓝图系统的高度可定制性和扩展性,允许用户创建自定义节点,甚至可以与传统的编程代码无缝集成,直接打包成跨平台的游戏,不仅为游戏开发提供了强大而灵活的解决方案,也缩短了从概念到可交付产品的时间周期。这种方式使游戏设计师、艺术家和小型工作室能快速地制作出可运行的游戏产品,极大地丰富了游戏创意的表达。得益于虚幻引擎的强大表现力和无需编程的创作方式,使得其他行业的专家也可以使用虚幻引擎来实现想法。这也让其成为一款贯通各行各业的三维拟真创作工具,从游戏行业跨足至建筑设计、工业设计、城市规划和厂房规划等众多领域。可视化的节点编程和模块化设计极大地降低了编程门槛,促进了不同背景的团队间的协作和交流,吸引了来自更多不同领域的创作者共同丰富产品应用场景和生态。这也为ComfyUI提供了启示:强大的可视化和模块化能力不仅降低了产品开发和发布的门槛,还拓宽了创意和协作的空间,使得想法可以快速转化为实际可交付的产品成为可能,从而更好地满足不同用户和市场的需求。这就是“引擎”的魅力。# 四、展望未来目前,得益于ComfyUI的自定义节点的可扩展性,已有开发者创建了ChatGPT节点,为图像生成工作流赋予了大语言模型的思考能力,能快速生成提示词,可以方便快速创作大量的内容。如下图所示:展望未来,随着ComfyUI自定义节点的丰富化,它将不仅局限于Stable Diffusion的图像生成能力,而会整合更多领域的AI模型,逐渐成为一个多模态的AIGC产品构建工具。未来也可能会出现类似虚幻引擎的多模态AI引擎平台,能直接将AIGC工作流打包成高可用和可交付的产品。另外,由于企业级项目对硬件资源有较高要求,ComfyUI主要部署在团队的云端服务器上,这也将催生团队在线协同的需求,为创业者提供新的机会。我相信未来的ComfyUI在线版本可能会借鉴Figma的在线协同功能,让团队成员能共同参与AIGC工作流的搭建,为AIGC产品开发带来前所未有的在线协作体验。# 结语十年前,许多产品经理通过学习《网站蓝图:Axure RP高保真网页原型制作》这本书,步入了互联网产品领域。然而,在AIGC产品领域,Axure已无法满足现今的需求。正如“拿着旧地图无法抵达新大陆”一样,当我们拿着旧“蓝图”时也难以创造新产品。现在,AIGC工作流已成为我们需要学习和掌握的新“蓝图”的能力。通过学习和应用ComfyUI,产品经理和创业者能更深入地理解AI原理和工作方式,获得更为顺畅技术沟通能力。同时,通过快速构建和验证AI模型,我们可以确保产品需求与体验的一致性,大幅缩短产品开发周期。掌握ComfyUI的AIGC工作流,产品经理和创业者不仅能自信应对AI产品开发的挑战,还能探索和实现创新的产品设计,树立在AIGC领域的领导力。AIGC掀起的热潮也仅仅只有半年多的时间,技术正飞速发展和迭代,新事物层出不穷,在这个行业没有多年经验的老师傅。不管你是创业者还是产品经理,如果想转行到AIGC领域,现在是学习的最佳时机,只要学习的速度够快,你就可能成为该领域的专家。通过掌握ComfyUI,你能为未来的职业发展和团队协作打下坚实的基础,更好地适应这个行业的发展和需求。欢迎对AIGC工作流感兴趣的小伙伴一起同行!目前,我们正在翻译ComfyUI官方文档和撰写入门教程,网址:https://www.mixcomfy.com同时,我们正在搭建ComfyUI中文社区,如果你对ComfyUI感兴趣可以扫码加入。ComfyUI爱好者群:另外,如果你想深入学习ComfyUI动画等相关知识可以加入这个知识星球,是Shadow和我联合发起的,我们收集和整理全网最新最完整的资料。早期用户优惠,满50人后开始涨价

2023/11/5
10:33
春江水暖鸭先知:洞悉AIGC技术趋势,把握内容产业变革的先机

春江水暖鸭先知:洞悉AIGC技术趋势,把握内容产业变革的先机

今年4月份,我参加了上海的AIGC(人工智能生成内容)创建者大会,当时对于趋势做了一些分享。具体可以参看文章《AIGC革命:拐点降临的内容产业,如何赢得时代先机》。山雨欲来风满楼,将近半年过去了,现在趋势又会有怎么样的变化?技术迭代又给我们带来怎样的机遇?# 一、公理如今,抖音、快手、微信视频号等短视频平台迅速崛起,短视频和推荐算法构建的信息茧房,已让许多人无法释手、难以自拔。互联网行业有个普遍的共识:“视频的价值远超过图文和音频”。因为视频能在单位时间内传递更多维度的信息,这不仅带来了丰富的感官体验,还更容易建立情感纽带,从而实现较高参与度、较强社交传播力和更高的商业转化。如Youtube的贴片广告的变现价值和哔哩哔哩的弹幕的互动价值都是传统的图文和音频内容无法比拟的。基于此,我们可以得出第一条公理:“在单位时间内,高信息密度内容的价值要远大于低信息密度内容的价值”。然而,互联网视频内容的普及并非一蹴而就,2007年,我国网民数量是1.62亿,互联网的普及率只有12.3%。到了2023年,我国网民规模达10.79亿人,互联网普及率达76.4%,移动互联网人群成为了主力。正如每一次量子跃迁都会释放出巨大的能量,新兴技术的普及也会带来巨大的红利。随着移动网络和智能手机的性能提升和普及,PC互联网时代跃迁至移动互联网时代,释放了巨大的增量市场,也孕育了新的内容创作和消费场景。在PC互联网时代,由于网络环境和设备的限制,主要人群局限在日常使用电脑的学生和白领,UGC(用户生产内容)主要是图文形式,如人人网、天涯论坛、新浪博客和微博等。由于视频内容较高的制作门槛,更多是由专业人士通过PGC(专业生产内容)形式生产。今天,普通人通过一台手机就可以随时随地制作视频和分享内容。如此低门槛的方式,引发了UGC内容爆发性增长。同时,移动社交网络兴起也为内容传播提供了新的平台,进一步推动了视频内容消费的频次和多样性。正所谓:“旧时王谢堂前燕,飞入寻常百姓家”。正是因为PC互联网到移动互联网的变革,催生了从PGC到UGC转变,带来了今天内容产业的繁荣。由此,我们可以得出第二条公理:“技术革新的普及大大降低了普通人的内容创作和消费的门槛,从而释放出巨大的市场增量价值。”如今,强大的生成式AI让我们又一次站在了重塑内容产业格局的风口浪尖。ChatGPT、Midjourney、DALL-E、Stable Diffusion等生成式的AI大模型不断推陈出新,AI新应用也让人应接不暇。当我们理解“内容信息密度”和“技术革新普及率”这两条公理之后,我们才能更好地去洞察这一切的变化,才能见微知著地做好趋势的判断。# 二、洞察随着Midjourney、Stable Diffusion技术的普及,制作AIGC图片已经成为众多创作者们兴趣爱好。但现在仅靠生成“1girl”的静态图像已不能满足日益增长的创作需求。在Stable Diffusion生态里,新的方法、论文和模型如雨后春笋般不断出现,AIGC的创作方式也在快速进化。我们洞察到了几个新趋势:首先是以ComfyUI为代表的AIGC工作流程的革新,它为个性化创作内容带来了前所未有的便捷;其次,AnimateDiff引领的动画生成展现了动态内容创作的无限可能;最后,DreamGaussian所展现的3D内容生成正开辟着全新的视觉艺术领域。这些趋势预示着一个更加繁荣和多元的AIGC时代即将到来,同时也将带来更多的机遇。1. AIGC工作流革命在Stable Diffusion项目中,目前普遍流行的WebUI,如Automatic 1111,因其缺乏灵活性,让普通用户难以根据自己的想法构建完整的创作流程,也限制了用户对新方法和新模型的尝试。新推出的ComfyUI正在改变这一切。它允许用户通过拖拽节点和连线的方式,将不同的模型、算法和参数组合在一起,形成一套自己的工作流,从而编织出更有创造力的AIGC内容。这意味着,即使是无编程背景的用户,也能够高度灵活和个性化地使用Stable Diffusion进行创作。ComfyUI按需加载模块的设计方式,在保证灵活性的同时,也大大减轻了系统资源的消耗,让装有中低端显卡的电脑也能顺利运行。AIGC的创意很重要,但AIGC工作流更具价值,因为这才是人类创造力的真正体现。让人惊喜的是ComfyUI还可以通过PNG图片共享完整的工作流信息。也就是说,用户不仅可以创造多彩的作品,还可以非常轻松地分享他们的创作流。这直接促进了优秀的AIGC工作流技巧在社区普及和传播,也将带来更多具有创意性内容。ComfyUI不仅为Stable Diffusion带来了更高级的创作体验,它还为我们揭示了AIGC工作流的巨大潜力,预示着我们正步入一个更高效、更具共享性和创新性的AIGC创作新阶段。Shadow最近也在做ComfyUI的课程,大家可以看看效果:ComfyUI的视频工作流2. AIGC动画即将崛起因为创作者不满足于2D静态图像的生成,AnimateDiff应运而生,其目标是将Stable Diffusion的静态图片生成能力扩展到动画生成领域。这一工具可以无缝将文本或静态图像转化为高质量的个性化动画图像,免去了复杂的模型微调。AnimateDiff之所以卓越,是因为它从大量视频中汲取了动作的先验知识,不仅确保了动画的流畅性、一致性和多样性,还能实现无可比拟的平滑过渡,几乎没有任何闪烁。下面是我前几天视频号分享的内容,在24小时内获得大量转发和观看。AIGC动画的优势在于其更高的自由度和容错性。创作者可以释放无限创意,打造出超越现实的艺术品。而且,它改变了传统动画对专业技能和资源的依赖,使非专业用户也能轻松参与。这不仅是技术的巨大进步,更标志着创意表达方式的革新。现在,每个人都有机会成为宫崎骏,创作出令人惊叹的动画作品。这是Shadow做的一个童话故事的实验,故事和gif动画都由AI生成的,请查看时间是主观的,每个人对时间的感受都不同AIGC正从图片领域跃迁到视频领域,预示着新的内容创作浪潮的即将到来。就像我前几天在视频号分享的动画短片,利用AIGC技术,创作者不仅能吸引更多观众,还能获得视频的巨大流量和商业价值。这在传统图文媒介中是难以实现的,这是所有内容创作者都不应忽视的机遇。3. AIGC从平面走向立体同样因为不满足于2D图像生成,也有不少AIGC创作者也在探索如何将2D图像转化为3D形象和场景,因为3D有着比2D更高的灵活性和操控性。然而,传统的文字或图像生成3D算法耗时长、精度低,这严重阻碍了AIGC在3D领域的深入应用。最近DreamGaussian横空出世,它实现了一种高效的文本和图片生成3D算法。它可以在短短两分钟内,从单一视角的图片中重建出高质量的纹理3D网格,其效率是现有技术的十倍之多。更难能可贵的是,尽管处理速度极快,但它在输出模型的质量上却毫不妥协,下图是老算法和新算法的渲染效率比较。DreamGaussian通过采用创新的3D高斯喷洒技术,在虚拟空间中模拟粒子的自然运动,可以精确地构建3D模型。这种技术不只是还原物体的几何形状,还能捕捉其表面的细微纹理和色彩,展现了惊人的细节和还原度。该技术虽已展现出强大的潜力,但它的旅程才刚刚开始,在效率、精度和应用场景上仍然有一定的优化的空间。通过与Stable Diffusion结合,DreamGaussian使内容创作者能够以前所未有的速度和创造力生产出高品质的模型,从而极大地加快了创作流程。更重要的是,3D内容生成技术将为各行各业开辟了新的应用路径。无论是电影和游戏产业的快速内容创建,还是产品设计和建筑领域的可视化原型设计。AIGC 3D将优化现有工作流程,降低成本并激发新的创意表达形式。相信不久的将来,内容消费者能够在内容平台看到越来越多的AIGC 3D视频内容,能够在VR和AR体验中享受到更逼真、高质量的3D环境,实现前所未有的沉浸式体验和交互性。随着这一技术的不断成熟,我们预见一个更加丰富、精细、互动性强的元宇宙即将到来。# 三、机遇AIGC依然在飞速发展,正所谓“春江水暖鸭先知”,一线的AIGC创作者们已经敏锐地感知到这些趋势变化。AIGC的工作流程优化和内容形式迭代,正为创作者、投资人和创业者打开一片新天地。具体的产业机遇主要集中在以下几个方面:1. 内容创作新浪潮: AIGC技术正在降低内容创作的技术门槛,使个人创作者和小型工作室能够更加容易地打造出具有差异化和个性化的内容。即便是没有深厚艺术背景的创作者也能制作出专业级的动画,满足市场对高质量、多样化内容的渴望。2. 广告与营销的革新: 在广告和营销领域,AIGC允许品牌以前所未有的方式创作个性化内容,并快速产出高质量的广告素材。目前,一些知名品牌已经在使用AIGC打造创意广告,通过打造更为生动、引人入胜的广告形式,获得市场的关注。3. 娱乐内容的多元化: AIGC正将娱乐体验推向一个全新的境界,尤其是在直播互动、游戏以及VR/AR等领域。目前,游戏产业正在使用AIGC快速生成游戏环境和角色,为玩家提供更丰富、更沉浸式的体验。4. AIGC教育培训需求: AIGC技术的崛起不仅改变了传统的内容制作流程,也为CG教育带来了革命性的变化。如何精通并利用AIGC技术创作出更多更优质的内容成了每个创作者的必修课,已经有越来越多的教育机构开始提供AIGC的相关课程。5. 算法和算力的需求: AIGC内容创作的复杂性和精细化需求的提升,也产生了算法和算力的迫切需求。创作者和工作室等小型创作群体,也要应对能耗和硬件成本的快速上升,这也将催生更多的算法和算力服务的需求。# 四、展望未来,一个更加繁荣、多元的内容产业将会浮现。在这个产业中,个人创作者能够更自由地表达创意,观众可以享受到更加丰富和个性化的内容,而AIGC创作和服务需求也将因技术迭代和普及而迎来新的增长点。我在《AIGC革命:拐点降临的内容产业,如何赢得时代先机》做了一个论断:如果你能够帮助更多人跨越鸿沟,那你在这个过程中也能获得巨大成功。目前,AIGC技术还在迅速迭代,AIGC技术的使用门槛依然相对较高,但这正是巨大的市场机遇所在。那些能够构建桥梁,帮助大众跨越这一技术鸿沟的企业和个人,将站在价值转化的最前沿。但是将前沿科技应用到大众市场也并非易事。“如何凭自己的能力找一个最容易撬动的价值杠杆,如何用最少的资源跑通一个可持续的商业模型?”依然是考验每一个创业者的难题。请记住这句话:找到你的客户最想要的需求和你能够做得最好的东西,并请专注于两者的交集。PM熊叔,公众号:PM熊叔重新理解创业:一名创业者的中途复盘(2018~2019)我相信,无论是打造更友好的创作工具,还是通过提供教育和培训来降低AIGC的门槛,这些先行者都将收获属于这场技术革命的红利。对于所有的创作者、创业者和投资者来说,现在正是深入了解这一趋势、积极参与并引领这场技术革命的最佳时机。让我们一起勇敢地踏上这条新的征程!最近,我们正在打造国内首个ComfyUI中文社区,期望能够帮助更多人了解和使用AIGC的工作流,我和Shadow已经翻译了ComfyUI的官方文档,目前正在内测中,如果有兴趣可以扫码入群。

2023/10/16
14:43
AI时代的产品思维:如何打造具有商业可行性的AI产品?

AI时代的产品思维:如何打造具有商业可行性的AI产品?

       AI产品其实并不神奇,任何产品的商业价值都在于其对人类的价值。       随着ChatGPT火热,越来越多的产品经理也在考虑为自己的产品添加AI功能,但是事实上并没有那么容易。作为产品经理我经常能收集到各种AI产品的Idea,有些甚至过于科幻,每当我们迫不及待的去实施的时候,结果总是状况百出。       该如何选择更好的技术方案或许是算法工程师关注的领域,但对AI产品来说,如何管理好AI产品需求也是一个重要挑战,这也是AI产品经理的使命所在。       这两年的实践中,我先后做了“Get写作”和“互链文档”两款智能写作产品,前者是针对新媒体写作场景,后者是针对于日常笔记场景。不管是哪个场景,摆在我们面前最大的问题并不是“我们可以用AI打造一款怎样与众不同的产品?”而是:“我们该怎么去定义智能体验?”一、如何定义智能体验?       学术界对于AI智能已经有了一些定义,人们期望AI像人一样,能合理地思考和行动(出自《人工智能——一种现代化的方法》),如下图。       从用户体验角度来看, AI产品的智能体现就是能合理地做出行为决策,换句话说就是“机器能根据输入条件作出合理判断并输出结果”,我们暂且称之为 “自动化决策”。例如,Siri能够合理地回答你问题,虽然有些回答听起来很搞笑,但只要输出的结果让人觉得合理,就依然会被人接受,如下图。       AI的输出是否合理,这个取决于人的主观评判。这也是数据标注工作所做的意义所在——尽可能通过标注让模型更能贴近人的预期。       当我们把一连串“自动决策”串联在一起了后,就变成了一个自动化的业务流程,帮助人类省心省力地完成业务目标,这也是AI产品的价值体现。       例如,扫地机器人通过良好的寻址算法,趁主人不在家的时候扫遍房间的每一个角落,让人觉得省心又省力。但如果在扫地过程中不断需要主人来处理各种状况,如卷了电线和异物,就算这些状况和算法无关,那也会让人觉得不智能。       因此,AI产品的体验效果并不一定取决于算法,而是在产品使用过程中是否能流畅地达到用户预期的目标或价值。       综上,最终决定产品的智能体验感的核心还是在于经过AI的一系列自动决策后,能更好地满足业务场景中的需求。二、AI产品需求的挖掘与管理       根据前面的分析,所谓的AI产品需求管理,首先要挖掘那些能够自动化决策的需求点,其次当这些需求点串联在一起的时候,让产品整体能达到较好的使用体验。前者和算法有关,后者不仅仅局限于算法,如下图所示:       需要强调的是:不管技术手段如何变,产品经理始终都需要以实现商业价值为目标和用户体验为中心来选取具有可行性的技术手段和方案。但反观目前市面上的一些AI产品经理的资料,通篇照搬AI技术的概念,而忽视了产品本质,这是一种舍本求末的表现。       在AI产品需求分析与整理的过程中,我们总结了以下四个关键步骤:1. 收集场景案例;2.绘制决策流程;3. 筛选可行性用例;4. 制定AI产品路线图。1、收集场景案例       我们要教会AI决策,我们就必须弄清楚人是怎样做决策的。 我们应当以实现业务价值为最终目标,专注分析业务场景中的问题。在项目早期,收集实际场景中的业务案例显得尤为重要。       我们可以将收集的案例整理成一个个表格或者卡片,包含要素有:场景概述、业务目标、业务流程、关键决策点、业务痛点、过往案例:       1. 场景概述:用最简洁的一句话说明该场景中的业务要点“谁-做什么-为什么做”,这类似于敏捷开发中的“用户故事”;       2. 业务目标:用于明确业务要达成的最终结果,并为自动决策获得一个可衡量标准。我们可以寻找业务中一些量化的KPI,这不仅是对人的考核也是对AI的考核;      3. 主要业务流程:目的是为了弄清楚当前的系统运行情况:在原有的人工的业务流程是怎么样的?现有的业务流程中有哪些优点或者缺点?       4. 关键决策点:找到关键逻辑决策点,在流程中人是如何做决策的?判断的效率怎么样?判断规则是什么?要输出怎样的结果?       5. 业务痛点:找到产品能够发挥价值的地方,有哪些痛点?有哪些抱怨?       6. 过往的成功与失败的案例:主要是为了弄清楚一些真实情况。能否举出多个成功的案例?能否举出多个失败的案例?失败的原因是什么?会怎么样处理?       在我接触过的项目中,一些业务方对表格中的问题会表现得一脸懵逼,原因很简单,自己都没有弄清楚自己业务的SOP(标准作业程序)就期望AI来帮他们解决问题。这种情况,还是需要由人类先摸索出有价值的SOP,因为人做不好的,AI也很难做好。       如下图,CRM客户挖掘的业务场景案例:每天,电话客服人员需要拨打大量的电话,找到对产品感兴趣的客户,以便于销售人员跟进。对于客服人员来说,工作量大而且重复,容易让人烦躁。       通过这样的收集和整理,让我们对要解决的问题和场景有一个直观的感知,但随着调查的深入我们还可能会发现新的问题。为了不遗漏有价值的信息,这个阶段我们收集的案例,应该有更多发散性。2、绘制决策流程图       通过业务案例的收集,我们可以梳理出一个业务流程图,我们可以使用“UML活动图”来绘制,并且我们还要重点标识出决策的判断点。如下图:       如图所示,起点是挑选客户资料,结束点是标记出有意愿的A类的客户。 为了更加明确,我们将理想的关键流程(Happy path)放到主轴上面,代表决策的菱形节点放在两边,我们可以一目了然,看到那些通向“幸福 Happy”的关键决策。       先不考虑任何实现手段,我们需要先弄清楚,每一个决策点的输入、输出和规则是什么。我们可将这些决策点整理成一份“决策用例清单”,然后再综合考虑是否合适AI自动化决策:用例(Use Case)是UML中术语,一个用例代表一个完整的系统功能单元,但不考虑该系统的内部实现细节。       另外,我们还可以将此清单直观地整理成UML用例图,这个系统参与者有三个:客服,客户,AI。3、筛选可行性用例       根据上面的用例,AI该如何与人类一起工作呢? 并不是所有“决策”都是适合机器做,机器做决策的特点是效率高速度快,但应变性弱并且依赖训练数据,需要保留一定的容错性。       人类做决策的特点是灵活性高,但是效率慢、主观性强等问题。我们可以用“场景决策矩阵”判断,如下图:       按照场景和决策两个维度:       * 场景分为“常规场景”和“细腻性场景”:常规场景中可以收集的数据充足,细腻场景对数据细节要求较高,可以收集训练数据量较少,AI的出错率较高,需要有人类优化和把控结果。       * 决策分为“信息性决策”和“行动性决策”:信息性决策提供的是信息建议并不会直接影响项目执行,行动性决策是直接影响结果的执行命令,例如,智能驾驶。如果AI执行行动性决策任务可能会导致严重项目风险。       我们将这两个维度分成四个象限:       1. 常规性场景+信息性决策:对细节要求不高,学习案例多,AI学习效果较好,AI只提供信息建议,辅助人类决策,出错的风险很低,特别适合AI来做;       2. 细腻性场景+信息性决策:对细节要求极高,学习案例少,AI做出正确判断有难度,AI提供信息建议,由人类为主导AI辅助做决策,出错风险低,早期适合人类为主导,随着模型调优人类可以逐步放权;       3. 常规性场景+行动性决策:对细节要求不高,学习案例多,AI学习效果较好,AI代替人类做行动决策,出错有一定风险性,早期适合人类为主导,随着模型调优人类可以逐步放权;       4. 细腻性场景+行动性决策:对细节要求极高,学习案例少,AI做出正确判断有难度,让AI代替人类做行动决策有很大风险,建议人来做。       我们可以将上面的决策用例做一个基础的判定:排布在场景决策矩阵如下:       通过这样的分类方法,我们能很清楚的知道机器和人类应该怎样分工,案例中大部分决策用例都可以交给机器,但“询问进一步沟通的意图”是很关键一步,如果全权交给机器,效果将大打折扣。这样,我们就有了一张人与AI的分工图:       这时我们有了两条思路:       第一条思路,如果AI效果好的话,那么全权负责整条链路,让人在最后一步把关,这样的好处是效率高;       第二条思路,AI作为一个辅助工具,帮助客服自动化筛选客户信息,做好通话情况记录和打分,一定程度有效提升客服效率,而且结果也可控。       到底哪个方案好呢?       一方面需要根据实际的业务需求判断, 例如,针对高端人群的产品,获取客资成本高,对于这些高端客户来说冷冰冰的机器人电话显得没有诚意,但是普通话不标准的销售人员也可能让人觉得是山寨推销。       另外一方面,我们需要将需求对应到不同的技术模块上,因为算法产品有一定不确定性,贸然使用不成熟的技术,也承担着巨大风险。 作为产品经理,我们应积极与数据科学家和工程师沟通,或许他们也有更好的建议,对于产品经理来说,沟通永远都是第一要务。4、制定AI产品路线图       AI和人一样,需要一个成长过程,这个过程中需要不断的积累数据和调整算法策略。一个好的AI产品路线图,需要给我们的产品规划一个学徒期,从简单的决策开始,再逐渐演变为更复杂的决策。       我们可以根据前面的算法模块的拆解,挑选出哪些需要优先做的模块,我们可以从影响、努力、风险三个维度考虑。如下图:       我们优先选性价比高和风险较低的模块,如果是一些通用性的算法模块也可以考虑使用大厂提供的服务。这样保证产品功能完整性的同时,也降低了不确定性带来的问题。       AI产品相比传统产品更需要大量数据,我们需要提前做好数据埋点和反馈机制,确保产品上线后,能够收集足够的数据,充分了解各种决策及其完整上下文。这样便于算法工程师,持续的优化模型和算法。       另外,为了更早的发现真实场景中的问题, 我们需要让用户尽早地使用我们的产品,但是由于产品还在学徒期,功能不完善、体验不确定,并不适宜大规模推广。我们可以考虑通过邀请制,让愿意尝鲜的用户先体验,这些用户往往比普通用户包容性更强也更加积极,愿意提更多的意见和想法。       基于上面的几点考虑,我将路线图中的需求分成应用层需求和算法层需求两类。       应用层主要是指直接与用户打交道的需求,这部分是偏传统的软件开发内容。细分下去包含,决定产品使用体验的功能性需求;和运营节奏息息相关的增长性需求,如邀请、裂变、积分等;还有用户看不到的但能让产品和服务变得更好的支持性需求,如产品后台、数据埋点与数据统计平台等。       算法层是指与自动化决策息息相关的需求。应用层与算法层通过算法服务提供API打交道,这些API需要根据应用层场景进行调整和优化。但算法只有API是不够的,还需要一些支持性的模块,例如网络爬虫和一些基础算法模型,另外应用层真实的数据反馈对于算法层也非常重要。       在产品早期,我们需要迅速验证我们的业务方向和价值。所以,我们首先需要为用户做好基础场景的建设,并为AI的崭露头角预留出更多的空间,于此同时我们也需要做好算法层的技术建设,然后再逐步引入种子用户不断优化产品。而中期,我们需要提供更多的业务数据反哺算法,形成数据飞轮,做到人无我有的极致体验。最终,我们整理出我们的AI产品路线,让我们的AI产品能够从学徒期慢慢走向成熟。三、结语       在这两年的AI产品实践中,我在产品经理、设计师、工程师之间来回切换角色,不仅仅是为了打造心中所想的产品,也是为了探寻心中的一个答案:“AI时代,产品经理应该如何做产品”。       过去一年,可谓一路狂奔,将原本写产品需求的时间放到了写代码上,不知不觉中,我的github瓦片图也快要被绿色占满,但值得庆幸的是,通过亲手打造的产品,团队也成功拿到了融资。       AI产品其实并不神奇,任何产品的商业价值都在于其对人类的价值。只是不同的技术方案需要考虑的侧重点会有所不同。对于产品经理来说,科技在进步,思维方式需要迭代更新,但也不能全部舍弃,用“进化”这个词来形容我们AI时代的产品经理可能更为贴切。       如果您喜欢我的文章请继续关注我,我将继续更新我在AI产品领域的一些总结和思考。也欢迎一些志同道合的小伙伴,共同探讨,一同进化。

2023/9/24
16:01
AI时代的产品管理:产品经理需要具备的5项技能

AI时代的产品管理:产品经理需要具备的5项技能

    这是我2020年翻译的文章,首先发表在我的公众号“PM熊叔”。3年之后的今天,我们进入了大模型时代,但这篇文章并没有过时。因此我将它的音频重新发布我的播客之中,希望能帮助到大家。    2020年1月25日, 在曼彻斯特产品思维大会上,Salesforce 爱因斯坦系统的产品总监马尤克·博瓦尔做了个分享,探讨了在人工智能时代,产品经理需要做哪些调整,以及如何打造成功的人工智能产品, 演讲主题《人工智能如何重新定义产品经理》    一、故事    在步入正题之前,我们从一些有趣的故事开始:    1、AI重新定义职业    在几个月前的马萨诸塞州剑桥城,聚集了在成百上千的技术爱好者,一名来自斯坦福的教授在探讨人工智能是如何改变世界,探讨传统的职业是如何被AI打破和瓦解的。这位教授就是吴恩达,一家名为“Landing AI”的公司的创始人,他也是著名的在线教育公司Coursera的创始人。在他的分享中提到了一段产品经理的工作的场景画面。    以聊天机器人应用程序为例。在互联网时代,如果我们的产品经理正在设计一款新的网页或APP,那画线框图是必不可少的环节。通过原型图,产品经理可以告诉工程师这款程序应该是什么样子,而工程师将根据原型图方案进行实现。这就是长期以来,硅谷和科技公司的产品经理和工程师协作的方式。但在人工智能时代,这种旧的工作方式将变得无效。    假设你在做一个聊天机器人,那又会怎么样呢?    例如,我们在打造一个“行为疗法”的聊天机器人,通过与机器人聊天的方式解决美国人的心理疾病。如果展示在线框图上面,或许是这样:    机器人说:“你好~”    用户说:“我不开心”。    机器人:神奇地展示了一张图片,括弧:一张源自于NLP生成的图片    这完全没有用,我不需要知道对话的气泡的形状是怎么样的,我需要知道谈话的实质是什么,我的聊天机器人如何能够感知到用户发生了什么。传统的产品经理通过线框图为聊天机器人提供产品规格,但对于工程师来说更需要了解内在的逻辑。    2、产品经理再造    在加利福尼亚的旧金山,有一个叫做洞见数据科学(Insight Data Science)的组织。前不久,他们开办了一个为期七周的集训项目,帮助来自不同背景的专业人士转行至软件工程和数据科学领域。我的法国同事利昂·麦奎尔,她拥有神经科学博士学位,她加入了他们的数据科学项目,并在林肯获得了一份数据科学家的工作。最近,我从人工智能产品主管杰里米·卡拉斯科得知,他们正在启动一个全新的项目。此项目称为数据产品经理项目或者AI产品经理项目。杰里米认为,对于更传统的产品经理来说,他们需要掌握必要的技能,能专注于数据、更懂得如何利用AI来打造产品。    最后,Salesforce 爱因斯坦的产品副总裁马可·卡萨莱纳正与他的团队合作开发一门新的课程,这是一个针对的内部培训课程,为人工智能和机器学习带来的第四次工业革命做准备。    我问马可:“这门课的目的和目标是什么?”他说:“我们要让我们的产品经理们获得一些感知力,让他们能够快速地评估用机器学习解决业务问题的可行性,知道哪些业务问题适合使用AI,又有哪些不合适。”    人工智能时代,产品管理发生怎么样的改变?作为产品经理,如果要打造一款成功的AI产品,你又需要掌握哪些技能呢?    二、产品经理的奥林匹克竞赛    工程学作为一门学科已经存在了几千年。它的历史可以追溯到埃及金字塔工程和军事工程。一千多年里,诞生了机械工程、发明了蒸汽机,工程管理已经是一门非常成熟的学科。相较于工程管理,产品管理要年轻许多,其历史不到一百年。最早的产品经理,实际上做的是品牌管理,他们被称之为“品牌人”。在制造业中,它又变成了“产品线经理”。    随着软件业的发展,它又发生了一些改变,使用着像Scrum这样的敏捷方法。这让我想起了职业体育。回顾过去的50到100年里,电视里重复播放着每一个世界纪录是如何打破的。我相信,不管你是在运动场上还是在家中舒适地观看,这已从根本上改变了你参与运动方式和情感的寄托。    电影《点球成金》普及了体育分析方法。另外,有更多的高科技装备和运动器材出现在每隔四年的奥运会上,每一次都会有新的世界纪录。我们的确走在“更高、更快、更强”的道路上。最后,越来越多的女性也开始从事职业运动。    华盛顿邮报还特别提到:女性在男性运动中的领导地位。其实,产品管理就像是一项运动比赛,随着人工智能和软件行业的发展,它也正在被重新定义。世界正在改变,AI产品经理正在崛起。如果你细想一下我讲的故事,就会发现那些针对产品经理的新要求。    三、产品经理的新技能    通常,产品经理需要跨职能地串联起每一个利益相关者,如:销售、市场以及开发。但是对于AI产品经理,你还需要串联起另外两个重要角色,即数据科学家和数据工程师。    同时,产品经理还需要更新技能树的五个方面:    1. 问题映射,    2. 数据是新的UI,    3. 验收标准,    4. 可解释性、伦理和偏见,    5. 将研究迁移到生产。    1、问题映射(Problem Mapping)    随着人工智能的热潮到来,你可能也会面临着新的执行压力,需要考虑如何将AI应用到产品之中。但是我们在考虑问题的时候,却常常忽视了将这些技术方案映射回业务问题上。    AI产品经理需要能够将业务问题与机器学习或深度学习问题相匹配。这包括理解业务需求,明确定义问题,选择合适的算法和技术,以及为团队提供清晰的问题定义。随着技术的不断进步,AI产品经理需要不断学习如何更好地将业务问题映射到技术解决方案。    AI产品经理必须能够清楚地表达产品的价值主张。产品经理必须先考虑传统的方法、评估使用传统的规则引擎来解决问题,而不是冒着风险去做。我们先举一个如何提升客服效率的例子。像亚马逊和优步这样的大公司都有庞大的客服部门。每天都会新增大量的客服工单。例如,顾客可能会抱怨:    “我的订单在哪里,为什么还没有收到?”    “收到了错误的订单,我需要更换”    “我需要退款,优步司机取消了我的订单,但是费用还没有退给我!”……    这个部门的目标就是尽可能快地解决掉这些不断涌现的客服工单。因此,系统的衡量指标就是如何尽可能地缩短解决工单的时间。    作为一名产品经理,我会先思考要解决的问题,会考虑传统的方法、流程和规则引擎——最好的引擎是已持续使用了一段时间的。这个案例中存在一定的问题,“分类”和“产品”这两个字段值是空的。    因为这些字段有助于正确地将客服工单指向到正确的部门。从而让它们可以得到快速解决。如果缺乏这些字段,客服工单很可能会被错误的分配到其他部门。导致它们在不同的部门之间来回流转,从而浪费了宝贵的解决时间。    可能,每个产品经理会这么想:通过使用一些规则,根据客服工单中的其他字段来填写此字段中的值。但通过进一步分析,我们会发现这样的规则是很繁琐的。它不会随着时间的推移而扩展,它将变得难以管理。坦率地说,有时候一个严格的规则并不能真正抓住价值。但倘若你有一段自由格式的文本并缺少关键字段和描述,您无法找出将其映射到“产品”和“类别”的规则。    此时,你就可以使用人工智能了。实际上,这可以建模为一个多分类问题。这些字段中的每个值都对应多个分类。您可以通过肉眼从历史的客服工单中学习和获得相应的感知,例如通过查看标题和描述来确定预测值应该是什么。    在我们的“爱因斯坦”系统中,我们可以看到这些字段的预测值。每个预测值都有相应的置信等级。人们可以通过肉眼使用传统的方法进行评估,而不是冒着风险使用AI去解决问题。请记住,我们每时每刻都应该将解决方案映射回业务问题上——即缩短客服工单的解决时间。    2、数据是新的用户界面 (Data is the New UI)    在AI时代,数据的质量严重影响着用户体验。AI产品经理最重要的职责之一就是提供数据规范。    众所周知,数据是任何机器学习算法的基础。    我们首先要问的是:我们有足够的数据吗?如果没有,那么也就没有训练机器学习模型的数据集,也就无法从数据集中的预测信号中进行学习。    第二个要问的是:在现实世界中,你的数据有多干净或有多少噪声?但据我们所见,你的大部分数据都是非常混乱和充满噪声的。它可能存在于第三方系统中。当你开始给机器学习之前,你可能还需要连不同来源的数据,再导入到数据仓库之中。    第三个要问的是:历史数据中是否存有用来给机器做监督训练的样例?也就是所谓的监督分类问题。如果没有样例来训练机器学习模型,数据科学家还得想其他的办法。    以一种通用的图像识别的AI产品为例。    一般的目标数据集,在互联网上面可能都能找得到。如果你用这个来分类猫和狗,它会表现会令你大吃一惊,大概100%的准确率。但是如果你用同样的产品从医学诊断中检测肿瘤,它的表现很差,因为它从来没有真正看到过数据,也从来没有真正地训练过。    实际上,通常情况下你可能甚至没有标注好的数据来满足机器学习的训练需求。必须强调的是,数据是一个全新的维度,这在传统的产品文档中是完全没有的。正如一些人对智能产品说的那样:数据是新的用户界面和用户体验。3. AI世界的验收标准(Acceptance Criteria in the world of AI)    在产品应用于现实之前,它的验收标准是什么?在传统的产品管理中,这可能是功能的完整性、打开页面的数量、合适的完成提示等等。    AI产品经理需要明确定义和衡量模型成功的标准。这涉及到确定模型的性能指标,如准确率、召回率、F1分数等,以及如何将这些指标与业务目标相联系。了解如何设置合理的验收标准是确保项目成功的关键。    这里举一个欺诈分类的例子,我们试图将欺诈交易从正常或良性交易中分类出来。    这是一个理想分类器的例子,它能将每一笔欺诈性交易都归为欺诈,良性的交易依然还是良性。数据科学家会惊讶地说:这是完美的精确和完美召回率,但这只是一个永远无法实现的梦想分类器。    在现实世界中,它可能会滑向两个方向:要么会漏掉一些欺诈行为,但它仍然有完美精确率(如下左图);要么在识别出欺诈行为同时也将一些良性行为误判为欺诈行为,也就是引入了假阳性(如下右图)。    作为产品经理有责任根据服务所在的领域来明确清楚正确的用例度量指标,以便数据科学家能够采取相应的举措。在这个例子里面,产品经理不需要拥有航天科学家一般的智慧,但需要知道欺诈交易是有害的,其代价远远大于在实际中引入的假阳性。    不过这还不够,一旦你找到了正确的度量指标,你还需要弄清楚阈值是多少,什么时候需要达到你认为的合理数值,精确率是否要达到80%或90%。当你思考这个数值是多少的时候,你必须再次考虑业务指标,并回溯到数据科学的指标上。    再举一个销售领域潜在客户评分的例子。    我们正试图预测潜在客户销售成功的可能性。例如,格雷格·汤姆森先生得分是88。这意味着他有88%的可能性转化为订单。但比较棘手地方在于它是一个转化率,我们还需要考虑整体的转化漏斗。    这里有两个重要的指标:    一个是由产品经理根据业务需求所决定的业务指标;    另一个是针对当前的案例,与数据科学家和数据工程师合作得出的数据科学指标。    而后者能帮助你在商业中树立竞争壁垒。    因此,当你准备向实际用户推出AI产品的时候,你可以先明确这些额外的验收标准。    4、可解释性、伦理和偏见(Explainability, Ethics & Bias)    AI产品经理需要了解如何解释模型的决策,以便用户和利益相关者可以理解并信任模型。此外,他们需要考虑数据偏见和模型偏见的问题,以确保不会导致不公平或有害的结果。    如今,我们的许多客户正在体验我们的这套预测应用。其中最常的问题是:“为什么机器学习模型没有做出它所做的决定呢?”事实上,人工智能软件根本不同于传统软件。    因为它的结果并不是基于一组写好的代码产生的。随着时间的推移,随着数据和反馈循环的加深,该软件的会越来越像一个黑盒。但我们还需要考虑可解释性,因为这将有助于建立用户对产品的信任。    这里有一张图,能够帮助我们评估可解释性和精确性:    从图中可以看出,我们需要为机器学习的可解释性和精确性做极大地权衡。相对简单的模型,如线性回归或决策树,准确性较差但可解释性较好;而神经网络、深度学习的准确性极高,但却更像个黑盒。产品经理需要根据特定的应用场景和用例来做出决策。如果你的产品面向于一个高度监管的行业,法律要求这些预测是可解释的。比如,医疗健康和法律领域需要符合欧盟的《通用数据保护条例》。    可解释性和精确率之间应该如何平衡?作为产品经理需要相应的保持洞察力,并在第一时间与数据科学家和数据工程师保持同步。另外,产品经理也需要想想这个产品是否有性别和伦理方面的影响:如数据需要具有足够的多样性、典型性,或者不能产生如种族歧视和性别的偏见问题。我最喜欢举的一个例子是谷歌翻译,左边是无性别区分的土耳其语,右边是对应的英文翻译。    如果你顺着往下念很快就能发现这个偏见:    他很努力地工作(AI用的是单人旁的他),她很懒(AI用的是女字旁的她)。可见灾难性的性别偏见已经渗透到了这个产品中。    或许你会想到一个功能来去剔除掉性别。但事情没有那么简单,性别是医学诊断的一个极其重要的特征和信号。例如,前列腺癌只发生在男性身上。可能在翻译产品中关系不大,但在人力资源招聘系统中匹配求职者的职位描述关系非常大。我们似乎应该要提供一些关于如何处理偏见引导。去年12月,谷歌发布了一个版本,解决了翻译中存在偏见的问题,每一个中性的短语,它都会给出男性化和女性化的翻译。    5、将研究投入生产(Scaling from Research to Production)    AI产品经理需要了解如何将研究成果迁移到生产环境中。这包括将训练好的模型部署到生产服务器、建立实时或批处理的数据管道,以及确保模型的持续监控和维护。将研究成果转化为实际产品需要跨越从研究到工程的鸿沟,需要不断学习和适应新的工具和技术。    最具有挑战性的问题是,机器学习项目所需要的成功要素,研究环境和实际投产环境完全不同。下图源自一本非常有名的出版物,叫做《机器学习的隐性债务》:    真实世界的机器学习系统只有一小段代码,如中间的小黑盒所示。这与大家普遍认知相反,您可能会认为机器学习是你的人工智能产品的最大和最主要组件,但实际上它只是一小块。其所需的周边基础设施庞大而复杂,有配置、数据采集、数据验证、资源管理、特征抽取、分析工具、线程管理工具、基础服务设施和监控等等。    在我们的Salesforce的爱因斯坦系统,也有一张非常相似的架构图:服务器、配置、数据存储、ETL数据处理、计算、机器学习算法、编排、度量标准、数据科学经验、模型的生命周期管理、健康监测和基础设施等等    数据科学家和数据工程师实际上正在设计这样的一款产品,它需要能够回答各式各样的问题才能真正被带到生产环境中去。    “请确认你的数据是本地还是在云端?”    “请确认你的机器学习模型是在服务器上,或者不需要分发到移动设备?”    “是否准备重新训练你的机器学习模型,动机是什么?”    “请确认产品是否需要实时预测能力?实时预测虽然有用,但这又是非常复杂和难以设计的,又或许您可以使用一个离线批处理系统”……    每一天都会有成千上万的研究成果发表,但却少有应用到实际的规模生产。所以作为AI产品经理,我们必须建立起敏锐的洞察力:判断哪些产品值得投入,判断哪一种产品能够为实际的用户真正地产生价值。    虽然最近AI很火,但它在20年前就已经存在了。过去主要应用在搜索和广告领域,你在谷歌时看到的搜索建议、你在雅虎上看到的推荐广告、你在亚马逊上搜索时的自动更正……如果你在搜索和广告领域工作那必须提供明确说明,并且与数据工程师紧密的合作。    如今人工智能的应用领域呈指数级增长, 同时也需要产品经理提供大量明确的产品规范说明。如图所示,通常的AI产品开发阶段划分为:奇特的算法、炫酷的DEMO、试点、一般采用、商品,这五个步骤。在炫酷的demo之后,AI产品会陷入鸿沟之中,无法推向市场。    不管你的数据科学家们是多么的喜欢你们的小花园,或者你的营销演示又多么有创意和多么酷。 “AI产品鸿沟”很可能会成为你的AI产品普及的障碍。    作为一个孤岛,越来越多的AI产品需要管理。    作为一名产品经理你需要提升技能树。在你的工程项目中,能够实际地为数据科学家提供有价值的需求和规范。    最后,请你回答一个问题:    当你面对一个真实的具体的客户痛点,你是否有能力打造一款有用的产品,而不是仅仅地做一个很酷的功能?

2023/9/22
20:49
和西坡聊“整体产品”:一位AIGC产品经理的实践思考

和西坡聊“整体产品”:一位AIGC产品经理的实践思考

西坡(公众号:西坡居)是我的产品知识星球里面的嘉宾,这是他的原创文章,文章写得很好,有实践、有思考、有方法,也欢迎越来越多的朋友一起探讨关于AIGC的产品实践心得。从2023年4月开始,考研落榜的我参与了春招,并凭借丰富实习和项目经验拿到了一些offer。然而,出于对AIGC事业的浓厚兴趣,我毅然选择了这个领域。于是我见证了国内ChatGPT、Midjourney、Stable diffusion的崭露头角,经历了账号销售与课程热潮、百模大战、GPT4的发布、生成式AI的合规管控,以及国内首批大型模型向公众开放,至今我们已进入AI应用的大爆发时代。刚开始,我的职责与许多的产品经理相似:拿到需求,进行需求分析,绘制产品原型,输出需求文档,召开需求评审会,并跟进至需求完全落地。但由于无论是产品还是技术,仍处在一个比较早期的阶段,并没有拿到太多的反馈,像是在摸着石头过河,走一步看一步,并且能看到竞品也在飞速地迭代。实话说,内心是着急的。所以不断的在尝试接触业务,C端业务,B端业务,去询问用户想要什么,需要什么,我们的产品哪里不行?结论是:过去的一段时间,我们的产品没有解决用户真实的需求,有点用但不完全有用,可以白嫖但不愿付费。作为AIGC的产品经理,不仅需要有产品设计能力,更要确保产品的技术实现与用户体验和价值同步。而当你负责大型语言模型相关产品时,还需掌握技术框架设计、Prompt工程编写以及最终效果的评估和验收。因为在早期,技术人员往往缺乏这些能力,因为他们难以深入业务。甚至部分的产品经理也接触不到具体的业务。但时间证明,如果一个新业务的产品没有得到市场的真实反馈和业务接触,那么你会陷入迷茫。同时,对竞品的了解仅停留在表面,产品最终可能会走入死胡同。这促使我反思:产品的价值真的仅仅取决于技术进步吗?我想不是的,产品的价值来自于用户,来自于企业,来自于实际应用。好像这半年是技术在推着产品走,而不是市场和业务推着产品走。这是大公司和创新企业可以做的,但小公司亦或是小团队不行,小团队的创新投入成本和技术能力达不到长时间、大规模创新的成本要求。小团队需要做的应该是回归产品的本质,发挥产品真正的价值。反观大厂,大型企业可以投入“百模大战”,享有标准化的产品服务、高质量稳定的产品线和庞大的客户群。对他们来说,用AI赋能现有产品要比新建一个AI产品再补充基础服务来得更为经济、高效。这并不意味着小团队不能创新,只是他们的创新应更多地集中在产品定位、服务方式和商业模式上。在AIGC这样的新赛道,身为小团队的产品经理我认为需要什么?也是我个人在努力的方向。1. 敏锐的市场洞察能力:从三四月份的“套壳AI软件”,到七八月份的“C端产品”,到如今九月份,C端产品基本实现覆盖,B端产品的刚刚起步阶段。快节奏,稍纵即逝,慢一步就容易步步慢。2. 整体产品的思维:什么是整体产品,我看到一篇喜马拉雅产品经理熊叔的观点,我比较认可。“你在营销时向顾客承诺交付的产品(即强有力的价值主张)与你实际交付的产品是不一样的,两者之间存在落差,要消灭落差。必须强化产品,增加配套服务和辅助产品,使之成为整体产品”。文中列举的例子可能并非普遍适用,但足以让我们理解到莱维特整体产品模型的理念。1)通用产品(基本产品):iPhone作为一个通用产品,是一款移动智能手机,具备通话、短信、上网等基本功能。这是用户购买iPhone时实际获得的基本产品。这些功能我个人总结为C端用户的高频词,硬性需求。2)期望产品:用户在购买iPhone时期望获得更多,他们期望高质量的手机性能、良好的摄影体验、顺畅的操作界面等。期望产品还可能包括更新的操作系统版本、安全性等。也就是优质的用户体验。3)延伸产品:为了提供更完整的体验,iPhone提供了一系列的延伸产品。例如,Apple Store中的App Store提供了海量的应用程序,能够满足用户各种需求;iTunes Store提供音乐、电影等媒体内容;Apple Care服务提供了额外的售后支持,延伸产品增加了iPhone的价值。4)潜在产品:iPhone在不断地发展中具有潜在的产品创新空间。随着技术的发展,iPhone可以不断升级、引入新的功能,比如更强大的摄像功能、更高效的处理器、更先进的安全性等。此外,随着5G等新技术的普及,未来iPhone可能会在网络连接和应用上有更多的创新。整体产品思维与产品的MVP思维,在通用产品部分是高度一致的。也就是说我们的产品出发的时候也要想好它的核心功能是什么?提供的基础价值是什么?有没有满足用户的真实需求?而不是上来就强加亮点,那或许能吸引到一定的用户,但能不能把用户留住,靠的一定是高频次的使用需求。3. 敏捷开发的意识:如何合理地利用好有限的资源做有价值的事情,对公司业务负责,也对研发人员负责。想清楚产品开发时的产品定位是什么?用于验证技术的demo,用于客户展示的样品,用于投入市场的完整产品等等产品需求,不同的需求,我们的投入都是需要评估的。这既能保证团队的高效,也是打造团队凝聚力的保证。因为在一线做产品经理,我发现不管是自己,亦或是研发人员,当做出来的东西没有得到正向的反馈是会有挫败感的。短期可以,长期不行。因此就需要具备敏捷开发的意思,什么样的需求做不做,怎么做,做到什么程度,都是需要去思考的。4. 成交理念(产品定位+商业模式):在产品立项之前,我们需要做出比较充分的准备,在产品开发,迭代和用户提出反馈的过程中才不会手足无措。你做的产品使用的用户是谁?谁来为他买单?这个问题不会受技术发展或者什么探索阶段的影响,因为用户为产品买单只会因为一个原因,那就是这个产品解决了他的需求,不管是情绪价值需求,亦或是生产价值需求。其次就是你的产品功能迭代,健壮性是否满足?它的商业模式是什么?能不能打造业务的闭环?产品可以赢在功能上,更可以赢在商业模式和产品定位上。5. 业务意识:与成交理念很一致,但业务意识不是为了促进买单,而是为了留住企业和用户。特别是在AIGC这条赛道上,如果没有业务意识,做出来的产品可能是一个玩具,而不会成为一个产品或生产工具。AIGC让我们有快速生产内容的能力,但如何制作能够直接投入生产的产品,就需要我们融入到具体的业务中。举个例子,文心一言、ChatGPT可以快速的帮我们生成报告,论文或者内容,但生成什么样的内容,这个内容还需不需要人工介入?能不能直接用,这是我们需要思考的。6. “重产品而轻技术”:从天马行空到踏实可行,在生成式人工智能的快速发展下,我们的优势在于想创意的时候可以天马行空,底层的技术能力已经超过了所谓的摩尔定理,技术的发展只会超乎我们所想。但当要落地到产品的时候我们要想,我们究竟解决的是什么痛点,解决了用户什么具体的需求。总结下来,AIGC产品经理需要什么?长期和敏锐的市场感知,整体产品的产品规划能力,敏捷开发意识,直达收益的成交策略,深入的业务意识,“重产品而轻技术”的理念。来自AIGC领域一线产品经理的肺腑之言。欢迎指正。

2023/9/14
09:08
突破不可能三角: AI创作工具,如何走出用户采纳的鸿沟?

突破不可能三角: AI创作工具,如何走出用户采纳的鸿沟?

随着AIGC的火热,越来越多的AI创作工具展现在我们面前,越来越多创作者也在尝试新工具和新方法。但实际上真正的问题才刚刚开始,在昂贵的流量和算力成本之下。用户面对着大量雷同的AI工具的时候,新用户如果无法留存那就是意味着成本的损失。如何让新用户真正的采纳我们的产品也显得尤为重要。像Midjourney为了抵御羊毛党,就直接关闭了新用户25次的试用机会,因为疯狂涌入的用户也影响了付费用户的体验。2019年,我们在GET智能写作创业的过程中,也遇到类似的问题。随着流量的不断增长,没有带来任何有价值的留存,成本不断上升,系统问题不断,团队处于困局之中。一、不可能三角当时我遇到最大的挑战是运营耀眼的宣传、用户超高的预期、技术无法达到的效果,三者构成的不可能三角。初期,我们通过一张名为“开启AI写作新时代”的裂变分销海报,在自媒体的朋友圈引爆了话题。新用户纷纷涌入,我们自以为是个成功的开始。然而,产品内部却像一个破了洞的木桶,用户流失率不断攀升。上线后,将近一个多月的修修补补,问题并未好转。因为产品稳定很差,经常出各种奇奇怪怪的Bug,而且我们主推的文本生成的算法效果一直不好,用户抱怨很大,用户纷纷退款。另外,迫于融资的压力,CEO急于看到直线上升的DAU,从流量投放上并没有松懈,并没有带来太多留存,而且投放渠道的精准流量也很快被我们榨干。但这种饮鸩止渴的策略,让项目基本陷入了僵局。作为产品合伙人我也背负着巨大的压力,我在翻看营销学经典著作《跨越鸿沟》的时候,突然意识到我们犯了三个严重的错误:1. 没有遵循产品采纳周期的客观规律,过早地跳入大众市场的鸿沟;2. 在产品还未成熟的时候使用的是营销驱动增长的模式而不是产品驱动增长;3. 没有建立一个合理的数据指标体系,被虚荣指标冲昏了头脑。我们应该如何扭转这个局面?二、坠入鸿沟《跨越鸿沟》中有一个著名的“产品采纳周期曲线”,它将科技创新型产品的潜在客户群分为五种类型:创新者、早期采用者、早期大众、晚期大众和落后者。创新者和早期采用者是最愿意尝试新产品的群体,他们对创新和变革有着强烈的好奇心和热情。落后者则是最抵制新产品的群体,他们对创新和变革有着强烈的恐惧和排斥,他们只有在别无选择时才会使用新产品。在早期采用者和早期大众之间存在一条很难跨越的鸿沟。因为这两个群体有着不同的心理特征和需求。如果新技术或产品不能成功地跨越鸿沟,并进入主流市场,那么它就很可能失败。因此,我们还需要在不同阶段,针对不同客户群设计不同的营销策略和产品策略。其实,在智能写作项目最初阶段,我们也做了一个核心功能的Demo。当把它交给一些愿意尝鲜的用户试用时,他们给我们的反馈也是积极的。其实,这些用户都是愿意接受新事物的创新者,对于新技术有着极高的包容度,他们对产品的潜力充满信心;另外用户对待Demo的宽容度是不一样的。但Demo测试的反馈并不能等同于大众市场的反馈,大众市场要的是一个稳定实用的产品。然而,这时我们犯下了一个致命的错误,我们错误地将这些试用者的反馈等同于大众用户的反馈。更要命的是产品还未上线,我们就信心满满的做预售,就采取了大规模的投放和裂变营销,进一步拉高了大众市场对于产品的预期。最终,使得产品刚迈开第一步,就已然踏入产品采纳的鸿沟之中。三、产品采纳“产品采纳(Product Adoption)”指的是用户从发现、了解、试用到长期使用我们的产品的过程。只有当用户能够持续地使用我们的产品来解决他们的问题,我们打造的产品才有意义。产品采纳的过程通常有四个阶段:1. 知晓阶段:用户了解产品的存在和基本功能。2. 兴趣阶段:用户对产品产生兴趣,开始寻求更多关于产品的信息。3. 尝试阶段:用户决定尝试使用产品,体验其功能和效果。4. 采纳阶段:用户认可产品的价值,愿意继续长期使用并购买产品。特别是对于新推出的产品或技术。在产品发布后,“产品采纳”决定了产品在市场中的成功与否。如果产品能够得到广泛的采纳,吸引更多的用户使用,就有可能实现持续的增长和商业成功。对于新用户来说决定他们是否采纳新产品,既有推力也有阻力:1. 推动力:当前使用产品还存在尚未解决的问题,会把用户推向新产品;2. 吸引力:新产品能够提供新的解决方案,会吸引用户尝试新产品;3. 焦虑:全面采用新产品是否存在不确定的风险,会让用户返回老产品;4. 习惯性:不想改变已有的使用习惯,会让用户放弃使用新产品。制定产品策略时,我们应该充分考虑这四种力量对新用户的影响。帮助新用户顺利迁移到新产品,我们通常会采取如下措施:1. 打造独具价值的功能或服务:通过提供更好的功能或服务解决旧产品尚未解决的问题,并在宣传上突出新产品的独特优势和吸引力,让用户认识到采用新产品可以获得更多好处和便利。2. 良好的新手体验:提供简单易用的界面和功能,以及提供演示和试用来帮助用户快速上手,让用户感受到新产品与众不同的价值;提供使用指南、视频教程、知识库和客服支持,减少用户对新产品的焦虑感并增加继续使用新产品的信心。3. 打造丝滑的迁移体验:对用户支持和帮助,提供迁移工具或优惠措施,让用户低成本、无负担、毫无阻力地迁移到新产品。4. 提供稳定服务和持续改进:倾听用户反馈,持续改进产品,满足用户需求,并积极回应用户的问题和建议,让用户能够感知到产品在稳定迭代,赢得用户的长期信任。5. 建立活跃的产品社区:鼓励用户参与社区交流,分享使用经验和成功案例,增强用户对新产品的认同感和归属感。在我们的智能写作的营销宣传中,成功的勾起了用户的好奇心,带来了很强的产品推动力和吸引力。当他们看到了1分多钟的介绍视频后,往往都会想迫不及待的尝试。如果新用户只是随便地尝试一下,他们会被生成文章的速度之快所震撼。然而,一旦用户开始真正使用我们的产品进行写作,他们就会发现效果和想象的完全不一样,他们很快放弃继续使用了。因为用户如果只是随便尝试,很难注意到生成文章的细节,例如上下词句的连贯性。但是当他们在真正实用的时候,他们会开始字斟句酌容不得一点逻辑错误。所以“快”并不是智能写作产品唯一的评判标准。如果效果不好用户宁可不用。因为他们并不需要一个生成垃圾文章的工具。我们自以为完美的逻辑,当暴露在现实的X光下的时候,已无法经得起推敲。另外,迫于数据指标的压力,就算面对一堆的问题,我们也并没有踩住流量的刹车,大量流量的依然持续涌入。由于产品稳定性不足,我们的开发团队整天被埋没于用户的埋怨和反复出现的Bug之中。面对一团乱麻,产品迭代几乎停滞。这也影响了产品的口碑,带来的是负面的传播,每个投放渠道的留存率也越来差。更不幸的是,当我们如火如荼地将产品推给大众时,竞争对手也没有闲着,没过两个月就有竞品精确地“复刻”了我们的产品,而且算法的效果还要比我们更好一些,让我们完全处于被动的地位。四、走出鸿沟已经无路可退,我们必须要做出点改变,我开始尝试破局:1)达成共识首先,我们的当务之急是停止流量的大规模导入,当潮水褪去之后,我们才能发现真问题,才有时间对症下药。但这并非易事,如果停止流量导入必然引起巨大的数据波动。我们的市场先发优势还在不在?如何对投资人交代?如何进行下一步的融资?这是一系列问题。大家都清楚,停止流量导入是为了更好地优化产品和用户体验,但同时也不能忽视市场竞争和投资人的需求。在一次周会上,CEO强调市场竞争的激烈性,希望团队能够在优化产品的同时,保持一定的市场份额和增长速度,但运营也已经被用户的抱怨折磨得焦头烂额。CEO、运营、技术、产品都有自己的观点,整个团队陷入了一场严重的矛盾。在经过多次讨论和妥协后,大家终于达成了一个折中的方案:分阶段的收窄流量,以减少数据波动带来的影响。同时,整个团队将专注于产品的改进和用户体验的提升,以吸引更多核心用户和早期采纳者,运营配合收集产品反馈和用户维护的工作,但是因为要配合融资的节奏,时间窗口相当有限。2)褪去潮水流量的闸门徐徐落下,但关闭之前,我们部署了所有关键功能的数据埋点,制定了新的看板。因为用户调查和数据分析成为我们寻找问题根源的重要工具。每周,运营通过问卷的方式收集核心用户的使用反馈情况,产品也在高频地做用户访谈和可用性测试。通过用户调查,我们深入了解了用户的核心问题。例如,很多用户抱怨“不知道怎么用”,我们原以为是UI和交互的问题,但是深入访谈之后才发现,“不知道怎么用”是指“无论怎么尝试,生成的文章都不如预期”。一些用户表示,虽然可以快速生成文章,但由于质量不尽人意,最终还是需要花费大量时间来修改,与预期相差甚远。数据分析也为我们揭示了问题的实质。用户在试用产品后,平均停留时间较短,且许多用户只是单次试用,很少有持续使用的情况,用户的实际的功能采纳率非常低。用户流失率成为我们最头痛的问题之一。虽然我们曾以速度和效率为卖点吸引了一部分用户,但随着体验质量的暴露,我们也不得不面对现实。只有解决了这些问题才是我们走出困局的关键。我们召开了多次紧急会议,成员们围绕着问题的根源展开激烈的讨论。技术团队认为需要加大投入,优化算法和提升数据精准性;运营团队则强调用户维护的重要性,希望加强与用户的沟通,了解他们的真实需求和痛点;产品团队则主张从用户角度出发,重新设计产品,以提供更优质的写作体验。3)走出鸿沟在进一步明确了问题后,我们决定采取全新的策略改变困局。我们深知要实现这一目标,需要整个团队的共同努力和坚定决心。新策略的核心是重新调整产品的定位和增长方式,将重点从速度和效率转向最终的文章质量和用户体验。以下是我们制定的具体措施:1. 放弃营销驱动型的增长模式:我们采用产品驱动增长(Product-Led Growth),从夸大预期的营销宣传,转变为切实可行的产品体验。用一句话概括就是做“用户最想要的且我们能做到最好的”,让产品本身的价值和优势吸引用户,从而实现持续的用户采纳和增长。在产品推广中,我们去掉了一些容易夸大预期的宣传语,例如“AI一键成稿”,更强调产品在场景中的价值,如“一站式的智能辅助写作工作台”。我们以用户满意度和口碑传播为重要指标,建立起用户为中心的增长模式。2. 跑通核心场景的体验闭环:随着流量衰退,真正有刚需的用户群体开始浮出水面。我们通过用户访谈、问卷调查和数据分析,深入地调研了不同用户画像人群,详细了解用户需求、痛点和行为习惯。最后,我们找到了最适合的目标场景——公众号文章的写作。基于这些调研结果,我们弱化了“一键成文”,把重点放在了热点话题、文章素材、润色改写和质量检测等更具实用性的功能上,并在产品中提供了实用性的视频操作教程,帮助用户能够更快的创建出一篇可用的文章。通过打造核心体验闭环,确保目标用户在使用我们的产品时获得无缝连贯的体验。3. 建立新数据监测系统:为了更好地了解用户行为和采纳情况,我们自建了一套数据监测系统和数据看板。通过收集和分析用户数据,我们可以实时掌握产品使用情况和用户反馈。相较于日活、注册率、转化率等虚荣指标,我们会更关注留存率、流失率、CAC(单位获客成本)、ARPU(单位用户收入)、TTV(产品价值交付时间)、PAI(产品采纳率指标)、NPS(净推荐值)等具有长期意义和针对性的指标。通过有效的指标定义和监测看板,可以找到真正忠实用户,帮助我们评估策略的有效性,并及时调整和优化产品。这确保我们的决策和行动都有客观的数据的支撑。4. 搭建产品社区:我们搭建了多个核心用户的微信群,我们实现了与用户建立更紧密的联系。在这个群里,用户可以直接向我们提出问题和反馈意见,我们的团队会积极回应,及时解决用户遇到的问题和困难。这种即时的沟通和反馈机制,让用户感受到我们对他们的关心和关注,增加了用户的满意度和黏性。 另外,我们也鼓励用户分享使用经验和成功案例。用户之间的口碑传播会吸引更多用户尝试和采纳产品。5. 以课程的方式做推广:通过与有影响力的自媒体KOL合作推广“AI写作课”,可以借助其影响力和粉丝基础,将产品推广到目标用户群体中,提高用户的采纳率。课程的形式不仅可以突出产品的实用性和用户体验,引导他们关注产品的真正价值,另外也能够帮助建立用户社区,增加用户留存率,实现更好的产品推广效果。6. 寻求战略合作和融资机会:我们与其他公众号写作辅助工具合作伙伴关系,共同推进产品的发展和优化。战略合作可以帮助我们分享资源、知识和技术,从而加速产品的改进和推广,同时也能够扩大市场覆盖范围,吸引更多目标用户。另外,为了扩大时间窗口,我们也没有放弃融资,为公司提供更多资金支持,以支撑产品的持续发展和改进。有足够的资金储备可以让我们有更多的时间去优化产品,不受时间紧迫的压力。尾声2019年末,我们的团队通过辛勤努力,成功跨出了鸿沟。然而,正当一切看似向好的时候,疫情的爆发却给公司带来了沉重的打击。市场陷入了巨大的不确定性,投资人观望态度明显,而公司账面资金也快要见底。面对突如其来的困境,团队陷入了分歧。CEO提出了转向短视频市场的建议,希望通过这个新方向来迎接商机。然而,团队中的一部分人,包括我在内,坚持继续走智能写作的路线,因为我们看到了在线办公和企业客户的潜在机会。我们主张沿着智能写作的道路继续前行,顺势推出企业版,而不是突然调转方向,如果只是资金问题可以考虑通过开源节流来解决。遗憾的是,我的建议未能被采纳。公司最终启动了短视频群控的新项目。短时间内的突然转换方向,让公司像一名刚刚初愈的病人,无法承受更多的折腾。最终短视频战役还是失败了。到了2020年中,公司已经难以维持,在巨大的分歧和矛盾之中,核心团队成员纷纷离开。如今,GET智能写作依然在运营和售卖,但团队已经不是原班人马了。《金刚经》有云:“一切有为法,皆如梦幻泡影。”在这段遗憾的创业经历中,让我深刻的认识到“坚定的信念和正确的决策是同等的重要”。创业的道路总是充满着未知的变量,当我们无法坚定不移地走下去的时候,我们自己就成了最大的变量。面临各种挑战和困难是创业的常态,而对无常的洞悉则需要保持内心平静的智慧。我们要学会放下执念,保持内心的安宁和坚定,以冷静的光去看待一切。只有这样,我们才能在风雨中坚守初心,做出正确的决策,迎接未知的未来,继续前行。我在离开GET智能写作之后,并没有死心,决定开启另外一场创业之旅,但这已经是另外一个故事了。如果你觉得我的分享对你有帮助,请订阅我的专辑,我将继续分享关于AI产品经理的故事。你可以关注我的公众号“PM熊叔”。

2023/7/30
18:36
AI时代的产品经理的成长之路:可能是小宇宙最全的产品经理指南(上)

AI时代的产品经理的成长之路:可能是小宇宙最全的产品经理指南(上)

2019年~2021年期间,我在做智能写作项目创业的时候,由于当时市场相关产品较少,遇到了问题没有可以参考的竞品。我们只能一路探索,一路踩坑,一路修正。随着产品的迭代,我也在不断地迭代自己的认知,梳理AI产品的方法论和技能树。当时还和Shadow在“蔚来”做了一次关于《AI时代的产品思维》分享。但是光有方法论还不够,随着团队越来越大,也出现了一些管理上的新的问题。团队中新入行的同学,在职业发展的道路上产生了迷茫,甚至也有人提出了离职。我回想起刚毕业的时候,我的导师告诉我:“如果赶路时候,心中有地图,那么你就不会惊慌,你要找到心中的那张图。”因此,作为产品合伙人,我提议在公司内部推行职业岗位上的能力模型。让小伙伴们能看到自己的成长的方向。其实,我并不是想要推行大厂的那套职级的天梯,更重要的是让小伙伴们有明确的修炼方向,产品小伙伴的也觉得跟着我获得了专业提升。现在正值毕业季,有很多刚毕业的小伙伴加入产品岗位中来,也希望能帮到大家。一、修正观念:人人不都是产品经理大多数人听到“产品经理”这个词,总会联想到“人人都是产品经理”这句话。但实际上产品经理这个岗位并没有那么简单。用一句话概括产品经理的职责就是“帮助团队交付正确产品给用户的人”。也就是说,产品经理要能凝聚团队的力量交付有价值的产品给用户,而不是一个人孤军奋斗。我认识的一些优秀的产品经理,往往都是程序员或者交互设计师出身,他们的特点是学习能力很强、知识面广博、思维敏捷、逻辑严密、沟通能力很强。他们能带着你一步步思考,能够清晰地告诉你怎么样的产品才是正确的产品;另外,他们还有很强的驱动能力,不管是对自己还是对他人,是团队不可多得的发动机。我个人的成长经历也比较杂糅,大学是学工业设计的,却阴差阳错的做了程序员,还和朋友一起创业。有人评价我不够专注,但是恰恰正是有这样的经历,让我对如何做产品有了最直接的体感,这个能力区别于在大厂单一岗位培养的产品经理。另外,我也不是完全跟着感觉走,平时也在不断的学习和总结,用体系化的思维框架整理自己的经验和知识,每个职业都有自己的最底层的思维框架,产品经理也不例外。从思维框架层面,产品经理的核心能力就是要懂得如何平衡人的需求、技术的可行性、商业价值三方面问题。这个思维框架被著名的设计公司IDEO称之为“设计思维”(Design Thinking)。我在从业的过程中,用这三个圈的指南针来指导我在产品岗位上学习、工作和决策:1. 人(Human):以人为中心。产品经理应该深入了解用户的需求、痛点和行为,通过观察、用户研究和用户反馈等手段获取关于用户的信息。产品经理需要思考如何创造出对用户有意义、有价值的产品和服务,以提供优秀的用户体验。2. 商业(Business):关注商业可行性。产品经理需要理解公司的商业目标和战略,将用户需求与商业需求相结合。产品经理应该思考如何创造出具有商业价值的产品,并将其与市场需求和竞争环境相匹配。同时,产品经理还需考虑产品的盈利模式、市场份额和增长潜力等商业指标。3. 技术(Technology):利用技术实现创新解决方案。产品经理需要了解现有的技术趋势、技术能力和可行性,以确定合适的技术方向和解决方案。产品经理应该与工程团队紧密合作,探索和评估不同的技术选型,并确保产品在技术上可行、成本可控、系统稳定和可扩展。通过综合考虑人、商业和技术,产品经理可以更全面地理解和分析问题,找到平衡点,并在设计和决策过程中做出明智的选择。这三个圆圈相互影响、相互支持,帮助产品经理设计出具备用户满意度、商业可行性和技术可行性的产品。另外,从产品经理的职业能力上看,可以分成四个圈层:素质层、认知层、影响力层和交付成果层:1. 素质层:素质层指的是产品经理的个人素质和品质,包括职业道德、责任心、团队合作能力、沟通能力、自我驱动等。这些素质是作为产品经理的基础,能够帮助建立良好的工作关系、处理复杂的工作情境,并展现出专业和可信赖的形象。2. 认知层:认知层指的是产品经理对产品管理领域的知识和理解能力。这包括对产品开发流程、市场分析、用户研究、竞争分析、商业模式等的理解。产品经理需要具备全面而深入的行业和产品知识,能够从战略和商业角度思考问题,并做出明智的决策。3. 影响力层:影响力层强调产品经理在团队和组织中的影响力和领导能力。产品经理需要能够有效地沟通和协调各方利益,与团队成员、上级、利益相关者进行有效的合作和交流。他们应该能够激发团队成员的潜力,建立良好的工作氛围,并在组织中推动产品管理的重要性和影响。4. 交付层:交付层是指产品经理能够通过实际行动和结果展现自己的能力。这包括制定产品战略方案、需求管理、撰写需求文档等工作,最终的结果通过成功推出具有商业价值的产品、实现产品目标、提高用户满意度等来呈现。产品经理要能够有效地管理产品项目,与团队紧密合作,按时交付高质量的产品,实现业务目标和商业价值。能力越大,责任也就越大。产品经理的交付能力成长过程分类三个阶段:”方案交付能力“、”产品交付能力“、”战略交付能力“。这四个层次相互关联,结合设计思维的三个圆环构成了产品经理综合能力的框架。通过不断提升自身的素质、扩展认知领域、增强影响力和能够交付出色的成果,产品经理可以更好地应对各种挑战,发挥更大的作用,并取得成功。因此有了这张岗位能力模型图:二、方案交付能力:千里之行始于足下你可能会发现,初级的产品岗位名称(对标阿里P4及以下)常用的是产品专员或者产品助理,为什么不用“产品经理”这个Title?初级阶段的产品工作人员工作和能力,其实配不上“经理”的Title,产品经理是需要承担团队最终的交付结果的人,需要学习产品管理知识、需要有深刻的行业知识、需要有技术和设计能力、需要有沟通和协调能力等等,没有三到五年的基本功修炼,是不可能有好的“产品交付能力”,先要达成“方案交付能力”。当你具备了基本“产品交付能力”才能算一个合格的产品经理。因此,针对初级的产品从业人员,我们团队用“产品设计师”的岗位名称。从而强调我们新晋的产品工作者,首先要有交付正确方案的能力,“方案交付能力”是“产品交付能力”的基本功。起码要能产出高质量的产品原型设计方案和具有可行性的需求文档。如果把P1到P4,比作做是大学四年的学习的话,我们需要修完所有的专业课程才能顺利的毕业。现在我开始对这些“专业课”进行介绍,并且推荐了一些“课本”,希望不管你是产品设计师还是初级产品经理,都可以查缺补漏一下。首先,要把一个合格的方案交付给团队,我们就需要有基础的设计能力,能够将合格的原型给到团队。1、原型设计:原型设计是很重要的交付成果物,让团队成员能够清晰的知道需要做什么。主要讲清楚产品需要有哪些信息,是如何与用户交互的,分为低保真和高保真图,想要产品体验好,交互设计能力不可少。需要了解交互设计基本原则,推荐书籍《About Face: 交互设计精髓》《点石成金》《简约之美》《用户体验要素》《破茧成蝶》;设计心理学,推荐阅读唐纳德诺曼《设计心理学》系列。需要有信息架构的设计能力,如果是AI产品经理,还要从传统UI的信息架构还要延伸到语音对话的沟通信息架构,推荐阅读《信息架构,超越WEB设计》《语音用户界面设计:对话式体验设计原则》《Google 对话式交互规范文档》《Amazon 语音交互设计规范文档》《Machine Learning for Designers》。另外,就是UI设计的相关知识,我们不仅要去关注流行趋势,更需要熟悉UI设计的理论和准则,推荐阅读书籍《认知与设计:理解UI设计准则》《平面设计原理》《写给大家看的设计书》《通用设计法则》。除了活动类产品,强调活泼有趣的画面感,大多数产品UI都遵从设计规范(Material Design、iOS规范等),需要具备了解设计规范的制定逻辑(配色、排版、组件、图标),并且能够将规范和产品的灵活结合在一起,最后通过UI设计软件(Sketch、Figma)进行输出。2、产品规划:产品规划中需要产出对应的规划文档,最常见的有产品需求文档PRD、其次是市场需求文档MRD和商业需求文档BRD。针对初级的产品工作人员,最基本的要求是需要能够写好PRD。需求制定并不是把原型图简单的往上一放。一方面,你要深入地理解用户需求和产品目标,并且对需求进行识别和拆解,推荐阅读《金字塔法则》《软件需求(第三版)》;另一方面,要能撰写清晰、具体的需求文档,包括需求描述、功能需求、非功能需求等,以便开发团队和其他相关团队理解和实施需求,推荐书籍《火球UML大战需求分析》《需求工程》以及阿里巴巴的“五导家”模型。随着产品开发的进行,需求可能会发生变化。因此,产品工作人员应该定期更新PRD,以确保文档内容与产品的最新需求保持一致。3、市场调研与竞品分析:市场调研与竞品分析的内容通常呈现为调研报告,也会呈现在BRD和MRD上,用来推动领导层和团队达成共识。市场调研不是一堆复制黏贴、截图就完事了,需要收集数据和分析、解读和洞察,将调研结果能够应用于产品决策和战略制定上面。我们通过对于企业的调研可以分析它的产业价值链和商业模式,推荐学习波特五力模型、SWOT分析和商业模式画布。我们还要通过分析产品的迭代情况和功能反推背后的战略目标,推荐阅读和学习《用户体验要素》《蓝海战略》的价值曲线图、“用户体验地图”分析等。4、业务数据分析:业务数据分析的报告内容通常出现在产品的规划文档和复盘报告中。初阶的产品工作人员需要,了解常用的一些数据指标的计算方式,如DAU/MAU、PV/UV、GMV、ARPU、点击率等,产品经理需要经常计算业务的转化漏斗,需要擅长使用Excel或者Python,推荐阅读书籍《深入浅出数据分析》《深入浅出统计学》《数据思维:从数据分析到商业价值》《产品经理数据分析实战手册》 《网站分析实战:如何以数据驱动决策,提升网站价值》;另外,也会涉及到一些通过SQL查询获得业务报表的场景,所以产品经理还要了解基本的SQL语法,推荐书籍《SQL必知必会》《利用Python进行数据分析》;并且产品经理也要知道,如何根据不同的业务特点制定的核心的可衡量的业务指标、制定产品的改进策略,推荐阅读《精益创业》《精益数据分析》《增长黑客》等相关书籍。5、用户分析:用户分析的内容会出现在产品规划文档中,也会出现在产品复盘的文档中。在产品项目前期,我们也要参与到用户调研和用户画像制定的过程,在阶段性复盘的过程中我们也要去了解和收集用户的反馈。我们需要能够有以人为中心的设计思维方式,站在用户的场景和视角来思考问题,推荐学习“用户体验地图”的相关知识点。绘制出有效的用户画像 Persona(相关书籍推荐《About Face:交互设计精髓》),通过分析用户在场景中的流程,找到痛点,使用心理学一些知识点去发现问题解决问题,提出产品需求和迭代的方向,推荐书籍《认知心理学》《社会心理学》《思考,快与慢》《马斯洛需求层次理论》。对于C端产品来说,还有很重要的是,自己也要能带入到用户的角色中去和用户打成一片,成为自己产品的用户,在使用中发现更多的问题。另外,能够了解定性和定量的用户调研手段和分析的一些方法,推荐相关书籍《用户体验与可用性测试》《用户体验度量》。有了上面5项基础的交付技能还不够,你需要更多的背景知识的支撑,才能让你的方案更有灵魂:1、商业认知:初级产品工作者通过学习市场营销的知识,来提升自己对市场和运营的理解。例如,4P理论、STP理论;另外,产品经理需要与运营团队紧密合作,知道产品运营的思考方式,推荐阅读书籍《流量池》《运营之光》《参与感》《爆款文案》,要从一个简单的营销页面就能感知到很多的门道。此外,产品的每个前台功能都可能涉及到一个运营后台,涉及到推荐逻辑和管理逻辑,也要充分考虑到内容运营和用户运营的各种底层逻辑。2、软件工程与架构:虽然产品工作人员不需要亲自敲代码,但是产品是怎么做出来的需要有清楚的认知,否则就是盲人摸象。软件工程知识可以帮你系统的了解软件生产过程,推荐书籍《软件工程最佳实践》《软件工程:实践者的研究方法》;软件架构的相关知识,能够让你知道如何设计软件系统才是合理的,让你的需求文档更有说服力,推荐阅读《系统架构,复杂系统的产品设计与开发》、《大象:Thinking in UML》等书籍。另外,建议所有的产品经理应该亲手尝试编程做一两个小项目,这样你对技术会有更深刻的体会。其实编程语言比英语要简单很多,特别是今天有了ChatGPT的加持,门槛变得更低了。3、人工智能技术 :AI产品经理需要了解人工智能的相关知识,知道如何将AI技术应用到自己的项目中去。包括但不限于以下几个方面:首先,对常见的人工智能算法和模型有基本的了解,如机器学习、深度学习、自然语言处理等,能够知道常见的模型评估指标,如准确率、召回率、F1值、AUC等。其次,需要了解数据处理和数据标注的基本原理和方法,以确保数据质量和训练模型的有效性。同时,了解人工智能的伦理和法律问题,如隐私保护、数据安全等,以确保产品的合规性。最后,对人工智能技术的发展趋势和应用场景有一定的了解,以保持对市场的敏感性和判断力。此外,了解常见的人工智能工具和平台,如TensorFlow、PyTorch,以及GPT、Stable Diffusion、Midjourney、LLaMA等,能够理解它们的使用和优缺点。4、行业认知:产品工作人员需要对自己企业当前所处的行业有足够的了解,小到一个常用业务功能的设计的最佳实践,大到整个行业竞争的格局和市场变化。能够分析生态链和已有商业模式,推荐书籍《商业模式新生代》的商业模式画布、迈克尔·波特的“价值链分析”;了解市场规模、增长趋势、机会和挑战,同时评估竞争对手的产品特点和定位,推荐书籍《市场竞争战略》;预估行业的趋势,推荐阅读《跨越鸿沟》《创新者的窘境》高德纳Gartner的《技术成熟度曲线》;另外,还要关注国家的法律法规的动态,避免在产品设计的过程中触及红线。对于行业信息的获取,一方面是同行或者业内资深人士的交流,另外一方面可以通过一些行业的自媒体或者媒体网站如36氪等媒体网站来了解。另外,还有三个对于基础素质的考核:1、执行能力:作为执行层,执行力毋庸置疑的重要,执行力并不是低头干事,我们需要明确自己的目标,通过能够分析问题,拆解问题。需要了解“金字塔法则”,”5W1H分析“,并合理安排的自己每日的时间和计划、“SMART法则”和“重要紧急四象限”、PDCA循环(Plan-Do-Check-Act)(推荐书籍《麦肯锡问题分析与解决技巧》),从而提升自己的工作效率(推荐书籍《高效能人事的七个习惯》)。另外,也要了解项目管理的敏捷开发相关知识,你才能更好地管理和执行需求。2、沟通能力:不懂沟通,就不会执行。做产品的一定要和开发撕逼的吗?不同的人有不同的沟通方式,核心的关键是站在对方角度思考,而不是陷入到不良的情绪中。所谓沟通能力并不仅仅是把事情说清楚的能力,善于沟通的人往往善于倾听。很多时候,你的解决方案并不是完全来自你自己,需要产品经理有专业的沟通能力,要能用相关专业知识带领大家层层深入,最终达成团队共识,推荐书籍《关键对话》《非暴力沟通》。3、学习能力:其实“学习能力”是一种心态。在职场上,许多人工作了好几年,为什么没有什么长进?其实大部分人对工作的态度是做一天和尚撞一天钟,并没有主动提升的意愿;还有一部分人虽然看似热爱学习,但陷入了“理障”和“我执”。“理障”是把自己限制在自己认为的道理或逻辑中,忽视其他差异性的观点和信息;“我执”是相信自己永远都是对的,不接受别人的批评和挑战。这两类心理现象都会限制我们成长。如果要破除“理障”和“我执”需要我们做到以下三点:保持开放心态、有批判思维、做到知行合一。例如,当你画原型图的时候,可以根据一些设计原则进行设计,但是不必太拘泥某个设计原则,因为设计原则是前人总结的经验,并不适用于所有场景,当你无法决策时候,你一方面你可以根据业务目标判断,另外,你可以和他人交流,有时候直觉判断可能会更加准确。另外,上线之后可以通过复盘和反思修正自己的认知,推荐书籍《刻意练习》。三、小结初级产品岗位的历练大概2~3年左右,时间并不漫长,如果你能知行合一,你可以学到很多东西,但也可能会遇到很多困难……但这并不是坏事,因为简单的事情是无法铸就你独一无二的竞争力的。产品经理是一个极其需要综合能力的岗位,但是学校并没有产品经理专业,每个行业、每个公司,每个团队,每个人的理解都会有所不同。我大学本科和硕士都是读工业设计专业,当时受保罗·格雷厄姆的《黑客与画家》的影响,想自己亲手把软件做出来的冲动。我在临近毕业时候特地去学习了编程技术,并找了程序员的工作,又工作了一段时间,我最终选择了产品经理这个岗位。很多人不理解,认为我做事情不够专注。其实,我并不这样认为,其实设计和编程都是一种创造性活动,我真正的目标都是要把一个好产品做出来。正是因为有这份经历,让我对于怎么做一款互联网产品也有了更深刻的理解,之后在创业的过程中,也能够更好做好创业者的角色。有一次创业,我的合伙人都是算法工程师,因为公司没有像样的产品,导致这家创业公司开了快一年了还是没有一个订单。当时团队也没有钱招聘设计师和前端开发人员,我和团队说:”这样吧,给我把东西做出来,到时候看看能不能卖钱或者融资“。然后,我主动承担起设计和前端开发的任务。半年过去,产品做出来了,也成功谈到了投资,团队续命成功。这就是产品交付能力的最好证明。毕业许多年后,我偶尔还是回学校讲课。我也经常提醒学弟学妹:“产品设计师不仅仅要能出设计方案,还要有足够强的动手能力,这是传承百年的包豪斯精神。”如果你已经正式地进入产品经理的行列,请听下回讲解《产品经理如何交付产品和战略》,欢迎大家收藏订阅。上面内容提到的书和资料,我已经放到我的知识星球了,如果有需要可以关注我的微信公众号“PM熊叔”。

2023/7/3
23:29
硬核科普:从贝叶斯定理到大语言模型,智能写作创业者的探索之路

硬核科普:从贝叶斯定理到大语言模型,智能写作创业者的探索之路

2019年,我们在做智能写作的时候,面临的最大的挑战就是AI给的数据效果和预期偏差太远。特别是做扩写的时候,发现生成的文字很容易跑偏。当时,我们做了很多算法和模型研究。几乎爬取了全网的自媒体文章,然后训练一批模型,问题依然很多。因为中文博大精深各种修辞手法和阴阳怪气,再加上随着时代的发展,“米”、“口罩”、“W”等特殊词的用法也如雨后春笋一般涌现,如何让AI能跟上人类语言的理解能力是个让人头痛的问题。当时我们也训练了不少语言模型,发现它根本无法弄懂词的含义,无法理解“心灵鸡汤”和“鸡汤”是完全两码事,写出了“老鼠爱喝心灵鸡汤”的令人啼笑皆非的错误;另外,很容易跑偏,从“心灵鸡汤”跑偏到“老鼠喝汤”再跑偏到“动物世界”,一口气扩写出几百个字,能跑偏到十万八千里,让人完全摸不着头脑。在试了很多方案之后,我们得到了一个结论:机器无法真正理解人类的语言。然后,我们悄悄把“扩写”放到了“实验室”的板块,放弃了文本生成的持续研发。AI生成文字这条路到底通不通?到2023年,在没有体验ChatGPT之前,我还是持保留态度,但是体验之后,我忍不住惊呼:“这三四年的时间到底发生了什么?”我和大家一样,重新补起了功课……一、什么是语言模型?语言模型( Language Model)是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率。语言模型通过大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本。其核心目标是建立一个统计模型,用来估计文本序列中每个词语或字符出现的概率,从而实现语言生成、语言理解等自然语言处理任务。比如,我们可以给一句话让ChatGPT做扩写:"我今天吃了一个___"它可能会扩写出“苹果”,“馒头”、“面包”、“汉堡”。根据大量的文本统计,这些词出现频率大致如下图:苹果为0.07,馒头为0.035,面包为0.025,汉堡为0.022。因为”苹果“出现得比较多,ChatGPT大概率会写出”今天我吃了一个苹果“。但它不太可能预测出”我今天吃了一个火车”,因为”火车“不是食物,虽然语法通顺。但喂给GPT训练的语料里面基本没有人会这样造句。正是因为GPT在训练过程中吸收了大量的人类语言数据,所以我们会觉得它的回答符合我们的逻辑。人类区别于普通动物的最主要智慧特征可能就是强大的语言能力。语言不仅仅只是一种沟通工具,还包含着人类的思考逻辑和对世界的认知。不管AI是否有真正的智慧,我相信只要语言模型的预测能力做到极致,就能够让人类信以为真。二、概率从哪里来?那么,语言模型是如何预测概率的呢?这要从200多年前的贝叶斯学派说起。贝叶斯定理,由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发明的。其主要思想就是,通过已知的知识来预测接下来要发生事情的概率。即我们通过以往的经验、分析或实验,可以推断出一些事件发生的概率。为了更好的理解,我们举个预测地震的例子。假设有人收集了大量历史数据,我们可以发现地震和自然界的某些异常现象有某种关系,如鸡飞狗跳、老鼠上街、青蛙搬家、湖水干涸等现象,我们可以根据历史的数据事先计算好这些现象出现的概率,叫做先验概率。地震的概率可以写作P(地震),异常现象的概率可以写为P(异常现象),例如,老鼠上街的概率可以写作P(老鼠上街)。正所谓:一切偶然背后都会有个必然。根据历史数据,我们可以算出地震和异常现象的概率关系,我们称之为条件概率。例如,在某个异常现象发生后出现地震的概率,可以写作P(地震|异常现象),先决条件写在|后面。如果是已知地震再计算异常现象的概率,也可以反过来P(异常现象|地震)。有了这些数据,我们就可以根据观测,预测还未发生的地震了。通过观测一些现象来预测的还未发生的概率,这叫做后验概率,我们记为P(新地震|异常现象)。例如,P(新地震|鸡飞狗跳)表示的是我们观测到鸡飞狗跳,预测可能发生地震的概率。这时我们可以用到贝叶斯公式。后验概率 = (先验概率 * 条件概率) / 证据概率我们把预测地震的例子迁移回语言模型。假设要预测在给定“吃”这个词之后,下一个词是“苹果”的概率,即P(苹果|吃)。首先,语言模型学习了大量的文本数据,获得了大量的先验知识,已经知道了P(吃|苹果)、P(苹果)和P(吃)这三个概率值。其中,P(吃|苹果)表示在给定“苹果”这个词之后,出现“吃”的概率;P(苹果)表示“苹果”这个词出现的概率;P(吃)表示“吃”这个词出现的概率。然后,我们可以根据贝叶斯定理,计算后验概率P(苹果|吃):我们还可以通过输入法的联想词模拟整个句子的生成过程。我们以“今天吃”这个词作为输入,语言模型会继续根据统计数据,计算出在“今天吃”这个词之后,各个词出现的概率。例如,它可能计算出“饭”这个词出现的概率为0.4,“了”这个词出现的概率为0.35,“的”这个词出现的概率为0.33……我们结合语境选择“了”,然后输入法刷新联想词,然后我们选择“一个”。依次重复这个过程,最终得到了“今天吃了一个苹果”的句子。大家可能也注意到了它的问题。输入法的语言模型,只能预测上一个词和下一个词的关系,如果没有人类的主动选择就很容易跑偏,这是一个长文本预测的问题。在2019年,我们遇到了问题是一样的。而且我们在实际应用中我们会使用更加复杂的模型,我们会用到一些RNN等深度学习的技术,让语言模型可以预测更长一点的句子。但是针对长文本依然无法解决跑偏的问题。当时的解决方案就是一句一句的扩,让用户随时可以纠正偏差。但问题是这种扩写的意义又在哪里呢?让我对AI文本生成的信仰顿时崩塌。三、什么是大语言模型(LLM)?2023年,让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型(Large Language Model)”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处,能够结合上下文,像人一样有逻辑性地回答问题,就算生成超长的文本也不会跑偏。到底什么是大语言模型?大语言模型与普通语言模型相比,大语言模型的一个显著区别在于其规模。大语言模型通常具有大量的参数,并且在训练过程中使用了巨量的文本数据。大型语言模型的参数规模通常与效果成正比,能够更好地理解和生成自然语言文本,更好地完成各种自然语言处理任务,如写作、翻译、问答等。GPT优秀之处是做了前无古人的突破性的尝试,使用了巨量的参数和预训练数据。GPT-3拥有1750亿个参数,使用了45TB的文本数据进行训练。训练数据和参数量都远远超过传统的语言模型。3.1 大规模的参数有什么用?我们要从词嵌入(Word Embedding)说起,为帮助语言模型更好地理解每个词的特征和含义, 我们需要使用大量的参数来存储和处理信息。我们会将这些词嵌入一个高维的向量空间里面,像GPT-3的向量空间的维数就有12288,这意味着GPT-3可以使用12288个维度来充分理解某个词。对于很多单词的理解可能比人类都要透彻。语言模型还可以通过词向量空间中的位置的远近来理解词与词之间的关系。假设我们的词向量空间有三个维度:颜色、形状和类别。我们有三个单词:“苹果”、“橘子”、“手机”,应该如何嵌入到向量空间呢?“苹果”和“橘子”都属于水果类别,因此它们在类别维度上的值相同都是用数字“1”表示;但“苹果”的颜色是红色用数字“1”表示,而“橘子”的颜色是橙色用数字“2”表示;至于形状维度,由于“苹果”和“橘子”的形状都是圆形,都用数字“1”表示,于是有下面这个数值。“手机”属于电子产品类别,数值用“3”表示;手机的形状是方的,数值用“2”表示;颜色是多色的,数值用“8”来表示。他们之间的关系可以一目了然地展示在向量空间的关系中,如下图:我们可以看到语义相似的单词在向量空间中彼此靠近。当GPT在生成文字的时候,它可以根据向量空间知道“苹果”和“橘子”是一类水果,在“吃”的语境中可以相互替换。但是这也有新的问题,“苹果”也有可能是指生产手机的“苹果公司”, GPT怎么能知道“苹果”是否特指“苹果公司”呢,根据不同的语境推理出不同含义的“苹果”呢?2019年,如何结合语境,让语言模型能够准确地理解词的含义,这在当时也是个巨大的难题。我们当时想的策略也相对简单粗暴,就是通过命名实体技术强制将它们标记为不同的实体名词,例如,“苹果手机”类别为电子产品,“苹果公司”为企业。但是遇到的问题是,我们没有办法列举完所有的命名实体,需要不断扩充新词库;另外在很多语境中“苹果”就能代表”苹果公司“和”苹果手机“,没办法根本解决这个问题。GPT-3高明之处就是使用上下文相关的词嵌入方法和自注意力机制来解决这个问题。它的词嵌入方法考虑了单词在给定文本中使用的上下文,而自注意力机制则允许模型在生成文本时考虑前面的所有的单词。最终,让机器能更好地理解语境 ,解决词的多义性和歧义性问题。3.2 什么是注意力机制?GPT的Transformer模型通过使用自注意力机制(Self-attention mechanism),能够让模型在处理每个单词时都能考虑到文本中所有单词的信息,从而更好地捕捉文本中的长距离依赖关系,解决了长文本的跑偏的问题。这在传统的模型中是无法做到的。注意力机制的灵活性来自于它的“软权重”特性,即这种权重是可以在运行时改变的,可以根据上下文来推断出单词的含义,来达到更好的预测效果。举个例子,假设我们有一个句子:“我喜欢吃苹果,但我不喜欢苹果手机。”在这个句子中,“苹果”这个词出现了两次,第一个“苹果”是指一种水果,而第二个“苹果”是指一种手机品牌。如果是没有注意力机制的模型来处理这个句子,那么模型可能会将两次出现的“苹果”都当做水果来处理。但对于GPT来说就不一样了,它能够根据上下文来推断出每次出现的“苹果”的含义。这主要归功于GPT包含的巨量参数中不仅仅包含了词汇的意义,还包含了词在句子中结构和语法、语言风格、语境信息等等。注意力机制可以通过计算每个词的相似度来实现注意力权重的计算。当它处理第一个“苹果”时,会注意到前面有一个权重较高的“吃”字,因此会推断出这里的“苹果”指的是一种水果;而当模型处理第二个“苹果”时,它会注意到后面有一个权重较高的“手机”,因此会推断出这里的“苹果”指的是一种手机品牌。我们可以简单模拟一下这个注意力权重的计算过程。假设我们有个三维的词向量空间,我们先把“我”、“喜欢”、“吃”、“苹果”这4个词嵌入到这个空间里面:如果绘制成图,他们在向量空间中的关系一目了然。如下图,两个词越是接近,关系就越紧密。语言模型可以用数学方法来分别计算”苹果“与“我”“喜欢”“吃”三个词的权重分数,我们可以通过向量的点积计算方式模拟计算一下,值越大代表的是向量的相关性越大:通过计算我们发现“吃”的相似度最大为2.66,那就说明“吃”这个词相对于“苹果”应该有更高的注意权重。或许看到这里,你已经觉得自己消耗了不少的脑细胞。但似乎我们也能够理解GPT的工作量是有多么的大。因为要不断地动态的生成和预测下个词,需要消耗大量的算力。没办法一步到位,所以它只能是一个字一个字地给你呈现出来。算力也是我们在2019年遇到的难题,因为训练模型的沉没成本很高。稍微复杂一点的模型训练可能需要几天的时间,但是你也没有办法保证预期结果。而且,在模型训练好之后,用户还需要长时间的等待计算结果,导致体验非常糟糕。对于一个争分夺秒的创业团队来说,显然有些不切实际。所以我们当时思路是尽可能把模型做多做小,按照不同的文章分类进行训练,想通过这种方式平衡时间和效果,但效果依然不尽人意。从今天的结果来看,没有通用的大语言模型作为基座,把模型做小做细基本就是一条不归路。最终,我们放弃了文本生成算法的持续研发。GPT的成功之处,不仅仅是技术的成功,也是在商业上面的成功。有了微软的算力加持,可以更好的保证模型训练和服务体验,才能在普通的用户人群获得巨大的反响。四、尾声今天,在ChatGPT闪耀的光环之下,我们看到OpenAI的CEO 山姆·奥特曼(Sam Altman) 风光无限,我在短视频平台经常能刷到他的精彩演讲语录,我也总是希望能够从他的成功经历上学到点什么。如果有一天,我拿着2023年的大语言模型的论文,穿越回了2019年,重新开始智能写作的项目,我会做得更好吗?其实,我依然觉得很难,因为创业需要”天时地利人和“。先不提OpenAI所在的土壤对于创新极其的开放,它吸纳了全球最顶尖的人才,并获得了资本的鼎力支持。光是能够看清未来的方向,并且能够坚定不移地走下去,也是我们大多数创业团队无法企及的高度。对于一个创业者来说,看见未来很重要,但认清自己也很重要。看见未来,你才能坚定不移地走下去;认清自己,你才能力所能及地把事情做得更好。在没有能力之前,需要先学会成长;在机遇没有到来之前,需要先学会等待;在没有成功之前,也要学会选择坚持。现在ChatGPT的热度之下,又有一些朋友重新投入到AI创业的大潮中。雷军说过:“站在风口,猪也能被吹上天”。但是风很大,浪也会很急,挑战也会很多。希望各位创业者能够一帆风顺。最后,我有个AI产品创业相关的知识库,每天会更新一些发现和感悟,6.18做个优惠活动。欢迎有兴趣的朋友加入。

2023/6/11
16:56
什么是用户体验地图?

什么是用户体验地图?

今天,我们来讨论一下什么是用户体验地图。什么是用户体验地图?Customer Journey Map,缩写为CJM,翻译为顾客旅程图,也叫用户体验地图或者顾客体验地图,是一张超越时间和空间,从个体的视角得到用户与企业、服务、产品之间的关系地图。它能够视觉化地描绘用户在使用服务的整个过程中的流程、需求、痛点。它可以很好的帮助我们梳理和分析常见的场景中可能存在的问题。在营销、服务、产品的场景分析中它都能发挥很大作用。在我见过的做得比较好的地图里面,首当其冲的还是星巴克的“顾客的全过程体验地图”。描述了用户在购买星巴克咖啡的全流程体验,从准备(Anticipate)、进入(Enter)、参与(Engage)、退出(Exit)、反馈(Reflect),每一个步骤下还列举的具体的用户行为,例如,“参与”步骤中包含了:排队、点单、支付、坐下、喝、工作;在图中还标识出了用户在体验过程中心情变化,以积极和消极的进行划分,对每个触点(圆点)标记了相应的说明,例如:在工作阶段,免费的wifi就是一个积极的触点。在图的下半部分是从用户的视角,讲述了不同阶段下的不同用户故事,例如:我用着免费Wi-Fi而且信号还行。用户体验地图也不一定是一条线性的,也有可以是圆环。例如乐高的“用户体验环(Customer Experience Wheel)”。在图的中心是这个用户画像的说明;圆环外面是用户体验过程,用表情包来表示心情,并在图中标记了需要深入了解的点。另外,还有一张很有设计感的地图是Desonance 绘制的,包含了带有故事性的草图。大概分以下几大块:1. 用户类型 (Customer Type):“用户类型”可以用“用户角色分析法(Persona)”或者移情图进一步细化。2. 体验阶段及旅程 (Experience Phases & The Journey): 在不同的体验阶段以图文结合的故事化的方式来描述不同的行为活动,图中包含了痛点、触点、机会点……3. 触点详情与交互动作 (Specific touchpoint and interactions):触点的解释说明;4. 情绪变化 (What the service is like -- nights and lows ):通过高低来视觉化用户情绪变化过程,从而体现服务效果;5. 痛点和机会点 (Point of delight/opportunities & Point of pain/service barriers ): 通过使用图标的方式标记在旅程图中 ;6. 关键要点说明( Key to explain the map);用户体验地图除了用在商业产品上面,也可以来改善公共服务。例如,英国政府就使用户体验地图来解决公共服务问题,这张图描述了受害人从报案到打官司的体验流程,并站在用户的视角,评估用户的满意度,寻找不同政府部门的服务边界是否存在问题。了解完什么是顾客体验地图后,我们该如何绘制呢?用户体验地图的绘制需要五步:明确目标、探究问题、头脑风暴、绘制地图、优化迭代。第一步,明确目标考虑好产品或服务的整体目标,以及期望用户体验地图反应出的具体目标。在做之前,最好把原有的体验流程感受 一遍。并且与利益相关者沟通。可以使用5w1h,进行思考:what:我们希望通过用户体验地图解决什么问题?why:为什么要解决这个问题?where:这些问题在哪些场合发生?when:时间截止期限是什么?who:涉及到哪些利益相关者?how:期望达到的愿景是怎么样的?第二步, 探究问题1. 用户资料研究,其中包括定性和定量的调查结果,以便于提供洞察客户体验。也可以通过书籍资料做更多的研究。常用的研究方法包括客户访谈、人种学和情境调查、客户调查、客服投诉日志、网络分析、社交媒体收听和竞争情报。2. 移情映射,从各个方面描述一个角色在特定场景中的经历。这个练习帮助我们的团队加深对顾客体验的理解,并对顾客所需要的东西做出惊人的洞察力。移情图也为顾客体验地图的绘制提供了感知基础。我们的目标是获得一个全面的感觉,在这段经历中扮演那个角色的感觉,特别是关注他们的想法、感觉、视觉、听觉、说话和行动。3. 列出触点清单,以及这些触点出现的场景。然后通过头脑风暴寻找被遗漏的接触点或场景。例如,假设触点是“付账单”,与触点相关的场景可以是“在线付费”、“通过邮件付费”或“亲自付费”。第三步, 头脑风暴为了收集更多的Idea,我们需要组建一个头脑风暴团队。头脑风暴的目的是在短时间内产生尽可能多的想法。我们可以围绕品牌特点或用户心理等词汇进行。从3到5个词开始,例如:可访问的,社交的,安慰的,然后每个单词使用两分钟的时间发散。每个人都要写下自己的idea,越多越好。两分钟后切换到下一个词……直到大家产生足够多的灵感后,我们使用亲和图进行整理。亲和图是一种将标签分类组合的方法,可以重新组织团队的思想,提炼和发现有价值的灵感的方法。亲和图有助于我们从网状的发散过程收敛为机会点的探究,以帮助我们获得正确解决方案。在头脑风暴的过程中,所有的团队成员都应该把他们的想法通过便签的形式贴在墙上。然后对这些想法进行分类。作为一个团队,你们可以去掉不切实际的标签、重新排列组合和提炼要点,最终形成能够提升用户体验的美好蓝图。第四步,绘制地图我们把所有的东西放在一起,按照时间线、触点、渠道、情绪来排布,以及用来改进未来用户体验过程的新想法。重新审视一下。用户体验地图有5个关键要素,然后组成一副图:1. 用户画像:这张图的主角用户是谁;2. 触点:场景中服务与用户接触的关键点;3. 渠道:交互行为发生的地方是网页端、App、电话、还是在线下某一个地方?4. 时间线:根据服务的前、中、后的不同阶段,可以进行细分;5. 情绪:在体验过程中的情绪变化。另外这张图还可以提供一些额外信息,比如,通过拍摄一些真实场景的照片,能够让人留下印象深刻的互动画面。再例如,列举那些影响用户体验的人,如服务员、朋友、同事……第五步,优化迭代经过上面的步骤,你的用户体验地图已经不仅仅只是一张挂在白板上的草图,它已经成为你团队思考的结晶。通过提炼,你可以将其绘制成一张正式的图。如果不擅长作图你可以下载我的用户体验地图模板。然后,你需要打磨它、工作中利用它、并与同事分享它。绘制用户体验地图的关键不是结果而是过程,它促使我们深入的思考,如何改善客户的服务体验,随着时间的推移,我们需要定期维护。例如,按照季度或者年度来校准你的用户体验地图。我是PM熊叔,希望我的分享能帮助到你。

2023/5/30
08:31
AIGC革命:拐点降临的内容产业,如何赢得时代先机?

AIGC革命:拐点降临的内容产业,如何赢得时代先机?

最近,AI领域的新东西真是应接不暇。上周,我参加了上海AIGC大会。会议现场真是人山人海,Mixlab的小伙伴们在三楼做了个分会场。我们一边动手一边分享观点,并结识了不少有趣的朋友。受Shadow邀请,我也从产品经理的视角做了个简单的分享……当前,一场由人工智能引发的生产力革命即将爆发,这次革命的历史意义可能不亚于一百多年前的工业革命。顶尖的大厂、投资人与机构都已纷纷入局。微软、谷歌、Adobe、百度、阿里、讯飞等大厂也纷纷展示他们的新一代的AI产品。为什么说这次机会比去年的元宇宙靠谱呢?元宇宙虽然包罗万象但并没有带来体验的升维,VR/AR等新技术还有很多路要走;而ChatGPT为代表的生成式人工智能应用场景明确,而且带来了前所未有的体验,像OpenAI、Midjourney等项目直面C端用户,让人们纷纷意识到AI已经不是人工智障了。一、 新的数据体验在2019年,我跟着Shadow一起创业,当时想要开发一款针对新媒体人群的智能写作工具,名为GET智能写作。想用AI生成文章帮助新媒体小编解放生产力,这一听就是让人觉得十分炫酷的想法。当时,我们尝试了许多生成文本的方法,但AI所生成的结果却不如人意。我们不得不面临用户的抱怨:“生成的垃圾文章,我用来修改的时间,还不如自己写”。当时的主要原因在于AI并不能真正理解内容的含义,例如,“心灵鸡汤”和普通鸡汤有何区别。get智能写作的产品体验远远没有办法达到用户的预期。按照俞军的产品价值模型推导:产品价值=(新体验-旧体验)-迁移成本 。我们的这款产品价值基本是负向的。在用户的反馈和吐槽之下,我们痛定思痛,进一步拆解,我们得到了一个AI体验模型:AI产品体验 = 数据体验+输入体验。既然数据体验不好,那只能通过提升输入体验来补。因此,我们花费了大量时间通过设计交互界面来改善用户的体验。主要方法是将大的用户目标拆分成小的用户目标,以便更好地控制用户的预期。通过一年的努力,产品的口碑终于从负转正。说实话,我曾经一度片面地认为“设计与前端带来的体验价值可以占到90%以上”。在之后,我负责设计和前端开发的“互链文档”项目也贯彻了这个体验模型,将知识图谱与文档结合在一起,可以一边记笔记一边拓展知识节点。这个项目在2021年成功获得了机构的风险投资。但今天像ChatGPT等大语言模型的出现,改变了我的观点。大语言模型已经不能与传统NLP算法同日而语,ChatGPT只要一个简单的对话框已经能解决90%的问题,其良好的数据体验,可以免去前端复杂的交互设计。这也意味着传统的产品设计范式已经不再适用。引述《交互设计精髓》的观点,界面设计是为了解决实现模型(Implementation Model)和心理模型(Mental Model)之间的差距,前者反映的是技术实现方式,后者反映的是用户预期。ChatGPT等大语言模型真正有魔力的地方是涌现了人类一般的推理能力。当AI越来越懂用户想要什么的时候,数据体验就会变得足够好,意味着实现模型无限趋近于心理模型,人机界面的设计将会变得越来越简单。今天,我们也要重视评估数据的体验价值,找到数据的短板和不足,并做好弥补的方式。例如,GPT-3.5的数据只到了2021年,如何让两年前的数据帮我们解决现在的问题?前段时间ChatGPT演示的插件系统给了我们新的启发。它展示ChatGPT接入第三方小程序的能力。语言可以作为一种最自然的人机沟通的界面,但AI也可以通过多种工具组合来帮助人类解决问题。不管怎么样,我们仍需回归到应用场景中,并深入思考如何用人工智能技术帮助用户达到期望的结果,将数据体验和输入体验有效地结合在一起。二、 新的创作方式我们的创作流程大致可以分为:创意、制作、分发,三个重要环节。不同的媒体形式,我们还需要掌握不同的内容生产工具。如,视频创作,需要学AE、PR、PS、3D、Maya等工具。让专业的人,专业的团队,创建专业的内容,我们称之为PGC。今天我们看到影视IP内容都属于这类,它的优点是质量稳定,缺点是创作门槛高和需要较大的资金投入。随着移动互联网的发展,内容创作的门槛进一步降低,一部手机就能完成内容创作的全部过程,人人都可以低成本地创作内容,质量可能不如PGC,但是可以满足大部分人多样的消费需求,因此,有了像B站、抖音、快手、小红书、微博等UGC的平台的爆发。AIGC时代的创作形式是怎样的?那就是“提示词生成一切”,Prompts to Anything。这个“提示词”不仅仅只是文本,还可以是图片、视频、声音等任何可以输入给AI的东西。正如前几天Adobe 发布的Firefly萤火虫的宣传视频,创作者只要输入文本、图片、视频和声音等,都可以转化为精彩的视频内容。另外,有个叫Runway的生成视频的项目,让我们看到了AIGC的突飞猛进。自上线以来,半年左右迭代到了第二代,现在用户不用摄影器材、不用请演员,AI就可以生成连贯的视频片段,这让视频创作的门槛极大地降低。如果需要配乐怎么办?谷歌已经开源了图片和文本生成音乐的方案,因为是无中生有,创作者也不用担心音乐版权的问题了。如下面,AI根据Dali的绘画生成的音乐。一些需要信息收集整理的工作,也可以交给AI。AutoGPT是最近非常火热的项目,通过GPT的逻辑思考能力,结合搜索和代码执行等功能。你只需要按照角色分配给它一个任务,它可以像实习生一样帮你完成工作。甚至有人基于AutoGPT做了个智能生成视频的工具。在未来的三五年内,AI可以承担创作流程中90%以上的工作,过去创作视频内容需要按照编导、摄影、演员、剪辑、运营来分工,但是未来一两个人就能搞定。提示词如咒语一般,可以低门槛的瞬间产出高质量的内容。但目前还不够完美,从内容创作者角度看AIGC的内容可控性较弱,难以编辑修改;风格雷同也容易导致消费者审美疲劳。未来更多具有可控性的AIGC项目,也会展现在创作者面前。一场内容革命即将暴发,将催生更多的内容创业机会。三、 新的投资逻辑1. 重新评估内容的变现效率2015年,谷啊模开拓了影视解说的视频品类,他的一些惯用语,至今还在我们的耳边萦绕。几年之后,我们在短视频平台上看到的大部分影视解说类的短视频都是AI配音的。对我们来说创作者是谁不再重要,大多数人只知道主角都是大壮、小美、小帅……未来我们会看到更多规模化生产的内容,我们可能会看到小帅做知识分享、小美演绎田园生活、大壮在又唱又跳。任何可以获取流量的内容品类,都会被AI重做一遍。因为这种规模化生产导致大量的内容溢出,导致竞争的加剧,因此人们也会更加关注内容本身变现效率。在目前内容流量的模型是三层漏斗“内容→关注→变现”,转化效率还不够高。最近的B站主播断更的事件,也反应了这个问题。B站坚持没有贴片广告,只不过是将机器匹配转移为了低效的人工运营匹配。只有获得平台关注的头部UP主,官方才会给予流量扶持、商单或者补贴。而大部分中腰部以下的主播,由于难以获得平台关注,就算内容有爆款,没有官方的扶持也赚不到钱。这种模式,看似维护了消费者体验,本质却伤了UGC创作者持续创作内容的动力。AIGC时代需要更加高效的流量模型,让爆款内容就可以直接变现,这个模型可能是“获客内容→变现”的两层模型。如下图:这种模式并不是空穴来风,例如,Youtube的贴片广告是通过算法匹配的,内容观看人越多,广告展示次数越多,创作者就能赚越多钱。这种模式会更适合AIGC的内容的投放,让用户参与投票,让好内容可以赚钱。2. 重新评估内容版权的价值随着AIGC技术的发展,内容生产将从用户生成内容(UGC)转变为人工智能生成内容(AIGC),这将带来内容量和质量的提升,但也将带来对平台内容价值和版权的挑战。最近AI孙燕姿火了,它以假乱真到让人难以区分。它可以“演唱”很多孙燕姿并没有唱过的歌曲,让粉丝也能一饱耳福。这让人不禁联想:未来用户是否可以任意调制自己喜欢的音乐菜谱?听自己想听的音乐,例如,孙燕姿的声线 + 林夕风格的填词 + 周杰伦的曲风。 如果这种全新的消费体验能够被验证成功。除了对创作者带来冲击以外,也会极大冲击传统版权内容为核心的平台应用。QQ音乐、网易音乐等长期经营的版权护城河可能荡然无存,像喜马拉雅等有声书平台也会岌岌可危。AIGC到底有没有侵权?依然有所争议。著名的科技评论人KK(凯文·凯利)认为,人类艺术家在创作过程中会受到其他艺术家风格的影响,但他们并不需要支付版权费用,这是一种艺术创作的自由和公平。同样地,如果人工智能生成的内容是基于借鉴而非抄袭的,那么它也不需要向人类或其他人工智能支付费用,这是一种技术创新的自由和公平。为了应对这些挑战,他建议引入新的变量来构建新的商业模式,这些变量包括非同质化代币(NFT)、公共领域贡献协议(CC0)、智能合约和通证经济(Tokenomics)等。原始内容可以通过NFT来保障其稀缺性和价值。同时,原始内容可以通过CC0协议来开放其使用权,利用AIGC技术产生大量高质量的衍生项目,从而扩大其影响力和生命力,并获得更高天花板的商业模式。最后,智能合约和通证经济可以建立相应的商业流转协议,使得这个平台可以更健康地运行下去。最近,马斯克前妻Grimes,她通过AI+CC0进行了创作实验。她将自己的声音开源,并愿意和AI合作分成,并且迅速建立了一个小型孵化器,将AI和CC0有机结合。如今互联网技术发展也和开源生态的繁荣息息相关。可以预见,AIGC趋势之下,必然也会提出数据开源的新商业模式。3. 重新评估单位人效最近,有个比较火爆的新闻是蓝色光标裁员的事件。他们宣布停掉所有的外包,用人工智能替代。这使得他们股票大涨。这反应了投资市场的普遍心态:通过投资生产力革命,获得更多的市值增长。廉价劳动力工厂的模式,已经不再有吸引力。正如N年前,机器能否取代工厂的蓝领工人的问题一样。随着产业的升级,机器终将取代掉大部分的人力。如果你只会拧螺丝,那你终将被机器取代,但如果你能够维修机器,操作更高级的机器,那你依然还是能留下。对于投资人或创业者来说,幸运的是科技变革给了社会资源重新洗牌的机会,正如一百年前的工业革命重新洗牌了新钱和老钱,让资产阶级能够顺势崛起。在这次变革中,如果你能利用新技术影响到了更多的人,那你就能获得更长期的生命力。在AIGC时代,创业团队要学会如何用更低的人力撬动更大的市场价值。创业者需要跳出传统大公司的工厂模式,集中所有的精力解决一个极具价值的用户痛点,实现单点突破。例如,著名的社群通讯软件Discord有650人,年营收1亿美金;而Midjoureny 这家公司只有一个足球队大小,核心成员还有几位是还没有毕业的大学生,年营收也有1个亿美金。Midjourney 所做的事情极其专注,就是让用户用最简单的方式,获得最好的AIGC图片。4. 重新评估人的价值难道AIGC时代,主播就没有价值了吗?前不久我和“老范讲故事”主理人老范的一次对谈中,他让我可以参考餐饮行业中“预制菜”和“饭店主厨”的关系。我们购买预制菜是因为其方便实惠,标准化的口味,可以满足我们普遍的需求,但当我们去饭店消费实际消费的是餐厅环境和服务体验,主厨负责的就是保证菜品质量和特色口味。如果是“预制菜模式”,技术驱动下的内容生产和转化效率是第一位的,但是随着技术的普及“预制菜”也将变得越来越卷。最终胜出的可能还是“主厨模式”。在充斥着大量机械生产内容的流量池中,那些具备人设的内容会变得更加有价值。老范建议“人要更像个人”。因为还一些机器无法取代的东西。比如,你与社区成员的情感链接、社区资源链接、定制化课程内容等。创作团队如果想要具有长期的生命力,将需要变成“1+1+N”的模式:1个是主播,1个是社区,N个是机器人。“1个主播”是指核心内容创作者,有了人设,账号才有长期价值,才能将大量观看转化为关注;“1个社区”则是指主播的粉丝和观众,支持着主播的发展;“N个机器人”可以协助主播内容生产、进行直播、自动化运营用户等,提高了内容效率和用户体验。综合来看,主播、社区和机器人三者缺一不可,是创作者在平台成功的关键因素。传统的MCN公司的签约模式也会改变,传统的MCN工作是挖掘、绑定、培养主播,并在流量变现的过程中分得一杯羹。但是随着创作门槛的进一步降低和UGC/AIGC平台流量模型的效率提升,流量和资源是相对平等的,主播能不能火,与个人素质极大相关。如果MCN没有配套服务机制,也就失去了其价值。随着“主厨模式”的崛起,更合理的是一种去中心化的DAO组织形式,未来的机构将会更加注重服务和功能,为更多的“主厨”提供更多的赋能支持。四、给个人的建议1. 与人产生情感连接无论人工智能如何发展,掌握社会资源,影响社会走向的依然是人类。在未来,人与人之间情感联系的价值越来越重要。因为AI仅仅是机器,它无法感知到情绪、听出话语中的含义,也无法体会到我们的渴望,而人与人之间,最容易感知到的就是共情。因此,当我们使用AI提升效率之后,我们还需要重新审视自己,多关注身边的人,多去与人交流、多去体验生活。或许,科技发展的终极意义就是让我们拥有更多自由的时间、活得更像个人类。2. 三个P:Proxy、Prompt、Python第一个P是Proxy,是代理的意思。代理是软件设计中常见的一种模式,就是在底层通用接口上封装一层代理,根据不同的业务需求,承接业务输入和把关最终的输出结果。AI就是我们的通用接口功能,人类负责把关输入的需求和输出的结果。在项目中,依然需要由人类维护客户关系、做好需求沟通、把控项目质量和负责项目管理等工作。AI无法替代的是能够交付产品价值的人。随着AI的迭代,单一技能岗位可能会被取代,程序员、设计师、测试可能会失业,但是像项目经理、产品经理、架构师等能够提供综合性专业解决方案的角色依然需要,因为需要有人为产品的交付负责。因此,我们不应该再把自己局限于某个细分技术的岗位,需要培养自己的全局视角,发展自己的综合能力,让自己拥有从宏观和微观把控项目的能力,以确保产品交付的质量和价值。第二个P是Prompt,是指学会如何使用提示词。很多人在向AI提问时,常常会感到它们的回答不够准确或者不可控。其实,这很大程度上是因为我们提问的方式不够好。我们可以将ChatGPT比做一个涵盖了大量人类知识的宝库,但是如果想要从中获取所需的知识,就必须找到正确的钥匙。例如,我们需要了解GPT背后的思维链模式。懂得在提问前为其设定角色,懂得补充知识,拆分需求,让它“逐步回答”。掌握了这些技巧,GPT会相对准确的给你想要的答案。学会与AI沟通,才能更好地利用AI。懂得善用工具才是人类与众不同的价值。第三个P是Python,让AI能够执行好任务。Python出了处理日常工作的问题外,现在大部分AI项目,基本上都依赖于Python环境,如果说你想要体验最新的工具,学习Python是必不可少的。虽然很多人都知道其强大之处,可惜的是很多人在学习Python的入门阶段就放弃了,并没有体验到编程的真正乐趣——解决问题的成就感。如果你对Python不熟悉也没有关系,可以把写代码交给ChatGPT,我们完全可以从边做边学开始。3. 问题即是机遇每次技术变革都会伴随着炒作周期。最开始都会有个野蛮生长期,乱花渐欲迷人眼,当热度冷却之后,真正有长远生命力的项目才浮现到大众的视线中。在热度之下,人人都迫不及待。当下,国内大部分热度还是停留在公众的关注度上,真正成规模的产业级的商业化应用还在酝酿之中。由于大模型的门槛过高,有实力的大公司会陆陆续续推出自己的大模型,但打脸和翻车并不奇怪;而小型的创业团队所做的事情高情商的说法是“将大模型落地到具体的应用场景中去”,低情商的说法是套壳。AIGC除了技术问题外,还有很多悬而未决的问题,例如,数据安全、法律法规、创作伦理、版权问题等。但这些是问题,也是机遇。对于创业者来说,在剧烈的变化之下,也要冷静沉着,结合自己熟悉的业务领域进行深入的探索。另外,由于种种限制,国内大部分普通人并没有真正体验过AI的神奇之处。按照鸿沟理论,新的技术往往都是从小众传递到大众,需要有个跨越鸿沟的机会,如果你能够帮助更多人跨越鸿沟,那你在这个过程中也能获得巨大成功。如果你曾遗憾于错过了几次互联网浪潮,那么千万不要再错过这次机会。雷军说过:“站在风口,猪也能飞上天”,现在风来了,你还在犹豫吗?

2023/5/14
22:24
交互设计精髓摘要及103条设计原则(下)

交互设计精髓摘要及103条设计原则(下)

《About face: 交互设计精髓》称得上是交互设计的圣经,用“工作必备,常看常新”来形容也不为过。书中的每句话对平时的实践有着指导意义。而且这本圣经更难能可贵的从1.0到4.0每次版本更新都与时俱进,像4.0还讲到特斯拉的车载设计。但遗憾的是,能全部看完这本圣经的人不多。原因可能有两方面:一,500多页的大部头,看起来心理压力确实太大,很多人想看但不知从何下手;二,翻译的过程中难免有信息的偏差和错误,让很多人看了晦涩难懂、一头雾水。因此,我本从书中提取摘要和原则,一方面是想读者对本书全貌有个初步的了解,另一方面也是希望能有益于大家工作。第三部分 交互细节第18章 为桌面应用而设计当代桌面应用的界面都源自施乐(Xerox)的Alto,它是1973年施乐公司的 PARC研究中心开发出来的一个实验性计算机系统。在发明Alto的同时,PARC 的研究者们创造出了现代桌面UI典范的四大支柱:窗口(Window)、图标 (Icon)、菜单(Menu)、鼠标(Pointer),简称为 WIMP。Alto的使用者能够以WYSIWYG(“所见即所得”)的方式,在系统中对文档进行创建、编辑和查看等功能。Alto,以及它的后继者——施乐Star,在商业上失败了,但它们在桌面计算机上的创新,为日后的普及做出卓越的贡献。1 无论是运用哪种交互习惯用法,都要考虑实际运用场景的客观情况。The utility of any interaction idiom is context-dependent.2 对话框是一个房间,去之前要有个好理由。A dialog box is another room; have a good reason to go there.3 将功能置于需要它们的窗口中。Provide functions in the window where they are used.4 用菜单来提供一条学习的途径。Use menus to provide a pedagogic vector.5 禁用掉不适用的菜单项。Disable menu items when they are not applicable.6 相同的命令要使用相同的视觉符号。Use consistent visual symbols on related commands.7 工具栏为有经验的用户提供快速访问常用功能的途径。Toolbars give experienced users fast access to frequently used functions.8 所有工具栏和图标控件都应该使用工具提示。Use ToolTips with all toolbar and iconic controls.9 浏览和选择任务要同时提供鼠标和键盘支持。Support both mouse and keyboard use for navigation and selection tasks.10 用光标形状变化表明元键的用法。Use cursor hinting to show the meanings of meta-keys.11 单击意味选择数据或对象,或改变控件状态。Single-clicking selects data or an object or changes the control state.12 双击意味着单击再加上动作。Double-clicking means single-clicking plus action.13 在对象或者数据上按下鼠标意味着选择。Mouse-down over an object or data should select the object or data.14 在控件上鼠标按下意味着预备动作;鼠标释放意味着执行动作。Mouse-down over controls means proposing an action; mouse-up means committing to an action.15 要让选中这种状态,在视觉上明确而醒目。The selection state should be visually evident and unambiguous.16 拖放候选对象必须在视觉上表明它们的接受能力。Drop candidates must visually indicate their receptivity.17 拖动光标必须在视觉上表明源对象。The drag cursor must visually identify the source subject.18 任何可滚动的拖放目标对象都必须支持自动滚屏。Any scrollable drag-and-drop target must auto-scroll.19 所有拖动都要去抖动Debounce all drags.20 任何要求精确对齐的程序必须提供精确滚动的游标工具。Any program that demands precise alignment must offer a vernier.第19章 为移动设备和其他设备而设计2007 年6月,苹果发布了iPhone,几乎一夜间,移动设备的定义发生了翻天覆地的变化。它彻底取代了原来糟糕的用户体验。现在,iPad、Android和微软的多点触摸平板的销量不断增加。对于很多人来说,这样一种非常方便的计算设备,想用的时候按下开关就立即能用,关闭时可以立即保存上次的状态,并且允许直接的多点指尖输入,这一切的一切,都远远优于传统的桌面软件、优于传统的点指输入设备。本章的大部分篇幅,将介绍在设计手机和平板类的移动设备时的注意事项及其设计原则。本章后面,我们还将简要讨论一下其他设备平台的界面,包括公共信息台、公共设备、车载设备的界面。1 大多数移动应用是暂态的。Most mobile apps have transient posture.2 要限制动画式屏幕转换的次数和出现的方向。Limit the number and direction of animated screen transitions. 3 用教程引导首次使用的用户。Use guided tours to orient first-time users.4 用覆盖层展示手势的用法。Use overlays to explain gestures.第20章 网页设计今天,需要安装在电脑本地的软件越来越少。并且现在,网页已经成为了人与人之间,以及企业与客户之间的最重要、最流行的沟通渠道。这意味着网页体验的质量是无比重要的,随着越来越多、越来越复杂的软件行为转移到网页上, 网页的交互能力也必须要达到和软件相当的水平。在以往,视觉设计师关注“视觉和感觉”,信息架构师关注内容结构。而现在,这些知识和经验是不够用的。在GitHub上可以很容易找到优秀的UI组件。不过,即使手边有这些大量的现成组件,我们也仍然无法很好地回答一些既重要又简单的问题:我们怎样做才能恰如其分地满足用户的需求和想法,如何才能利用好这些部件,开发出具备良好和连贯用户体验的产品。1 采用永久固定的页眉来保持情境。Use persistent headers to maintain context.2 “面包屑”链接,让导航更快捷。Breadcrumbs with lateral links help speed navigation.3 自动填充、自动推荐、分面搜索可以让用户更快地找到所需的东西。Auto-complete, auto-suggest, and faceted search help users find things faster. 4 让滚动变得更投入。Make scrolling an engaging experience5 无限滚动与网站页脚是互斥的习惯用法。Infinite scrolling and site footers are mutually exclusive idioms.6 如果你的网站只有一个版本,一定要把它设计成自适应。7 If you have only one version of your site, make it responsive.第21章 设计细节:控件和对话框虽然不同平台上的一些视觉设计是不同的,但大部分平台上的控件和对话 框是一样的,它们是用户与各个数字产品的通用交互语言。这些标准的东西,在大部分的GUI开发库里都有,存在着被滥用或误用的可能。本章将概要介绍一些通用的GUI交互控件,还将讨论他们适合使用的环境。1 链接用于导航,按钮用于动作。Use links for navigation and buttons for action.2 用图标来区分列表中重要的文本项。Distinguish important text items in lists with graphic icons.3 绝不要水平滚动文本。Avoid scrolling text horizontally.4 有界输入要使用有界控件。Use bounded controls for bounded input.5 仅供输出的文本用非编辑控件(显示控件)显示。Use non-editable (display) controls for output-only text.6 把主要的交互操作放在主窗口内。Put primary interactions in the primary window.7 对话框适用于放那些主交互流之外的功能。Dialogs are appropriate for functions that are out of the main interaction flow.8 对话框非常适合用来整理关于单一主题或应用程序功能的信息。Dialogs are appropriate for organizing controls and information about a single domain object or application function.9 在功能对话框的标题中使用动词。Use verbs in function dialog title bars.10 在属性对话框的标题中使用对象的名字。Use object names in property dialog title bars.11 区别对待模态对话框与非模态对话框。Differentiate modeless dialogs from modal dialogs.12 不要在非模态对话框中使用终止命令按钮。Do not use terminating button commands for modeless dialogs.13 不要动态地改变终止命令按钮的标签。Don’t dynamically change the labels of terminating buttons.14 应用程序无响应状态,必须通知用户。Inform the user when the application is unresponsive.15 绝不要用临时型对话框作为错误对话框或确认对话框。Never use transitory dialogs as error messages, alerts, or confirmations.16 所有交互的习惯用法都有其适用范围。All interaction idioms have practical limits.17 不要堆叠选项卡。Don’t stack tabs.18 避免错误对话框愚蠢地停止进度。Most error dialogs stop the proceedings with idiocy.19 让错误不可能发生。Make errors impossible.20 当软件告诉用户他们失败时,用户会觉得受到了羞辱。Users get humiliated when software tells them they failed.21 做,不要问。Do; don’t ask.22 让所有的动作都可以撤销。Make all actions reversible.23 给用户提供非模态反馈,避免用户犯错。Provide modeless feedback to help users avoid mistakes.

2023/4/17
11:54
交互设计精髓摘要及103条设计原则(上)

交互设计精髓摘要及103条设计原则(上)

交互设计精髓摘要及103条设计原则(上)《About face: 交互设计精髓》称得上是交互设计的圣经,用“工作必备,常看常新”来形容也不为过。书中的每句话对平时的实践有着指导意义。而且这本圣经更难能可贵的从1.0到4.0每次版本更新都与时俱进,像4.0还讲到特斯拉的车载设计。但遗憾的是,能全部看完这本圣经的人不多。原因可能有两方面:一,500多页的大部头,看起来心理压力确实太大,很多人想看但不知从何下手;二,翻译的过程中难免有信息的偏差和错误,让很多人看了晦涩难懂、一头雾水。因此,我本从书中提取摘要和原则,一方面是想读者对本书全貌有个初步的了解,另一方面也是希望能有益于大家工作。00:59 第一部分 目标导向设计 00:59 第1章 数字产品的设计过程如果我们设计的数字产品能够让人们方便地达 成目标,他们会感到满意,提高效率,心情愉快。如此一来,人们会高兴 地购买这款产品,还会推荐他人购买。假设我们能够以低成本实现上述目 标,就能取得商业上的成功。表面上,这个前提一目了然。只要用户满意,产品就会成功。可是为什么仍有那么多的数字产品难以使用,用起来让人痛苦呢?为什么不能皆大 欢喜、双方共嬴?尽管我们一直在更快、更廉价、更便捷技术的创新道路 上稳步迈进,为什么人们仍会感到沮丧?一言以蔽之,答案是因为在产品规划和开发的过程中,没有把设计作为同等重要的基础环节。1 用户界面应该基于用户心理模型,而不是实现模型。User interfaces should be based on user mental models rather than implementation models.2 目标导向的交互设计反映了用户的心理模型。Goal-directed interactions reflect user mental models.3 交互设计不是凭空猜测。Interaction design is not guesswork.02:21 第2章 理解问题:设计研究任何设计成果的评判标准,都要看产品最终满足用户或委托开发组织需求的程度。不管设计师技艺多高超,多有创造力,如果没有清晰而详细地了解其目标用户、问题限制及推动设计的商业或组织目标,那么成功的机会不大。仅仅筛选一下从市场调查(尽管这对回答其他类型问题十分重要)之类的定量研究得到的数字和图表,很难轻易地深入把握这些主题。这种行为和组织知识需要通过定性研究方法来收集。定量研究方法有很多种,每种方法对理解产品设计轮廓都十分重要。03:06 第3章 为用户建模:人物模型和目标一旦花了大量时间进行实地调查,研究用户的生活、动机和环境,接着问题自然而然地产生了:如何利用如此巨大的研究数据打造成功的产品?记事本里充满了对话记录和观察结果,很可能我们交流过的每 个人都有些许不同。很难想象,每次做出设计决策时,都要从数百页笔记中挖掘有用信息。即便有足够时间,这些笔记提供的信息是否有帮助还不 一定。如何使这些数据变得有意义?如何辨明重点?我们引入了建模(model)这一强大概念解决上述问题。1 不要让用户感觉自己愚笨。Don’t make the user feel stupid.2 界面设计的关注点在于单个主要人物模型。Focus the design for each interface on a single primary persona.04:08 第4章 设立愿景:场景和设计需求在前两章中,我们讨论了如何收集关于用户的定性信息,如何利用信息创 建模型。通过仔细分析用户研究结果以及人物模型及其他模型的综合体,我们创造了一副清晰的画面来呈现用户及其各自的目标和用户目前的情况。接下 来,就到了整个方法的关键部分:如何利用对用户的理解来制订设计方案,既 能让用户满意、对用户有所激发,同时又能完成商业目标,突破技术上的限制。1 设计产品行为前,首先定义产品会做什么。Define what the product will do before you design how the product will do it.2 设计的早期阶段,假定界面是魔法。In the early stages of design, pretend the interface is magic.05:04 第5章 设计产品:框架和提炼上一章中我们讨论了设计过程的前半部分,即利用故事情节或场景剧本来设想理想的用户交互过程,之后从这些场景和其他来源中对需求进行定义。现在我们终于做好准备,开始设计。1 绝对不要向利益相关者展现你不满意的设计方案,那可能正是他们喜欢的。Never show a design approach you’re unhappy with; stakeholders just might like it.2 用户体验只有一个,即形式和行为的设计必须相互和谐。There is only one user experience: Form and behavior must be designed in concert.05:48 第6章 创造型团队合作在本书的介绍中,我们曾提到,目标导向方法包含三方面内容,即原则、类型和过程。然而,还有一点值得提及——实践。本书花费了大幅篇幅讲述上述 三方面内容,我们希望能在本章跟大家分享一些关于目标导向设计的实践,以及设计团队如何融入更大的产品团队。本章主要讲述三方面内容:一是团队合作的战略;二是产品开发的正确方法;三是整合不同组织间团队合作的技巧。有些最有趣、最重要的设计问题太 大以致无法单独解决。通常,这些问题牵扯过多,很难拋开其他问题而单个解决。第二部分 设计行为和形式06:41 第7章 良好产品行为的基础如何做出产品设计的决策呢?什么成就了好的设计方案呢?测量设计质量的一个依据,就是产品满足用户目标和需求的能力,以及是否适应商业目标和技术限制。但是产品解决方案是否具有可识别、可实现性的特征?我们能否将类似问题的解决方案一般化?要成就好的设计是否要求设计过程具有普遍适用性?答案就在交互设计价值、原则和模式的使用中:设计价值(design values) 为成功、恰当的设计实践提供了指导方针;设计原则(design principles)为设计有用而令人期待的产品、系统和服务提供了向导;设计模式(design patterns) 针对某些具体的设计问题给出了一般方案。07:34 第8章 数字产品的礼仪研究发现,人类与计算机及其他交互产品之间的对待和反应方式如同人与人之间的交往。我们与软件的交互也出于本能,是无意识行为,也是不可回避的。这个研究的意义是深远的,如果希望用户喜欢我们的软件,那么当我们设计软件时,应该让它表现得像一位举止得体的人。如果希望用户能高效地使用我们的如果希望用户能高效地使用我们的软件,那么就应该将它设计得像一个帮助和支持自己工作的同事。总之, 应当考虑人与计算机在工作上的角色分配。1 人来思考,计算机干活。The computer does the work, and the person does the thinking.2 软件应该像人一样体贴。Software should behave like a considerate human being.3 如果用户愿意操作,就值得程序记住。If it’s worth it to the user to do it, it’s worth it to the application to remember it.08:42 第9章 平台和姿态在开始设计一个数字产品的交互框架时,要回答的第一个问题是“什么样的平台(platform)和姿态(posture)是合适的?”产品的平台(platform)可以认为是使产品能运转起来的软件和硬件的共同作用体,包括用户交互和产品内部运转。常见平台:桌面端、网站、手机、数码相机……产品的姿态(posture)是指产品的行为立场,也就是产品对用户的展现方式。姿态讨论的是用户在与产品交互上投入多少精力;以及产品又如何回应这些精力投入。这一决定必须建立在了解产品可能的用户场景和环境基础上。常见的应用姿态分为独占式、暂时式、后台式……1 技术平台相关的决定最好能融入交互设计的成果。Decisions about technical platform are best made in concert with interaction design efforts.2 全屏幕使用独占应用程序,让它发挥最优效果。Optimize sovereign applications for full-screen use.3 独占界面应该采用保守的视觉风格。Sovereign interfaces should feature a conservative visual style.4 独占式应用程序可以使用丰富的输入方式。Sovereign applications should exploit rich input.5 在独占应用程序中让文档视图最大化。Maximize document views within sovereign applications.6 暂时应用程序必须简单、清晰并且意思明确。Transient applications must be simple, clear, and to the point.7 暂时式应用程序只使用一个窗口和视图。Transient applications should be limited to a single window and view.8 启动暂时式应用时,它应该处于上一次的位置和配置状态下。A transient application should launch to its previous position and configuration.9 信息亭应该针对首次使用者进行优化。Kiosks should be optimized for first-time use.10:56 第10章 为中级用户优化设计大部分技术产品用户都了解这种感受,即买回一部数字家电或下载一个新 软件应用,就意味着要开始学习一种新界面;而这种学习过程历时数天,充满了 挫折感和失望。此外,许多有经验的数字产品用户也可能会沮丧,因为他们总被产品当作新手。看来很难找到一个合适的平衡点,同时满足新手和专家的要求。1 不要将培训工具固定化。Don’t weld on training wheels.2 没有人愿意永远当个新手。Nobody wants to remain a beginner.3 为中级用户而优化设计。Optimize for intermediates.4 为常见的导航调整界面。Inflect the interface for typical navigation.5 用户只有获得充分的回报,才会付出相应的努力。Users make commensurate effort if the rewards justify it.6 将用户想象成为非常聪明但很忙碌的人。Imagine users as very intelligent and very busy.12:12 第11章 编排与心流如果产品设计的目标是让用户在使用产品时生产力更高、更有效、更投入, 就必须让用户保持正确的心态。本章讨论人类心理工程学(mental ergonomics), 主要讲述了如何让产品支撑起用户的智力和效率,如何避免破坏用户在投入生产时的专注度,这正是我们希望用户保持的状态。1 不论界面多酷,越少越好。No matter how cool your interface is, less of it would be better.2 不要用对话框报告。Don’t use dialogs to report normalcy.3 请求原谅,而不是许可。Ask forgiveness, not permission.12:59 第12章 减少工作,消除负担软件经常包括一些臃肿的交互,要求用户做不必要的工作。界面交互始终需要用户做事情;设计师(或者是其他更重要的人)须将此种必要负担降至最低, 同时还能让用户达到目标。如果设计师和开发者不注意人们为操作技术所需的动作,就会产生繁重的用户体验。用户得费很大力气才能为他们想要执行活动 所需的心理模型与设计的产品界面匹配上。用户与数字产品交互时执行4类工作:认知工作、记忆工作、视觉工作、肢体工作。1 尽可能地消除每一种练习。Eliminate excise wherever possible.2 不要愚蠢地打断进程。Don’t stop the proceedings with idiocy.3 不要让用户请求许可。Don’t make users ask for permission.4 任何输出之处应允许输入。Allow input wherever you have output.5 重大改变必须显著优秀。Significant change must be significantly better.14:14 第13章 隐喻、习惯用法及能供性随着Android、WindowsPhone和iOS的降临,我们正式进入了交互设计的 后隐喻时代。早期桌面软件和手持设备的拟物化(skeuomorphism)和过度雕琢的视觉隐喻已成过去。现代设备的UI以内容和数据为中心,把UI控件的认知度降至最低。这种脱离隐喻之势姗姗来迟,如此有充足的理由:严格奉行隐喻设计毫无必要,却把界面死死地与物理世界的运行机制捆绑在一起。基于隐喻设计的用户界面还有一大堆其他问题,如没有足够多的隐喻、 缩放效果不好、用户能否识别出隐喻有待商榷,特别是在跨文化时。隐喻, 尤其是物理隐喻和空间隐喻,在设计大多数数字产品时作用不大。1 多数人并不想知道得太多,只想成功地使用产品。Most people would rather be successful than knowledgeable.2 不要让界面强行适应隐喻。Never bend your interface to fit a metaphor.3 所有的习惯用法都需要学习,而好的习惯用法只需学习一次。All idioms must be learned; good idioms need to be learned only once. 4 丰富的视觉反馈是成功的直接操作的关键。Rich visual feedback is the key to successful direct manipulation.5 尽可能用视觉表达顺从。Visually communicate pliancy whenever possible.15:54 第14章 重新思考数据输入、存储与检索在数字科技的世界中,实现模型思维在数据管理上体现得最明显:输入、存储、检索数据。你遇到多少次这样的情况:在一组表单中输入信息,却弹出令人迷惑的错误 对话框,告诉你输入错误。或许是在电话号码中输入了连字符,或许是在只能 输入名字的地方输入了姓氏和名字,或许不小心在只能输入数字的地方敲了文 本。这些问题都源自软件强迫人们像电脑一样思考。软件迫使人们毫无必要地面对电脑内部的数据输入、存储和检索机制。不仅你母亲有这个问题,即便高级用户也很容易迷惑或犯错误。1 出错可能不是程序的问题,但是程序的责任。An error may not be your application’s fault, but it is your application’s responsibility.2 审核,不要编辑。Audit, don’t edit.3 自动保存文档和设置。Save documents and settings automatically.4 把文件放在用户能找到的地方。Put files where users can find them.17:16 第15章 防止错误,通知决定数字革命早期,对话框和消息在软件应用的图形界面中占据着很大比例, 告诉用户他们做错了什么,或者警告用户,计算机或软件由于实际或臆想的技术限制,无法处理你的请求。如今,由于计算、存储和通信速度增加了不知道几个数量级,先进的编程工具和技术同样有长足进步,这两类错误信息中的第二类基本没有了。而第一类错误信息,责备用户犯错误,也已经开始消失(至少在消费者和移动应用程序领域)。设计者发现了更好的方法以防患于未然,允许用户进行撤销操作,此外还赋予用户在操作之前预先看到结果的魔法。关于错误 防止和决定通知的这三种策略,就是本章的主题。18:14 第16章 为不同的需求而设计正如第一部分所谈到的,人物模型和场景有助于将设计工作重点放在实际 用户的目标、行为、需求和心理模型上。除了人物模型能让设计工作抓住重点外, 一些持续性的可概括的用户需求模型也能告诉我们应该如何设计产品。本章将 探讨满足一些广为人知的需求所需的策略:易学性(learnability)和帮助(help)、 可定制性(customizability)、本地化(localization)和全球化(globalization),以及无障碍性(accessibility)。1 给用户提供一个现成模板库。Offer users a gallery of ready-to-use templates.19:00 第17章 整合视觉设计作为交互设计师,你需要花费大量精力理解产品的用户,还要花时间雕琢界面的行为和内容的呈现,帮助用户达到目标。不过,如果没有投入大量工作清晰地告诉 用户有哪些内容,如何与内容交互,那么上述努力就白费了。对于交互产品,这 种沟通几乎总是视觉的,借助显示器完成(就定制硬件而言,也可以通过物理 属性来传达某些产品行为。)本章将讨论有效的目标导向视觉界面设计策略。第3部分将提供更多关于具体交互与界面习惯用法的细节。1 表明这是什么用视觉;明确这是哪一个用文字。Visually show what; textually tell which.2 行为不同的元素要在视觉设计上明显区分。Visually distinguish elements that behave differently.3 从视觉上传达功能和行为。Visually communicate function and behavior.4 删减东西,直到破坏了设计为止,再把最后去掉的东西加上。Take things away until the design breaks, and then put that last thing back in.5 遵守标准,除非有极好的其他选择。Obey standards unless there is a truly superior alternative.6 一致不意味着僵化。Consistency doesn’t imply rigidity.

2023/4/14
20:32
与老范对谈:ChatGPT等AIGC技术对内容产业的影响和趋势判断

与老范对谈:ChatGPT等AIGC技术对内容产业的影响和趋势判断

昨日,我和老范线下面基,用一下午的时间深入探讨了AIGC对内容产业影响的话题,这次聊天收获满满,我迫不及待将这次讨论的内容整理成了文章。但在这之前,请让我先介绍一下老范。老范曾就职于盛大创新院、猎豹移动,是Tiktok的早期投资人,是一名互联网资深老兵,也是一名油管科技类的UP主,他的“老范讲故事”频道内容非常优质,他对于行业趋势洞见也是与众不同,他与粉丝之间的关系维护得非常好,平易近人的沟通方式,让粉丝社群也是非常的活跃。但最让我佩服的是老范作为互联网老兵,依然能紧跟时代潮流,玩ChatGPT、Midjourney 比很多年轻人玩得都要好。随着AIGC技术的发展,内容产业正在经历巨大的变革。老范的核心观点是:内容生产的成本将变得极低,但流量会变得更贵,人需要更像个人,但会有新的盈利模型的产生。一、AIGC对于流量模型的改变长久以来,互联网的流量模型是一个三层的漏斗,“获客 → 留存 → 变现”。过去我们通过大规模广告投放获客,通过提供内容获得用户留存,然后通过广告、打赏、会员等办法变现,但是如今处于互联网的下半场,背后的成本大头是流量投放和内容采购。接下去是AIGC时代,优质内容的成本将被极限压缩,通过AI可以轻松地将大量的数据和文本转化为高质量的内容,无论是文字、图片、音频还是视频。但更便宜的内容,也需要有更多的消费者。大量溢出的内容也导致了流量争夺的加剧。节省下的内容采购成本将转移到投放成本上,因此会更加看重流量模型的变现效率。未来的流量模型将变成“获客(内容) → 变现”。AIGC的内容将成为流量投放过程中最有效的钩子。老范给我举了个例子,未来ChatGPT可能会颠覆各式各样的咨询行业。以移民咨询为例,大部分想要咨询的用户通常都问一些很基础的问题,但是真正下定决心移民的人并不多。目前,中介公司只能通过设置咨询费的门槛筛选出精准客户,但是这也排除掉很多潜在客户。当ChatGPT的介入后,我们可以将基础的咨询服务作为流量投放的钩子,人人都可以享受基本的咨询服务。通过机器再筛选出真正的客户后再交给人工,这样普通用户既享受了基础的服务,目标用户又能够有效地转化,咨询公司又能够赚钱。现在,大语言模型解决了问题的宽度,但是细分领域还是要有小模型,在每个细分领域都是机会。如果是创业者或投资人,可以从流量模型的效率角度去评估项目的价值。二、从内容体验转向服务体验随着AIGC技术的进步,人们对于内容的需求也在发生着变化,消费者不会仅满足于视觉和听觉的体验刺激,他们更加需要的是更具有价值感的服务体验。老范做了个“预制菜和大饭店”的类比。预制菜是方便实惠的,但它们都是标准化的,无法满足人们对于特殊口味和服务体验的需求。相比之下,人们之所以去大饭店用餐是为了享受服务体验,价格昂贵但环境优美,服务到位,而且主厨有丰富经验和资历,所提供的菜品也更加具有特色和独特性。未来的内容产业也会出现类似的情况。一些媒体内容将会被大规模标准化生产,以满足大众消费的需求,例如,影视解说类短视频。未来还会有更多形式的快餐内容,以满足大众对于普遍内容的需求。另外,还有一部分内容将会更加注重品质和服务体验,这些内容将由资深的内容创作者提供,他们将扮演饭店主厨的角色,以独特的视角和专业的经验为用户提供更加个性化和专业化的服务。这个时候人需要更像人而不是机器人。例如,软件咨询行业,虽然具体代码可以交给ChatGPT来实现,但是依然需要有人扮演项目经理的角色,因为还有许多不能被替代的工作,如与客户建立情感连接,深入了解需求,提供整体的解决方案,还有把控项目质量、成本和时间,这是一套综合服务体系,依然需要行业资深人士。未来的内容创作者的内容制作80%的工作都可以交给AI完成,但是思想内核还需要人来把控。因为“人需要更像人”,人设也将成为创作者很重要的资产。另外,这些创作者角色要从内容制作者转变成服务体系搭建者,因为前置的内容只是获客环节的第一步,剩下的还有很多要做,例如,课程体系、社群互动、情感连接、个性化问答以及社区资源整合,从而来满足用户对于高品质内容和服务的需求。因此,私域流量运营也将会成为未来内容产业的重要一环。而ChatGPT也可以帮助私域运营提效,除了社群的日常管理和互动、还能提供智能的推荐和个性化服务,从而更好地满足用户对于高品质服务的需求。三、创作者需要善用AI工具才能打破枷锁创作者们如果能善用AI工具,一方面,可以更好地提升内容创作的质量和效率;另一方面,也能够更好地满足用户对于高品质服务的需求。节省出来的时间,能让创作者更好地去扮演好自己。未来的创作者团队构成可能是”1+1+N”,1个创作者和1个社区,外加N个机器人。在AI的辅助下,创作者可以低成本、低风险地创业,而很多势能可以从社区中获得。这也帮助了个人创作者的崛起。因此,传统的MCN公司的圈养素人的模式已经不再适用。过去他们为了绑定主播通常会签订一个苛刻的长期合同。站在MCN公司的角度,他们认为把一个素人主播培养成百万粉丝的网红,如果翅膀硬了后离开带来的损失是难以挽回的;但对于有能力的主播来说,成功主要原因还是归结于自己本身的素质,而不是MCN的管理模式,签卖身契不公平的。在未来的MCN机构应该是去中心化的(DAO)组织形式,创作者和机构是平等的合作关系,机构通过工具和服务帮助创作者赚到钱,然后再从中分润,同时创作者之间形成一个联盟,保持流量互通、圈子互通。类似于娱乐经纪公司或律所的合伙人制度。老范举了某个主播出海平台的例子,这个平台以工具的形式帮助主播更好地把内容发布到海外平台并获得收益,在这种场景下面也能串联主播之间的资源,形成一个互惠互利的团体。每个创作者需要善于利用AI来提高自己的专业水平和竞争力,同时也要保持自己的个性和风格,打造自己的品牌和价值。只有这样,创作者才能在这个充满变化和机遇的时代中,实现自己的梦想和理想。尾声其实在巨浪之下,需要改变的不仅仅是创作者,而是我们每一个提供脑力服务的人。乐观的人总说:“当新技术产生之后,也会有新的岗位需求出来,所以不用担心”。但我从悲观的角度看,这次变革不一定会这样,因为通用人工智能的目标就是要取代人。在这个行业里面,除了顶尖的算法岗位之外,剩下的岗位就是标注数据。当人与机器拼效率的时候,永远都不是对手。老范提的“人要更像人”是适用于我们每一个人的方法论。“善用AI,打造流量模型,突破现有的枷锁”是我们每一个人都急需考虑的问题。我很荣幸能够有这次与老范对谈的机会,如果您有兴趣也可以关注老范的油管频道——“老范讲故事”。说不定你也会有和我一样的奇遇。

2023/4/9
09:13
智能写作创业记,如何打造一款AI编辑器

智能写作创业记,如何打造一款AI编辑器

Prompt:A detailed portrait of a teacher talking with Wall-E robot ,  Vintage 90's anime style, character, no color本文介绍了作者在2019年至2021年期间先后负责的两款智能写作类产品的经验和创业感悟:第一款产品因为技术实现效果不佳和用户预期难以把控,导致团队在交互层面做了很多优化,但在算法层面没有太多突破。第二款产品则注重将知识图谱应用于文章串联和知识管理,同时结合搜索引擎技术,让用户可以在图谱中得到更多的延展思路。作者认为靠谱的智能协作并不是要代替用户,而是帮助用户提效和创造力。在产品设计过程中,作者提出了通过拆解大目标和结果来控制用户预期的方法。00:00 我的两款智能写作类产品经历02:45 AI写作产品体验构成和设计目标05:37 前端开发落地06:37 创业感悟

2023/3/9
09:10
做工具的主人,而不是工具人

做工具的主人,而不是工具人

在11月28日,我参加了Mixlab和爱智岛联合举办的“A I G C工作坊:商业化机会”为主题的线下活动,有不少一线创业者做了分享,真是开眼了!这次分享给我最大的启发,正应了IBM的一句名言:“Machines should work; People should think”,这句话的意译应该是“让工作交给机器去做,人应该花更多时间做有意义的思考”。当今这个时代,各类创作工具频出从PS、AI、AE、Maya、3ds Max、Blender、Sketch、Figma、Unity、UE……作为设计师或创作者,我们常常焦虑于如何快速的掌握这些工具。我们在应接不暇的过程中,我们已经变成名副其实的“工具人”。但今天,A I G C告诉我们:“人类应该是工具的主人,而不是工具人”。创作者只要输入自己想要的需求,AI就能根据描述生成对应的内容。这才是真正地解放生产力。对于A I G C的理解,我喜欢分享嘉宾北邦的“量子力学”观点:AI是一个黑盒,和薛定谔的猫一样,最终的结果只有你在开启的盒子的那一刻才知道。在这个黑盒的背后,需要我们人类和AI密切配合:从数据、信息、知识再到价值观,每个环节都需要我们重新理解和思考。A I G C影响着Web3.0的发展,从Web1.0到Web2.0的发展过程中,核心在于技术迭代让创作门槛和体验变得更低,因此内容创作从PGC转向了UGC。而WEB3.0的核心理念是用户拥有数据,而A I G C加入极大的降低了优质内容生产和拥有的门槛。在这个时候,DAO(去中心化组织)将发挥极大的价值。因为我们更需要将不同的人组织在一起,发挥出每一个人的想象力。“爱·智岛”的小伙伴演示了他们如何围绕“世界杯”主题,通过A I G C的方式头脑风暴出大量高质量方案。另外,其他嘉宾也分享了他们在A I G C领域的一些前沿探索……最后,为了纪念这次活动,我们现场A I G C了一个NFT徽章,送给所有参会的人员。或许在未来,每次活动徽章将不仅仅只是一个参会纪念,也将成为MixDAO的高级门票或者邀请码,持有的小伙伴将不仅可以自己留念也可以转赠给信任的朋友,从而激励更多人投身到DAO的建设中去。未来会怎么样?在分享会上,我回想起从2019年开始和小伙伴们一起探索“智能写作”经历,这可能是我们最早期的A I G C尝试。但当时踩的坑至今还历历在目,但这次分享又重新燃起了我的兴趣。这次分享结束后短短几天,ChatGPT火爆了全世界。我尝试着让ChatGPT帮忙构想一下未来的场景,并将让Midjoureny来帮我创作一幅画。短短三年时间。新技术带来的新体验已经不能同日而语。或许不远的将来,大量的内容创作的过程是:描述需求、生成内容、挑选结果。对于未来的畅想,或许如ChatGPT所述:“在这个世界中,机器负责工作,人类负责思考。这可能是一个乌托邦或反乌托邦,取决于人类如何平衡机器的使用和人类的创造力和思维。”未来会怎么样?答案即将揭晓……

2022/12/19
03:30
产品团队的批判性思维:如何通过合理的决策带来合理的结果?

产品团队的批判性思维:如何通过合理的决策带来合理的结果?

今天这篇文章是一篇译文,作者特蕾莎(Teresa)是一名富有经验的产品发现教练,这篇文章源自于她在2017年伦敦产品思维大会的演讲——产品团队的批判性思维。读了这篇文章以后,我突然明白,一切决策都和心理表征有关系。心理表征源自于过往的经历并长期存储于头脑之中。如果领导在做决策的时候心理表征是“面子”,那么解决方案可能就是“维稳”。但不可否认,每个人的心理表征都会有一定局限性。我们在做决策的时候,倘若缺乏开放民主的态度,缺乏客观的流程和方法,不能让不同背景的专业人士贡献出自己的心理表征,那最终决策必然存在极大的风险。作者也提出了自己的解决方案——“机会解决方案树”。它通过可视化方式共享团队成员的心理表征,达到合理决策的目的。一、从一个故事开始早在2008年,我在一家初创公司担任产品经理,我们主要的产品是为大学生校友会服务的在线社区。和许多产品团队一样,我们也面临诸多的挑战。每当我们推出一个新的在线社区的时候,校友们都会争先恐后地去看看他们的新网站。但随着时间的推移,访问量却变成了涓涓细流。通过用户研究,我们知道校友们喜欢给其他社区成员发送邮件来征求建议,例如,“如何找到下一份工作?”“住在新城市的哪个地方合适?”,这些也正是我们希望用户做的。我们的产品允许用户向整个校友社区发送邮件,但问题在于没有人愿意收到垃圾邮件。例如,住在达拉斯的校友收到电子邮件有“在芝加哥出售的物品”“在波士顿出租的房屋”以及“在旧金山的实习机会”。如果我们想提升校友的参与度,我们就必须减少社区中不必要的垃圾邮件。你是否和我一样,已经开始思考如何解决这个问题了?当我求助于我的团队,开始头脑风暴的时候,我们的工程师赛斯提出:“让我们集成谷歌地图!做一个能展示全球校友居住位置的地图。”我很震惊,居然有如此的突发奇想。我实在想不出其中的道理,很好奇地问:“谷歌地图会如何为我们解决垃圾邮件的问题?”但赛斯回答:“哦,不会的,但这会提升参与度,因为这很酷。”我开始向其他小伙伴寻求帮助,可悲的是,他们同意赛斯的观点:地图会很酷。当时,我无法用言语来表达我的沮丧,但直觉上我知道做一个酷的东西是不够的,知道人们住在哪里并不是一个很大的需求,添加谷歌地图感觉就像是个噱头。其实,这个故事并不是关于“我和赛斯,到底谁对谁错”而是一个更复杂的故事:一名产品经理应怎样让团队做正确决策,而不是怎样让团队做得更快。二、普遍性的问题如今,作为一名产品发现教练,我看到了这一幕在一个又一个团队中一次次地上演:我们不知道,一个既定的目标(如提升参与度)如何有效地转变为相关的具有可行性的解决方案。于是我试着解构拆解这个问题:1、 我们很容易爱上自己的想法我们很容易产生一个想法。当我们听到一个需求时,就会立刻自动地在想解决办法,或许这样闭合的脑回路感觉很好。但当我们爱上我们的想法时,我们不愿意审视它,我们也不会停下来反思,我们不会问:“这个想法到底真的好吗?”这就是赛斯的问题,他了解了谷歌地图API并很兴奋,他迫不及待地想试试看。他和我们团队的其他成员分享了他的想法,他们很快也爱上了这个想法。2、我们没有考虑足够多的想法当我们爱上我们的想法时,我们就不会考虑足够多想法。我的团队非常喜欢谷歌地图的想法,他们迫不及待地开始深挖,迫不及待地想要做些能提升参与度的事。谷歌地图的想法可能是个好主意。但是头脑风暴的研究表明:当我们产生更多的想法时,我们就会产生更好的想法。更重要的是,当我们考虑更多想法时,我们会做出“比较和对比”的决策,而不是“非是即否”的决策。我们很难非是即否地回答,一个决策是好还是不好。因为“好”不是绝对的,而是相对的。我们应该问一个“比较和对比”的问题:“这些想法中哪一个看起来最好?“这更容易回答。试想一下,短跑冠军博尔特独自在一条赛道上跑步,他跑得快吗?这很难说。再想象一下,他和其他选手在一条跑道上跑。他跑得快吗?很明显,一个“比较和对比”的决策会更容易评估。此时,你或许觉得自己已的想法够多了,稍后会讲怎么办。先让我们回到我的团队的问题上:我们爱上了我们的第一个想法,这也导致我们没有把想法考虑得够多。除此之外,我们团队还犯了以下的错误:3、我们没有向目标机会看齐赛斯的谷歌地图想法让我抓狂的原因,不是因为我觉得这个想法不好,而是因为我觉得这无关紧要。它没有解决我想解决的问题。这说明,我们也没有围绕着一个目标机会(或我们试图解决的问题)进行思考。在我的团队在进入创意阶段前,我没有花时间确保他们在问题上保持一致。以至于赛斯在思考如何提升参与度时候,却没有考虑到我所关注的:如何减少垃圾邮件的问题。4、我们没有考虑足够多的机会点头脑风暴会议中,我认为减少垃圾邮件是一个正确的机会,而赛斯想的却是帮助人们与附近的校友建立联系。我们俩都只考虑了各自的一个机会点。就像我们通过考虑更多的想法避免“非是即否”的问题一样,机会点也是如此。我们不要问“这个机会值得追求吗?”我们要问“这些机会中哪一个看起来最好?”这也就是说,如果没有更多机会点可供选择,我们就会冒险去解决一些不重要问题。我们应该做的是退后一步看问题:“所有可能提升校友参与度的机会还有哪些?”三、用“机会解决方案树”可视化你的思维安德斯·艾利克森写了《刻意练习:如何从新手到大师》一书,这本书总结了他用毕生的工作,探寻新手和专家之间的区别。他认为专家比新手有更复杂的心理表征。他对心理表征的定义如下:“心理表征是长期保存在记忆中的预设的信息模式,如事实、图像、规则、关系等,可以用于在某些特殊情况下快速而有效地作出反应。”他认为,“心理表征的重要价值在于它能帮助我们处理信息:帮助我们理解和解释信息,并将其保存在记忆中,对其进行组织和分析,并帮助我们据此做出决策。”这不是我们所需要的答案吗?是什么使我们能够理解、解释、组织和分析我们收集的所有信息,以便我们可以据此做出更好的产品决策?在上面的故事中,我们每个人都带着不同的信息来参加头脑风暴会议,每个人都依赖自己的心理表征来快速做出决策。我是带着对用户的深入了解来参加头脑风暴会议的,因为我刚刚完成了一轮用户调研。而赛斯带着对新技术的深入了解参加了头脑风暴会议,因为他刚刚读过谷歌地图API。唯一的问题是,产品团队需要联合团队成员的知识,通过共享心理表征作出快速决策。因此,我提出了“机会解决方案树”这个视觉化思考工具:通过可视化的树状图,把预期目标的拆分成不同的机会点,再把机会点拆分成多个解决方案,在通过实验验证解决方案的可行性。四、如何绘制“机会解决方案树”?1.从定义明确的预期结果开始产品团队需要弄清楚他们想要达到的目标是什么。我们需要自问一下:“什么可以提升参与度?”在我们开始寻找解决方案之前,我们应该先画出机会空间。我们很容易将机会理解成客户的需求或痛点,但我们也需要考虑那些让人愉悦的机会和可成功复制的机会。2.机会应源自于生成性研究为了探索如何达到预期的结果,我们应该从规划机会空间开始。为了确保我们始终以用户为中心,我喜欢将机会点的定义限制为客户可能会说的话。这些机会点应该来自生成性研究——客户访谈和客户观察 。现在我的团队刚刚结束了一系列的校友访谈,我们获得以下的机会列表:这个列表列出我们在校友访谈收集到的内容。接下来怎么做呢?大多数人可能会先开始排列优先级,你可能会问:“哪些机会对我们来说是最重要的?”但如果这些机会点的类别不相近,那我们很难对它们进行优先级排序。例如,“雇佣一个应届毕业生”或“指导一个学生”都属于“回馈社区”的方式,我们很难对他们进行优先级排序。就像我们拿“苹果”与“水果”做优先级比较,显得有点不合理。3. 用机会解决方案树简化优先级排序为了简化我们的优先级排序难度,我们可以将这些机会点分组,将类似的机会整理在一起。这样会更加清楚。最后我分成了三组:1. 我需要帮助;2. 我想和母校保持联系;3. 我想回报社区。我们可以先对这三组进行优先级排序,而不是对一个很长的列表进行优先级排序。从用研报告可知,我们用户反馈的较为普遍的机会点是“我需要帮助”。 “谁住在我附近”在“我需要帮助”的机会点之下,这样看来赛斯似乎是对。如果赛斯和我今天有这样的对话,这棵树无疑会帮助我们对话提升一个层次。与其争论“电子邮件太多”与“谁住在我附近”,不如先问问这三个机会点哪一个更重要。我们很容易就同意“我需要帮助”的机会对校友来说是最重要的。我们应该把注意力转移到优先考虑“我需要帮助”机会的子节点上。但现在又有些问题困扰着我,我认为“我需要帮助”与“我收到了太多电子邮件”有着内在的联系。我们需要把需要帮助的人和能提供帮助的人联系起来。如果我们用户滥发电子邮件,他们就不太可能提供帮助。通常,机会的组合方式并不是只有一种。你的机会结构应该反映出你在用户调研中听到的内容,并且应该能较好地优先级排序。首先,我将“我需要帮助”和“我想回报社社区”的机会点合并为一个名为“我想与其他校友建立联系”的机会点,在它下面再有3个子节点:1. 我想与校友建立专业性联系;2. 我想与附近的校友产生联系;3. 我不知道该与谁建立联系;机会结构在重新调整后,把我们的视线带到了市场的两端——需要帮助的人和能够提供帮助的人。他们在同样的机会节点下更加紧密地联系在一起。当我们在给不同的联系方式(如,专业性、地理位置等)排定优先级的时候,也不会偏袒市场的某一方。这也减少了我和赛斯之间的分歧。我们都同意应该将注意力放在左边的分支上。我们只是不同意哪个机会点会更重要。这使得通过查看数据更容易解决我们之间的分歧。我们可能会问:“有多少校友想与身边的人建立联系?有多少校友不知道该和谁联系?”有时需要多几次尝试才能找到有效的结构。关键是要确保它能反映出你从客户那里听到和看到的信息,并能帮助你就优先考虑的事项做出正确的决定。记住,没有绝对的答案。随着团队对客户了解的加深,您的树结构将继续发展。视觉化思维的价值在于,它能帮助您的团队解决分歧,并共享不同的视角。一旦你们有了一个满意的机会结构,你就可以考虑解决方案了。4.请专注于一个目标机会进行构想前面提到过,可能对于大多数人来说,不是没有想法,而是想法太多。当你有太多的想法时候怎么办?我们可能有很多想法,但它们往往会散布在我们的树上,就像这样:头脑风暴的价值在于,通过一个又一个新的想法,推动想法的迭代,从而找到真正具有创造性的解决方案。但很多是初步的想法,也会导致产品停留于肤浅层面。这不仅失去了头脑风暴的创造性,而且最终也导致我们面对一堆方案不知所措。另外,我们也很难给不一样的事物排定优先顺序。相反,我们可以通过逐行排列优先级来选择目标机会,然后再深入挖掘这个目标机会点,再产生多个解决方案,如下图:这样可以通过锁定一个目标机会来制定“比较和对比”的决策,而不是让想法散落在不同的机会之间。最终,你会发现有许多的想法去解决一个目标机会。现在,你已经有足够多的想法了。你可能考虑开始排定优先级了,或者迫不及待开始试验你的头号Idea。但这会导致另一个“非是即否”决策——我们觉得最好的想法到底是好是坏?我们应当建立一个“比较和对比”的决策,我期望你能回答:这些解决方案中哪一个看起来最具有可行性?5.通过投票缩减范围,设计实验来做对比和比较当我们有很多想法时,我推荐你先用点投票法缩减列表,再使用实验来评估这个集合。首先使用点投票将一个大的列表缩减为3-5项。研究表明,团体比个人更善于评估想法,而点投票是一种快速的投票方式。然后用实验来确定剩下的3至5个想法中哪一个看起来最有希望。但值得注意的是,当大多数团队进行实验时,他们希望通过实验来确定一个想法是否好,但这是另一个“非是即否”的决定。我希望你设计的实验,能够帮助你在一系列好的想法中做出选择,做到一个“比较和对比”的决策。做到这一点最简单的方法是,确定每个想法成立所需的关键假设,然后设计实验以测试每个假设。如下图,如我们选取“推荐收件人标准”这个想法,通过地理位置自动匹配收件人和发件人,或根据朋友的朋友来发送消息。我们可以列出这些关键问题和实验设计:关键问题:请求帮助的人会信任我们的收件人推荐吗?实验设计:我们可以制作一个用户界面的原型,看看人们的反应。关键问题:我们是否能够预测谁应该能够收到消息?实验设计:我们的机器学习团队可以做一个可行性实验。关键问题:朋友的朋友更有可能提供帮助吗?实验设计:查看数据库,看看朋友的朋友是否更有可能回复之前的消息。你可能会问:我怎么知道我的实验结果是否好?例如,15%的转化率够高吗?这就像是我们在问:“博尔特跑得快吗?”当他独自在跑道上跑步时,很难说。但是,如果你尝试了多种想法,你可以问:“根据我收集的数据,哪种解决方案看起来最好?”这很容易回答,就像博尔特和别的运动员一起赛跑时才能显得更快。请用做实验的方式在一组解决方案中选择,而不是评估单个解决方案。五、总结数十个产品团队受益于“机会解决方案树”,如果你像我一样,你想让你的整个团队参与决定构建什么,但你总是被“谷歌地图”所困扰,或者你的团队陷入了意见辩论的泥潭,那么我建议你开始构建一个机会解决方案树。花点时间直观地描绘出你的思维,将有助于你的团队抓住常见的批判性思维错误,如创建“非是即否”决策而不是“比较和对比”决策。另外,这棵树还充当了一个发现路线图,帮助你的团队对机会空间,以及实现预期成果的潜在路径的达成一致共同理解。和传统的路线图一样,它将帮助你向你的领导和公司其他人传达你所了解的东西。译者注:作者绘制了一张图描述了如何通过“机会解决方案树”做到持续发现的能力:产品团队按季度制定目标,通过每周进行客户访谈来发现机会点,然后针对一个机会点构思大量的解决方案,并制作原型和实验来评估解决方案的可行性,过程中不断的迭代优化。请开始你的机会解决方案树,记住以下几个要点:从明确的预期结果开始;然后规划出机会空间,请记住机会点应该来自生成性研究:客户访谈和客户观察调整你的机会结构,不同的结构将带来不同的可能性;通过逐行排列优先级来选择目标机会;通过锁定目标机会来限定创意的产生范围;最后,运行实验来评估您的解决方案集

2022/12/9
19:30
从Google+学到的8条产品经验

从Google+学到的8条产品经验

从Google+学到的8条产品经验 8 product lessons we can learn from Google+ 作者 保罗·亚当斯 Paul Adams (@PADDAY) 产品副总裁@INTERCOM 2014年5月8日虽然我在最初的Google+团队工作过,也是发明“圈子”这个概念的人,但我早就离开了这个团队,也没有什么内部消息。这篇文章也不包含任何机密信息。我只是简单地分享我思考清楚的产品经验,希望能帮助更多的人创造出更好的东西。所有的内容都来自公开的信息。 1. 关注人的问题,而不是公司的问题关于Google+ 到底怎么了的讨论,其中核心主题是Google 在Facebook 崛起之际到底面临哪些问题,还有哪些问题依然存在。在我写这篇文章的时候,所有围绕这个问题的讨论都是以公司作为出发点的。对于Google+可以或者应该解决的人的问题的讨论则所见甚少。如果Google+ 想要有和Facebook 一样的用户参与度,它需要考虑如何使人们的生活得到本质的提升。大多数人毫不关心Google 所面对的问题。同样,他们也不用Facebook 去搜集和他们自身相关的数据来进行更精准的广告投放。他们仅仅是希望有更好的工具来帮助他们过上更快乐和更满足的生活,而且他们往往不会看到工具在未来的长远价值。关键是社交软件的创新并没有完结。人们想要更好的方式来构建、维系并发展关系吗?当然,人们想要更好地和他人分享体验,不管身在何处?这些问题一个都没有解决。人们甚至也不知道他们在未来如何分享自己的经历,这也是Facebook对于Oculus Rift的收购会如此有趣的原因,而Google+ 的绝大部分提供的都是别处已经存在的服务。互联网依然在其婴儿期。还有如此多发明创造的空间,如此多的机遇可以让人们的生活变得更好。完全没有必要担忧来自竞争的威胁。互联网并不是一个零和的游戏,也没有一个关于产品结局的定论。2.可感知的价值应大于可感知的付出我的通讯录里有很多我认不出的人。这基本上是我人生中所有的人,但由于我糟糕的管理,我最私人的设备中最私人的一部分却充斥着陌生人。其他人的情况也差不多,原因很简单:并不值得让通讯录及时地更新。这也是Google+ 圈子的问题。对每个人来说,感知到的价值是明显的。圈子更清楚地划分了线下人生的样子,人们与不同的人分享生活的不同部分。这也是当时Facebook的阿喀琉斯之踵——Facebook的设计模式是和所有的人分享所有的东西。这限制了人们愿意分享的内容范围。但这是一个困难的设计问题,仅确定一个明确的用户价值还是不够的。相比产品的初期洞察和独特卖点,执行力也同样重要。像绝大多数移动通讯录那样,人们并不会手动将朋友添加进圈子里,而且更重要的是,他们也不会保持更新。圈子需要持续的用户操作,尽管有其价值,并不值得为之付出。用户界面再好看也不管用(如下图),动效再流畅也是徒劳,体验再好玩也没有意义。人们并不会使用这个服务,因为可感知到的付出大于可感知的价值。个人认为,这没有办法解决。用圈子就像现实生活的社交圈,需要的手动操作却违反直觉,所以这个概念不能成功。是时候重新想想了,这稍后会继续讨论。3. 缩小范围和更加聚焦,请加以耐心,互联网还年轻除了像Instagram这样极少数的应用之外,社交网络需要很多时间来建立和巩固,就像现实中的关系一样。这需要耐心和特别的专注。太容易就会朝三暮四。Google+ 一次性全部都想要。在Facebook崛起的同时,Twiter也在发展,Google+尝试与两者同时竞争。Facebook和Twitter是满足人们不一样的需求的不同产品。Google+的产品复杂度及其未能砍掉多余功能表明这依然是一个问题。这种不专注使产品变得无比复杂,给用户增加了很多认知上的负担,使产品变得需要更多付出。在过去的几年里,所有极为成功的社交产品都是从做好一件事开始的,然后再发展壮大。4. 拥抱生活的杂乱无章我曾经做过一个大型研究项目,试图帮助沃达丰了解他们的呼叫中心员工如何共享信息。在汇报时,我展示了两张图片来解释生活是混乱的,不像你的大脑将经历合理化时那么整洁。图片在我们人生中需要处理的所有事情中,人际关系是最复杂最混乱的,不管是初识还是结婚。它们包含了最深刻的人类情感,从我们对自我的认识,面对他人的自我形象的投射,我们的欲求,我们想成为的人,我们的群体归属感,爱谁以及如何去爱,到我们如何思考死亡。难怪社交设计很难!这种混乱的现实与软件开发人员对结构化数据的渴望之间存在着一条鸿沟。或许有一天我们会发现到我们的大脑全是节点和链接,是事物间深深浅浅的路径,这样就可以映射到软件中。但在我们有生之年这不太可能发生。我认为WhatsApp的崛起原因之一是其拥抱了生活的混乱,从而解决了“圈子”问题。虽然圈子、Facebook列表和Facebook群组全都默认组是一个有明确界限的对象,但WhatsApp不这么认为。WhatsApp的大多数使用模式是群组对话,但其细微的、决定性的差别在于,这些群组并非永久或持续的。并不是一群不变的人在长时间里按照顺序讨论话题。常常是人们围绕某个暂时的东西进行一次性的讨论,例如一个活动、音乐会、聚会,或是周末旅行。然后群组会得体地解散。如有必要,群组又从零组建。通常有一个特定事件让人们聚集起来,新人陆续加入,他们交谈、分享内容,讨论变得混乱,然后消亡。从这种意义上讲,电子邮件和WhatsApp的工作原理是一样的。我们向同一群体不断发送邮件,每次都手动重新创建同样的列表。对很多工程师来说这是疯狂的,导致数据处理和存储异常缓慢。到处都有重复。但这就是混乱的现实。添加别人邮件地址的认知负担很小。所以,一遍遍重复这个行为就说得通了。通过常见模式推荐联系人(例如Gmail),让这件事耗时更少,减少用户的付出,从而创造更好的体验。我不免会想这是不是圈子应该有的交互模式。或者说,更重要的是,这是不是它未来应该具有的交互模式。圈子应该是暂时的,而不是永久的。5. 当你有了网络效应时,快速追随的产品策略并不会有效我们的办公室旁边有个夜店。陈旧,播放有问题的音乐,提供有问题的啤酒。但每个晚上都爆满。人们爱死它了。它旁边新开过许多夜店,几个月后总是关门大吉。新夜店会有更好的装潢、更好的音乐、更好的啤酒。但是,它们没有成功最至关重要的一点:人们的朋友。人们喜欢和他们的朋友待在一起,而这比什么都重要。Google+采取了一种快速追随的产品策略,这个策略就是照抄竞争对手的功能,模仿其核心服务;然后在某一方面比其做得更好,超越现存的产品。从客观上讲,更优的产品会获得最后的胜利。这种战略有很多成功的实例,包括安卓、Windows和Google搜索。对Google+来说,很多地方明显是模仿Facebook如信息流、照片、用户资料和消息推送。但有一件事情没有办法模仿,那就是人们的朋友们。网络效应需要时间来建立。我们需要的不是快速追随,而是一个完全不同的产品策略,还需要耐心和专注。6. Google+ 遭遇闪亮物体综合症回顾过去,在 Google+ 之前,Google 拥有大量社交产品。这份名单是一个令人难以置信的阵容(我不是第一个指出这一点的人)。Gmail:异步消息传递,内联多媒体支持G Chat:同步消息、文本和视频Picasa:具有内置私人共享功能的照片和视频YouTube:面向公众和社区的视频Reader:杂志Blogger:更长的形式发布和日记Voice:语音电话和短信我确信这里有大量遗留问题需要处理,但试想一下,如果在这些产品简单地使用统一的用户身份,并分别对它们进行投资,可能会发生什么?正如谷歌已经统一了所有产品的视觉设计。但更具讽刺是,Facebook 正在把自己的应用根据不同的功能进行分拆,但它们又具有统一用户身份层。例如,Google+ 不一定需要信息流,它当然也不需要像 Facebook 那样外观或结构。显而易见,谷歌不需要真实姓名,他们只需要一种常用的方式来指代某个用户。世界上大多数其他地方仍然使用电子邮件地址来实现这一目标,这对使用 Gmail 的人来说又是另一个讽刺。7. 人们需要生活中实际存在的概念模型我们的很多朋友都是不守时的。我记得在手机时代以前,我们常常需要在碰面地点不断想他们到底会迟到多久。手机的最大优点之一就是消除了这些不愉快的体验。但是Hangouts 又把这个体验带回来了。我该等一会儿吗?还是打开一个新的标签页,干点别的?图片使用另一个渠道时常让人有断裂感。例如用邮件或即时聊天工具和一个本应该加入了Hangout 的人交谈。从Google Chat 到Hangout 的切换挺有趣的。我非常想看看Google Chat 和Hangout分别的活跃用户数量。还有Google Chat的讨论量与Gmail内以Hangout为主的聊天应用的流量对比。我想知道Hangout到底算不算成功?它在Play商店的评分是3.8。我个人认为Hangout的概念很让人迷惑,Google Chat则要好得多。我知道很多人也有和我一样的想法。回顾通讯的历史,很多成功的社交软件都有类似的线下体验。甚至像新闻流这样的应用也可以与中心市集作比较——它们同是新闻和八卦的来源。每产生一个新工具,人们都需要建立一个概念模型,以减轻使用的负担。我只能在现实中联想到一个与Hangout类似的体验(某人在未经事先安排的情况下在某个地方等着别人出现)和这种体验相关的情景在大多数国家都是不合理的。似乎为了使用Hangout,你得事先做好别的功课,例如问问对方是不是在线,或者在日历里创建个事件,或者干脆就像这个名字所暗示的那样,与一种尴尬的社交隐喻打交道——干等着。而呼叫某人这个概念相对来说就要简单得多了。Hangout用来工作和开会可能还不错,用来呼叫家人和朋友就不行了。8. 分发往往胜过产品尽管存在这些问题,但 Google+ 在其生命的第一波成功中是完全有道理的。如果目标是每天让数亿人登录 Google,那么看起来它已经实现了。无论是有意还是无意,现在以一个用户身份登录、搜索、发送电子邮件、观看视频的人数增加了一个数量级。一旦你有了分发能力,它就嵌入了安卓、谷歌浏览器和谷歌搜索等产品,那么就有了更多成功的途径。所以,该怎么做?如果我们从这些经验教训里面学习,并应用到未来的设计中去,应该怎么做呢?我认为Google+ 有其合理之处。它只是需要回归根本,并且做到绝对专注。记住,产品战略意味着说不。为了更好地理解Google+需要解决的人际问题,应该从极少数的问题着手,甚至只关注一个问题,就像Instagram、Snapchat、WhatsApp,或者 Secret 所做的那样。Google+ 极为复杂,非常难懂。应该去掉一些功能、减少界面中的一些选项,从而降低获得产品核心价值的门槛。最后,也是最重要的,它需要建立在真实世界中已经存在的社交规范和概念模型上。我们在社交软件上的探索才刚刚开始。虽然社会科学的模式已经被界定得很清楚了,但社交产品的形态并没有固定。抄袭竞争对手是没必要的。如果我们仔细而慎重地观察世界,还有很多事情可以去做,通过我们的努力可以让世人的生活变得更好。

2022/12/6
15:50
社区产品从0到1:如何解决内容冷启的问题

社区产品从0到1:如何解决内容冷启的问题

对于UGC社区来说,光有人还不够,冷启动难在没有内容,UGC氛围起不来,人也留不住,那怎么解决这个问题呢? 核心要解决内容供给和内容分发的问题。冷启阶段的内容供给来源于以下4个方面: 1.内容转采,早年的很多内容都是从互联网上爬取。但是随着版权意识的增强,内容爬取也有一定的风险。不过国内UGC生态也基本成熟,可以通过挖掘沉淀在微信、抖音、头条的自媒体,让他们授权后提供内容。虽然这种做法可以迅速达成KPI,但问题在于没有特色,我们还要回答:用户为什么会被吸引过来呢?2.PGC定制化内容,请专业创作者来制作平台独占的专业内容,形成特定的内容消费心智,这种内容制作成本较高,但是PGC的问题在于光有消费,但却没有明确的社区心智。资金投入停了,内容供给也停了,用户也没有东西消费了,最后雁过无痕;3.UGC激励,在最早期运营会扮演用户生产内容带动氛围,这是必要的,但是这个量远远不够的,因此运营会策划活动激励用户生产,但不好的活动机制也可能招致羊毛党的问题,如果一个活动只是拉升了数据,但是破坏了社区的氛围还不如不做,真正的UGC应当是用户自发的;4.KOC(关键意见消费者)/KOL导入,相较于KOL,KOC更接地气对粉丝更有信任感和亲和力,前期导入KOC通常是通过刷脸和邀请码,让他们能邀请自己身边好友深度参与和玩起来。平时给予一些情感激励、物质奖励和流量激励。对于将来也要给他们一定的希望,让他们能够了解到他们在平台的发展前景。在一个规模化的社区中,UGC的内容贡献比大概是1:10:100,也就是说只有1%的用户有意愿生产较为优质的内容,而有10%的人愿意参与到轻量的评论互动,而绝大多数人都是看客。从这个角度看,冷启动阶段的策略应当是优先瞄准“1”和“10”的人群做好UGC,而不是盯着“100”的人群去扩量。有了内容以后,其次就是分发规则,通常分发规则有以下三种:1.关系链分发:根据用户关注的人进行内容的分发是Web2.0时代的主要分发方式。因为每一个人都可以表达自己。比如,微信朋友圈将朋友的新鲜事按照时间轴排序,不用复杂的算法,体验也还不错。但随着微信好友的水化,朋友圈也慢慢变成了微商圈,失去了内容消费价值。为了解决这个问题,微信推出了“看看”和“视频号”,其分发机制是在关系链的基础上再叠加了朋友的行为权重,从而达到千人千面的效果;2.信息流推荐:用无尽内容喂用户,让用户沉浸地刷个不停。算法会综合关注关系、用户互动行为、兴趣标签、搜索词等进行推荐,机器需要海量的内容投喂。但信息流推荐也离不开人工干预,比如,在一些特殊场景,两篇不同内容放在一起就可能产生一些不好的联想。我们很难让AI有价值观,这时候人工运营的优势就有了。但不管怎样,信息流的内容如果供给不上,再好的推荐算法也是无力;3.内容聚合:为了方便用户根据某个主题统一消费,我们会以各种方式将内容打包在。常见的有频道聚合、标签聚合、话题聚合、圈子聚合等,BBS时代的版块就是一种聚合模式。版主有权利给优质的帖子置顶,或者删除低质量的灌水贴。用现代互联网术语叫做频道运营或者内容运营。另外,如今自然语言处理算法也可以将相关性的内容聚合在一起,例如,微博热搜的关键词,一些社会热点都是在微博上面自然爆发的。不管是从Web1.0还是到Web2.0,内容分发好的策略能在保证内容的流动性同时,让好的内容更容易被发现,而坏的分发策略将导致劣币驱逐良币。

2022/11/13
04:38