
0:000:00
<p>大家好,这里是大佳的成长磁场第34期。 </p><p>【AI之外】的最后一期内容,想跟听友朋友们探讨<strong>在“大语言模型”的AI时代,我们怎么高效搜集信息、分辨有效信息、长期应用信息。 </strong></p><p> 本期结合<strong>#AI大神,安德烈·卡帕斯的科普视频</strong>,拆解ChatGPT“大语言模型”一路发展起来的关键步骤、改进措施和迭代过程,跟听众朋友们分享:信息收集、知识库搭建的思考和技巧,<strong>希望DAJA都够探索出更好的“人机结合”模式。共勉! </strong></p><p><strong> </strong> </p><p> ⏰本期时间戳: </p><p>预处理=采集信息+处理信息+形成参数化预测</p><blockquote> 03:33 GPT采集信息的标准:广泛、公开、多元、可表达,并且经过多层过滤</blockquote><blockquote> 06:40 神经网络学习:大数据+概率学,推算出统计意义之下的最优解 </blockquote><p> 后处理=人工训练+场景模拟+输出对话</p><blockquote> 09:31 <strong>AI一本正经的胡说八道,原来叫幻觉性虚假信息</strong></blockquote><blockquote> 12:03 <strong>AI智能体的发展瓶颈,在于问答场景不能穷举</strong></blockquote><blockquote> 13:05 <strong>学会交叉验证,才能发现AI的知道不知道 </strong></blockquote><p> 17:05 打造个人知识库的轻量化步骤 </p><p> </p><p> ⭐本期金句: </p><p>※ <strong>大模型本质上是一场大型的复述行为。 </strong></p><p>※ 信息和知识,都是在不同的历史环境,有不同的成立前提。 </p><p>※ 人工训练的核心目的是让模型学会拆解问题,然后去寻找统计学上最好的回答,并且通过符合人机交流的语言...