
0:000:00
<p><strong>数据,是数字时代的石油。</strong></p><p>根据 IDC 的<a href="https://www.forbes.com/sites/forbestechcouncil/2022/02/03/the-unseen-data-conundrum/?sh=4880bfa87fcc">预测</a>,<strong>到2025年,全球数据总量中将有超过80%的数据是非结构化数据。</strong>向量数据是非结构化数据的抽象数学表达,向量数据库顾名思义就是专门处理向量数据的数据库。</p><p>众所周知,AI 三要素包括:算力、算法和数据。向量数据库作为一种专门用于存储和检索向量数据的数据库系统,是将非结构化数据转化为机器可以理解的语义的关键所在。<strong>随着 AI 尤其是大模型技术的快速发展,向量数据库的价值也愈发凸显了出来。</strong></p><p>红杉美国发布的著名博客<a href="https://www.sequoiacap.com/article/generative-ai-act-two/">《生成式 AI 第二幕(Generative AI’s Act Two)》</a>和 A16Z 发布的<a href="https://a16z.com/emerging-architectures-for-llm-applications/">《LLM 应用的新兴架构(Emerging Architectures for LLM Applications)》</a>两篇文章中一致提到:<strong>向量数据库是重要的生成式人工智能基础设施。</strong>A16Z 甚至认为:<strong>从系统的角度来看,预处理管道中最重要的部分就是向量数据库。</strong></p><p><img src="https://bts-image.xyzcdn.net/aHR0cHM6Ly93ZWFpOXJwZGRlLmZlaXNodS5jbi9zcGFjZS9hcGkvYm94L3N0cmVhbS9kb3dubG9hZC9hc3luY2NvZGUvP2NvZGU9T1dNME1EVmhObUptTlRVNVpqazNPVFZoWXpZME1EQTVaVEU0TURoa01UbGZaRmN5UzI4eFpXbzFZVkp4Wld...