EP97 对话常扬:LLM盛行时代,专门的OCR模型还有意义吗?

EP97 对话常扬:LLM盛行时代,专门的OCR模型还有意义吗?

Published on Mar 25
47分钟
硬地骇客
0:00
0:00
<p>今天特邀文字识别领域专家 常扬 老师做客,他将分享自己多年来在OCR技术领域的经验和心得。常扬老师将比较大型语言模型与专用模型,分析Mistral OCR模型的优缺点,对比CNN和Transformer在OCR任务中的表现。还将分享其团队在信息抽取和RAG技术应用方面的实践经验,以及如何根据不同场景选择合适的OCR模型和技术路线。如果你对人工智能、文字识别或信息抽取技术感兴趣,欢迎收听本期节目。</p><p>更多内容信息和时间线参考下文的硬地笔记,欢迎收听本期节目。</p><h2>嘉宾介绍</h2><p>常扬:专注分享AI人工智能领域技术与洞见。Techlead,复旦AI博士,拥有10+年AI研究经验、国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文,上亿营收AI产品研发负责人。</p><p>公众号:Techlead</p><h2>本期赞助</h2><p><a href="https://podwise.ai/">Podwise.ai - Podcast knowledge at 10x speed 🚀</a></p><p>Apple Store 下载👉🏻 <a href="https://apps.apple.com/cn/app/podwise-ai/id6499190232?l=en-GB">apps.apple.com</a></p><figure><img src="https://image.xyzcdn.net/FuH2kr-H-doEWzfo0ICiKgb6e_8F.png"/></figure><h2>硬地笔记</h2><p>00:00:48 LLM时代,OCR小模型还有用吗?</p><p>00:03:20 大模型与专有模型的区分及Mistral OCR的SOTA争议</p><p>00:06:12 大模型和小模型的合作模式:能力而非算力的协同</p><p>00:08:10 CNN与Transformer,谁在OCR中更胜一筹?</p><p>00:12:20 Transformer在OCR中的“幻觉”究竟是什么?</p><p>00:14:23 CNN-based OCR模型处理复杂排版的策略</p><p>00:17:41 如何通过场景专训提升OCR模型的识别率?</p><p>00:21:18 OCR模型的构建策略:单模型 vs. ...