论文精读|DGenCTR如何通过生成范式超越传统模型

论文精读|DGenCTR如何通过生成范式超越传统模型

Published on Aug 21
9分钟
周六9点半
0:00
0:00
<p><a href="http://arxiv.org/pdf/2508.14500v1">arxiv.org</a>,created by ai</p><p>播客标题: 解锁点击率预测新纪元:DGenCTR如何通过生成范式超越传统模型</p><p>节目描述: 在本期节目中,我们将深入探讨一篇关于点击率(CTR)预测的突破性研究——DGenCTR。为什么传统的CTR模型会遇到性能瓶颈?现有的生成式推荐系统又为何不适用于CTR任务?DGenCTR如何巧妙地结合离散扩散模型和两阶段训练框架,不仅解决了这些难题,还在离线实验和在线A/B测试中取得了显著成效。如果您对推荐系统、深度学习或生成模型感兴趣,这期节目不容错过!</p><p>Shownotes:</p><p>一、引言:点击率预测的重要性与挑战</p><p>• CTR预测的核心作用:作为推荐系统中的核心模块,CTR模型通过整合用户和目标商品信息,预测用户点击商品的概率,进而决定商品的最终排序。它也常用于CPC(每次点击成本)广告系统的定价。</p><p>• 传统判别式CTR模型的局限性:</p><p>◦ 性能瓶颈与天花板:依赖二元行为标签,模型容易过拟合少数高预测性特征,而非学习鲁棒且泛化性强的特征表示。</p><p>◦ 捷径学习与表示崩溃:导致泛化性差、表示崩溃,无法受益于深度学习的“缩放法则”,简单增加模型规模也难以突破性能上限。</p><p>• 现有生成式推荐模型的不足:</p><p>◦ 主要关注序列生成:现有研究大多集中在顺序推荐,将其视为文本生成任务,通过自回归范式生成用户行为序列中的下一个商品。</p><p>◦ 牺牲关键交叉特征:这种方法需要去除目标商品与用户之间的交叉信息,而这些信息对于CTR预测至关重要,去除后会导致性能显著下降。</p><p>二、DGenCTR:为CTR预测量身定制的生成范式</p><p>• 核心理念:样本级生成:</p><p>◦ 不同于传统的商品生成,DGenCTR提出样本级生成范式,专注于生成单个样本内的特征,从而保留了传统CTR模型所需的所有特征信息。</p><p>◦ 此范式能够扩展模型的预测空间,增强对样本分布的建模能力,并有助于探索CTR领域的缩放法则。</p><p>• 为何选择离散扩散模型?:</p><p>◦ CTR样本的输入特征具有排列不变性(改变顺序不影响预测结果)...
论文精读|DGenCTR如何通过生成范式超越传统模型 - 周六9点半 - 播刻岛