深度解读Kronos:AI如何“读懂”金融K线,预测市场新范式?

深度解读Kronos:AI如何“读懂”金融K线,预测市场新范式?

Published on Aug 10
9分钟
量化不掉发
0:00
0:00
<blockquote>Kronos :A Foundation Model for the Language of Financial Markets</blockquote><h2>摘要</h2><p>本简报回顾了清华大学研究团队提出的“Kronos”模型,这是一个专门为金融K线(K-line)数据设计的统一、可扩展的预训练框架。Kronos旨在克服现有时间序列基础模型(TSFMs)在金融数据应用中的局限性,特别是在K线数据上表现不佳以及忽视波动率预测和合成数据生成等关键下游任务的问题。</p><h3>核心贡献与创新点</h3><ul> <li><strong>专有分词器和分层表示学习:</strong> Kronos引入了一种专门的分词器,将连续的K线数据离散化为包含粗粒度(coarse)和细粒度(fine)双组分的分层令牌序列。这种设计使得模型能够“显式地对多尺度市场动态进行建模。”每个K线记录(OHLCVA - 开盘价、最高价、最低价、收盘价、交易量、交易金额)都被量化为一个独立的令牌。</li> <li><strong>大规模多市场预训练:</strong> Kronos在一个“来自45个全球交易所的超过120亿条K线记录的大规模多市场语料库上”进行预训练。这一庞大且多样化的数据集是其学习“稳健且可泛化的市场表示”的基础。与现有TSFMs的语料库中金融数据占比极低(通常低于1%)形成鲜明对比,Kronos的训练语料库完全由金融K线数据组成。</li> <li><strong>统一的自回归预训练框架:</strong> 模型采用仅解码器(decoder-only)Transformer架构,通过自回归目标(next-token prediction)顺序预测分层子令牌,从而捕捉“细微的时间和跨资产表示。”这种离散化和生成范式使得Kronos能够“构建市场动态的高保真分层表示。”</li> <li><strong>卓越的性能表现:</strong> Kronos在多项金融任务中展现出卓越的零样本(zero-shot)性能:</li> <li><strong>价格序列预测:</strong> RankIC(排名信息系数)比领先的TSFM提高了93%,比最佳的非预训练基线提高了87%。</li> <li><strong>波动率预测:</strong>...
深度解读Kronos:AI如何“读懂”金融K线,预测市场新范式? - 量化不掉发 - 播刻岛