Qwen2.5-Coder系列模型

Qwen2.5-Coder系列模型

Published on Jul 14
8分钟
大模型论文天天读
0:00
0:00
<p>这份资料介绍了<strong>Qwen2.5-Coder</strong>系列模型,这是<strong>CodeQwen1.5</strong>的重大升级版。该系列包含六种不同大小的模型(0.5B到32B),专门为<strong>代码相关任务</strong>设计,但同时保留了<strong>通用和数学能力</strong>。这些模型通过精细的<strong>数据清洗</strong>、可扩展的<strong>合成数据生成</strong>以及<strong>平衡的数据混合</strong>进行预训练,数据量超过5.5万亿个token。评估结果显示,Qwen2.5-Coder在<strong>代码生成、补全、推理和修复</strong>等十多个基准测试中取得了<strong>最先进的性能</strong>,甚至超越了同等规模的更大模型。该模型的发布旨在推动<strong>代码智能领域的研究</strong>,并支持开发者在实际应用中广泛采用。<a href="https://arxiv.org/pdf/2409.12186">arxiv.org</a></p>