Qwen2.5-Coder系列模型 - 大模型论文天天读

这份资料介绍了Qwen2.5-Coder系列模型，这是CodeQwen1.5的重大升级版。该系列包含六种不同大小的模型（0.5B到32B），专门为代码相关任务设计，但同时保留了通用和数学能力。这些模型通过精细的数据清洗、可扩展的合成数据生成以及平衡的数据混合进行预训练，数据量超过5.5万亿个token。评估结果显示，Qwen2.5-Coder在代码生成、补全、推理和修复等十多个基准测试中取得了最先进的性能，甚至超越了同等规模的更大模型。该模型的发布旨在推动代码智能领域的研究，并支持开发者在实际应用中广泛采用。<a href="https://arxiv.org/pdf/2409.12186">arxiv.org</a>