DeepSeek-R1-Distill-Qwen-14B

￥0.7/ M Tokens

DeepSeek-R1-Distill-Qwen-14B 是基于 Qwen2.5-14B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调，展现出优秀的推理能力。在多个基准测试中表现出色，其中在 MATH-500 上达到了 93.9% 的准确率，在 AIME 2024 上达到了 69.7% 的通过率，在 CodeForces 上获得了 1481 的评分，显示出在数学和编程领域的强大实力

DeepSeek-R1-Distill-Qwen-14B

相关导航

DeepSeek-V2.5

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1:671B

DeepSeek-V3-0324

DeepSeek-V3

相关文章