首页
DeepSeek模型
DeepSeek资讯
DeepSeek-R1-Distill-Qwen-32B
¥1.26/ M Tokens
立即体验
DeepSeek-R1-Distill-Qwen-32B 是基于 Qwen2.5-32B 通过知识蒸馏得到的模型。该模型使用 DeepSeek-R1 生成的 80 万个精选样本进行微调,在数学、编程和推理等多个领域展现出卓越的性能。在 AIME 2024、MATH-500、GPQA Diamond 等多个基准测试中都取得了优异成绩,其中在 MATH-500 上达到了 94.3% 的准确率,展现出强大的数学推理能力
相关导航
DeepSeek-V2.5
¥1.33/ M Tokens
DeepSeek-V3
输入:¥2/ M Tokens;输出:¥8/ M Tokens
DeepSeek-R1-Distill-Qwen-1.5B
免费
DeepSeek-R1-Distill-Qwen-14B
¥0.7/ M Tokens
DeepSeek-R1-Distill-Qwen-7B
免费
DeepSeek-V3-0324
输入:¥2/ M Tokens;输出:¥8/ M Tokens
相关文章
DeepSeek-R1-Distill-Qwen-32B:重新定义智能时代的计算效率与多模态能力
DeepSeek-R1-Distill-Qwen-32B:引领AI新时代的语言理解专家
DeepSeek-R1-Distill-Qwen-32B:智能时代的多维语言伙伴
探索DeepSeek-R1-Distill-Qwen-32B:智能时代的高效伙伴
DeepSeek-R1-Distill-Qwen-32B:智能时代的革命性力量