Deepseek-vl2

￥0.99/ M Tokens

DeepSeek-VL2 是一个基于 DeepSeekMoE-27B 开发的混合专家（MoE）视觉语言模型，采用稀疏激活的 MoE 架构，在仅激活 4.5B 参数的情况下实现了卓越性能。该模型在视觉问答、光学字符识别、文档/表格/图表理解和视觉定位等多个任务中表现优异，与现有的开源稠密模型和基于 MoE 的模型相比，在使用相同或更少的激活参数的情况下，实现了具有竞争力的或最先进的性能表现

Deepseek-vl2

相关导航

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1:671B

DeepSeek-V3

DeepSeek-V2.5

DeepSeek-R1-Distill-Qwen-7B

相关文章