模型名称适用场景上下文长度最大输出长度核心特性最大支撑并发数
DeepSeek-R1-671B复杂逻辑推理、代码生成、数学计算128K tokens128K tokens输出更详细的思维链过程350
DeepSeek-V3-671B通用文本生成、多轮对话、内容创作128K tokens128K tokens高效文本生成,更适合写作100(吞吐较慢(优化中))
DeepSeek-R1-32B文本生成、多轮对话、知识问答128K tokens128K tokens支持长文本连贯交互250
Qwen3-32B多模态任务、通用对话与生成128K tokens40K tokens支持文本、图像等多模态输入200
BGE-M3语义检索功能8K tokens-多语言文本处理,支持稠密/稀疏/多向量检索40