模型名称 | 适用场景 | 上下文长度 | 最大输出长度 | 核心特性 | 最大支撑并发数 |
DeepSeek-R1-671B | 复杂逻辑推理、代码生成、数学计算 | 128K tokens | 128K tokens | 输出更详细的思维链过程 | 350 |
DeepSeek-V3-671B | 通用文本生成、多轮对话、内容创作 | 128K tokens | 128K tokens | 高效文本生成,更适合写作 | 100(吞吐较慢(优化中)) |
DeepSeek-R1-32B | 文本生成、多轮对话、知识问答 | 128K tokens | 128K tokens | 支持长文本连贯交互 | 250 |
Qwen3-32B | 多模态任务、通用对话与生成 | 128K tokens | 40K tokens | 支持文本、图像等多模态输入 | 200 |
BGE-M3 | 语义检索功能 | 8K tokens | - | 多语言文本处理,支持稠密/稀疏/多向量检索 | 40 |