模型 · DeepSeek(厂商)

deepseek-ai/DeepSeek-R1-0528

参数 684.5B 总 / ~38.6B 激活架构 DeepseekV3ForCausalLM, deepseek_v3结构 MoE上下文 163.8K

标签

MoE / 稀疏专家 长上下文 163.8K FP8 部署 Code 70B+ 大模型

链接

模型页面 · 打开 LLM Inference Scope