模型 · DeepSeek(厂商)

deepseek-ai/DeepSeek-V4-Flash

参数 158.1B 总 / ~20.4B 激活架构 DeepseekV4ForCausalLM, deepseek_v4结构 MoE上下文 1M

标签

MoE / 稀疏专家 长上下文 1M FP8 部署 70B+ 大模型

链接

模型页面 · 打开 LLM Inference Scope