模型 · 月之暗面 / Kimi(厂商)

moonshotai/Moonlight-16B-A3B

参数 16B 总 / 3B 激活架构 DeepseekV3ForCausalLM, deepseek_v3结构 MoE上下文 8.2K

标签

MoE / 稀疏专家 Code

链接

模型页面 · 打开 LLM Inference Scope