模型 · 阿里巴巴 / Qwen(厂商)

Qwen/Qwen3-Coder-480B-A35B-Instruct

参数 480.2B 总 / 35B 激活架构 Qwen3MoeForCausalLM, qwen3_moe结构 MoE上下文 262.1K

标签

MoE / 稀疏专家 长上下文 262.1K Code 70B+ 大模型

链接

模型页面 · 打开 LLM Inference Scope