阿里通义千问发布小尺寸模型Qwen3-4B新版本

8月7日,阿里通义千问发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。据通义千问介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越了闭源的GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社区、HuggingFace正式开源。(界面) [原文链接]

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

邮箱:service@doujiju.com

工作时间:周一至周五,9:30-18:30

微信客服