阿里通义千问发布小尺寸模型Qwen3-4B

观点网

2025-08-07 10:17

  • 8月7日,阿里通义千问发布Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,前者非推理性能超越闭源GPT4.1-Nano,后者推理能力接近30B级模型,已在魔搭社区及HuggingFace开源。

    观点网讯:8月7日,中国阿里巴巴集团旗下的通义千问团队正式发布两款4B参数级小尺寸大模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,并同步在魔搭社区与HuggingFace平台开源。

    通义千问官方表示,在非推理任务中,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano;在推理任务中,Qwen3-4B-Thinking-2507的表现已可媲美中等规模的Qwen3-30B-A3B(thinking)。两款模型均基于2025年7月版本训练,旨在为开发者提供轻量级、高性能的AI解决方案。

    免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

    审校:杨晓敏



    相关话题讨论



    你可能感兴趣的话题

    大模型

    科技