阿里通义千问发布小尺寸模型Qwen3-4B

观点网 •

2025-08-07 10:17

8月7日，阿里通义千问发布Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507，前者非推理性能超越闭源GPT4.1-Nano，后者推理能力接近30B级模型，已在魔搭社区及HuggingFace开源。

观点网讯：8月7日，中国阿里巴巴集团旗下的通义千问团队正式发布两款4B参数级小尺寸大模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507，并同步在魔搭社区与HuggingFace平台开源。

通义千问官方表示，在非推理任务中，Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano；在推理任务中，Qwen3-4B-Thinking-2507的表现已可媲美中等规模的Qwen3-30B-A3B（thinking）。两款模型均基于2025年7月版本训练，旨在为开发者提供轻量级、高性能的AI解决方案。

免责声明：本文内容与数据由观点根据公开信息整理，不构成投资建议，使用前请核实。

审校：杨晓敏

致信编辑打印

相关话题讨论

我要提问...

全时数据

专栏在线投稿+

王韶：现代化人民城市呼唤“好房...王韶

夏磊：影响土地市场的五大因素夏磊

杨光华：建议房产央国企 “账期...杨光华

蔡记｜探索之旅· 岭南溯源...蔡穗声

冯毅成解读全国两会《政府工作报...冯毅成