该模型采用非思考模式,仅激活3B参数即可媲美Gemini 2.5-Flash和GPT-4o等闭源模型性能。目前已开源。
观点网讯:7月30日,阿里通义千问推出新模型Qwen3-30B-A3B-Instruct-2507,以提升AI长文本理解能力至256K,并优化参数效率。
该模型采用非思考模式,仅激活3B参数即可媲美Gemini 2.5-Flash和GPT-4o等闭源模型性能。目前已开源。
另据官方博文披露,Qwen3-30B-A3B-Instruct-2507模型的参数总量为305亿,激活参数为33亿,非嵌入层数量为299亿,网络层数为48层,专家数为128个,激活专家数为8个,上下文长度原生支持262144个tokens。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
审校:劳蓉蓉