阿里通义千问宣布Qwen3-30B-A3B模型推出新版本

观点网

2025-07-30 08:29

  • 该模型采用非思考模式,仅激活3B参数即可媲美Gemini 2.5-Flash和GPT-4o等闭源模型性能。目前已开源。

    观点网讯:7月30日,阿里通义千问推出新模型Qwen3-30B-A3B-Instruct-2507,以提升AI长文本理解能力至256K,并优化参数效率。

    该模型采用非思考模式,仅激活3B参数即可媲美Gemini 2.5-Flash和GPT-4o等闭源模型性能。目前已开源。

    另据官方博文披露,Qwen3-30B-A3B-Instruct-2507模型的参数总量为305亿,激活参数为33亿,非嵌入层数量为299亿,网络层数为48层,专家数为128个,激活专家数为8个,上下文长度原生支持262144个tokens。

    免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

    审校:劳蓉蓉



    相关话题讨论



    你可能感兴趣的话题

    科技

    AI