商汤发布日日新5.0大模型 对标GPT-4Turbo

观点网

2024-04-23 15:46

  • 商汤科技于4月23日在北京发布人工智能大模型日日新5.0,采用MOE架构,训练数据超10TB,推理窗口达200K,旨在对标GPT-4Turbo。

    观点网讯:4月23日,商汤科技在中国北京举行新品发布会,正式发布人工智能大模型“日日新5.0”。

    该模型采用了先进的MOE(Mixture of Experts)混合专家架构,并基于超过10TB的数据tokens进行深度学习训练。此外,日日新5.0大模型还拥有高达200K的推理上下文窗口。

    据悉,日日新5.0大模型的开发旨在全面对标OpenAI的GPT-4Turbo。

    审校:徐耀辉



    相关话题讨论



    你可能感兴趣的话题

    大模型

    科技

    AI

    商汤