商汤科技于4月23日在北京发布人工智能大模型日日新5.0,采用MOE架构,训练数据超10TB,推理窗口达200K,旨在对标GPT-4Turbo。
观点网讯:4月23日,商汤科技在中国北京举行新品发布会,正式发布人工智能大模型“日日新5.0”。
该模型采用了先进的MOE(Mixture of Experts)混合专家架构,并基于超过10TB的数据tokens进行深度学习训练。此外,日日新5.0大模型还拥有高达200K的推理上下文窗口。
据悉,日日新5.0大模型的开发旨在全面对标OpenAI的GPT-4Turbo。
审校:徐耀辉