该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。
观点网讯:9月19日,小米集团宣布开源首个原生端到端语音大模型Xiaomi-MiMo-Audio。该模型采用创新预训练架构,训练数据规模达上亿小时,首次在语音领域实现基于ICL(In-Context Learning)的少样本泛化能力。
据了解,Xiaomi-MiMo-Audio在预训练阶段已观察到明显的“涌现”行为,标志着语音大模型技术取得关键突破。小米表示,此次开源旨在推动语音AI生态发展,降低开发者使用门槛。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
审校:劳蓉蓉