DeepSeek-Prover-V2-671B 使用了更高效的 safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数量6710亿,或为去年发布的Prover-V1.5数学模型升级版本。
中国林业科学研究院资源信息研究所成功研发我国首个林草行业大模型“林龙大模型”,在八大应用场景落地,已用于“三北”工程示范区等,运行稳定,将助力林草行业数字化、智能化转型与高质量发展。
智能体检云平台针对城市体检问题场景,结合多模态智能感知技术实现面向20余类城市问题的识别与分析,通过与大语言模型相结合进行问答,并利用AI生图功能,分析评估发现的空间问题自动化生成直观的设计解决方案。
上海人工智能实验室于4月16日宣布升级并开源通用多模态大模型书生·万象3.0(InternVL3),该模型在专家级基准测试及多模态性能全面测试中表现优异。
4月16日,义乌商城集团宣布接入阿里通义大模型,标志着阿里巴巴与义乌市场合作进入新阶段。此次合作整合阿里巴巴云计算、大数据和电商优势,助力210万中小商家利用AI技术精准经营,快速出海。
4月16日,国家超算互联网平台上线了由上海稀宇科技有限公司研发的MiniMax-Text-01和MiniMax-VL-01大模型。这些模型将利用国家超算互联网的强大算力资源和开放协作生态体系,推动长上下文技术的创新研究与实际应用,提升大模型处理长上下文的能力,促进国产人工智能技术的发展。
4月16日,谷歌DeepMind宣布将Veo2视频生成AI模型整合至GeminiApp应用,并全面开放使用。Veo2能够生成8秒720P电影级视频,具备卓越的运镜、文本语义还原、物理模拟和动作一致性,同时支持图片转视频功能。
4月10日,字节跳动豆包大模型团队宣布开源首个多语言类SWE数据集——Multi-SWE-bench。该数据集旨在评估和提升大模型的“自动修Bug”能力,覆盖了Java、Go、Rust、C、C++、TypeScript和JavaScript等7种主流编程语言。数据来源于GitHub issue,历时近一年构建完成。
4月10日,月之暗面Kimi宣布开源两款轻量级视觉语言模型Kimi-VL和Kimi-VL-Thinking。这两款新模型采用MoE架构,支持128K上下文,激活参数仅约30亿,在多模态推理能力上显著超过10倍大小的大模型。
通过“1+1+N”构建企业数智化能力。第一个“1”,代表1个AI APP;第二个“1”,代表1个Agent的开发平台;第三个“N”,代表的是N个智能体。
4月7日,安徽省量子计算工程研究中心宣布,本源量子与合肥综合性国家科学中心人工智能研究院等机构联合攻关,在第三代自主超导量子计算机“本源悟空”上,成功实现了全球首次运行十亿参数AI大模型微调任务。这一成就标志着中国在量子计算与人工智能融合领域取得重大进展,为未来更复杂的计算任务提供了技术基础。
4月3日,阿里云宣布将于2025年7月2日对大模型服务平台百炼的部分历史模型进行下线处理。自公告发布之日起,阿里云将逐步下调这些模型的限流,直至正式下线。
阿里巴巴计划在4月下旬发布旗舰AI模型升级版Qwen3,这是2025年上半年最重要的产品。此次升级距2024年9月发布的Qwen2.5版本已过去七个月。
4月1日,顺丰同城宣布推进运营数字化和AI决策智能化,建立即时配送大模型基座。通过与DeepSeek、火山豆包、腾讯混元等国内头部厂商合作,顺丰同城实现快速定制化开发,精准匹配客户需求,缩短项目落地周期,持续优化AI应用效果。
绝影的大模型技术也在很多的量产车型上成功落地,比如小米SU七、智己的全系列、还有L380等等的车型,其实都搭载了我们领先的座舱技术和解决方案。
3月20日,中国科学院自动化研究所与武汉人工智能研究院发布紫东太初多模态检索增强生成框架Taichu-mRAG。该框架基于统一多模态细粒度检索引擎和紫东太初大模型,旨在提升内容理解与生成质量,实现对多模态信息的协同感知、精准检索与深度推理问答。