4月10日,字节跳动豆包大模型团队宣布开源首个多语言类SWE数据集——Multi-SWE-bench。该数据集旨在评估和提升大模型的“自动修Bug”能力,覆盖了Java、Go、Rust、C、C++、TypeScript和JavaScript等7种主流编程语言。数据来源于GitHub issue,历时近一年构建完成。
观点网讯:4月10日,字节跳动豆包大模型团队宣布正式开源首个多语言类SWE数据集——Multi-SWE-bench。这一数据集旨在评估和提升大模型的“自动修Bug”能力,标志着在提升编程错误修复方面迈出重要一步。
Multi-SWE-bench基于SWE-bench,首次覆盖了除Python外的7种主流编程语言,包括Java、Go、Rust、C、C++、TypeScript和JavaScript。这为全栈工程师提供了一个全面的评测基准,有助于更准确地测评和提高大模型的高阶编程智能水平。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
审校:武瑾莹