首页资讯观点指数品牌活动学徒计划观点会问答关于观点

登录投稿

深度报告研究成果行业视角

博鳌房地产论坛系列活动观点年度论坛观点商业年会观点物业大会观点数字未来发展大会观点资本圆桌观点住房租赁大会
大湾区产业论坛长三角产业论坛西部产业科技大会观点康养大会观点商办暨资管大会观点购物中心暨零售消费峰会观点ESG圆桌城市观点论坛

学徒计划企业课堂 (走进深业上城) 企业课堂 (走进复星星堡中环养老公寓) 企业课堂（走进西安高新区配套公司）企业课堂 (走进华为) 企业课堂 (走进广州万溪) 线上季海外游学

红杉中国正式开源AI基准测试xbench评测集

观点网 •

2025-06-18 09:36

红杉中国6月18日开源AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch，采用动态更新机制和黑白盒评估方法，旨在解决大模型开发中的过拟合问题。该工具将为AI开发者提供长期有效的性能基准支持。

观点网讯：6月18日，红杉中国在中国正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch，旨在服务大模型和AI Agent开发者，避免静态评测集常见的过拟合问题，确保工具长期有效。

该开源举措将基于AI发展动态更新评测集，采用“黑白盒”机制提升模型评估准确性。红杉中国表示，这有助于推动AI技术创新，并为开发者提供可靠基准支持。

免责声明：本文内容与数据由观点根据公开信息整理，不构成投资建议，使用前请核实。

审校：杨晓敏

致信编辑打印

相关话题讨论

我要提问...

全时数据

专栏在线投稿+

杨光华：建议房产央国企 “账期...杨光华

王韶：长途跋涉1400公里，只为“...王韶

夏磊：土地市场的新变化夏磊

蔡记｜探索之旅· 岭南溯源...蔡穗声

冯毅成解读全国两会《政府工作报...冯毅成

你可能感兴趣的话题

关注我们

移动端下载

版权声明：觀點網絡信息科技有限公司及广州观点信息资讯服务有限公司拥有及保留其主办暨承办网站、论坛及活动的所有资料（包括但不限于文字、图片、音频、视频资料及页面设计、编排、软件等）的所有权、版权等其他相关知识产权。除经授权合法使用上述资料外，未征得我司书面许可并付费，任何单位和个人不得以任何理由及方式使用上述资料（包括但不限于转载、转让、授权他人使用等），否则我司将依法追究其法律责任以及赔偿责任。

观点 © 2001- guandian.cn, All Rights Reserved. 粤ICP备20003243号-1 | 网上110 粤公网安备 44010402001235号