520111.COM·(中国)官方网站-IOS/安卓通用版/手机APP下载

520111.COM
官方平台·app·下载·手机版！

520111.COM
这里是我们共同的家园！

520111.COM

🦔来自晋城发布时间:2024年06月16日 11:38520111.COM

520111.COM

🏆⛣🔥

520111.COM

新民晚报讯(记者金志刚)近日，复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。而在高考数学新I卷评测排名中，字节豆包也排在前列。

评测选取2024高考数学新I卷和新II卷的14道客观题，参评“选手”涵盖GPT-4o、文心一言、阿里千问、字节豆包等主流大模型。GPT-4o是OpenAI于今年5月新推出的大语言模型，数学能力是其发布会现场着重展现的能力模块。但结果显示，部分国产大模型在本次数学评测中的成绩优于GPT-4o。在新II卷客观题测试中，字节豆包成绩排在首位，其次是阿里千问和GPT-4o。

今年5月，豆包大模型在火山引擎原动力大会上正式发布。相关数据显示，在MMLU、BBH、GSM8K、HumanEval等11个业界主流的公开评测集上，Doubao-pro-4k的总分为76.8分，优于同期测试的其他国产模型。在数学能力、语言理解能力，以及综合评测集CMMLU和CEval的评测上，豆包也有不错的表现，得分排在前三。

🤕（撰稿：鲍胜仁）

本文来自网友发表，不代表本网站观点和立场，如存在侵权问题，请与本网站联系。未经本平台授权，严禁转载！

展开

打开520111.COM,阅读全文

14人支持

阅读原文阅读 918回复 5

全部评论

默认
最新
楼主

公冶晨星🗄LV0六年级
2楼
加沙南部一装甲车爆炸 8名以军死亡卡桑旅宣称负责🎇
2024/06/16 来自琼海
5回复
👱怀胜旭LV7大学四年级
3楼
中国土豪澳洲买别墅最年轻者24岁与总理当邻居🐔
2024/06/16 来自贵港
6回复
梁义昌♖LV4幼儿园
4楼
“全媒体时代如何坚持正确舆论导向”专题评议会在京举行🎳
2024/06/16 来自江阴
7回复
舒承姬LV7大学三年级
5楼
不结盟运动与“77国集团和中国”：美应将古巴移出“支恐国家”名单☬
2024/06/16 来自台州
7回复
孟逸丹☙🤛LV7大学三年级
6楼
共话中国经济新机遇｜通讯：共聚汉诺威工博会——中德科技经贸合作抓机遇谋共赢🐊
2024/06/16 来自大同
6回复
贡桦艺LV9大学四年级
7楼
房地产金融政策加力优化:政府主导、市场化运作,盘活存量房产📁
2024/06/16 来自长治
赞回复

你的热评

游客

最热圈子

#第十届嘉陵江放牛节即将盛大启幕#
武霞秋
2
#石家庄首轮核酸检测完成疫情尚未出现明显拐点#
上官娣怡
2
#COVAX疫苗分配首现供过于求意大利结束紧急状态｜大流行手记（2月23日）#
葛霞芸
6
#海信激光电视、新风空调等5款产品摘得2020艾普兰奖
曲影坚
8

打“民主牌”谋“独”挑衅注定徒劳
2024/06/16胡山友💣
南方多地为何强对流天气频发？公众如何避灾避险？
2024/06/16司利蝶🦒
三环集团：MLCC产品市场认可度显著提高订单稳步回升
2024/06/16宣全成🧣
国际象棋新老明星双人赛落幕
2024/06/16宋馨妹❟
推动高质量发展·权威发布丨广西已建成36条出省出海出边高速公路通道
2024/06/16屠世厚☙
东作知名品牌御乾堂红木再创佳绩
2024/06/15司马波松♯
各项数据增势喜人中国经济彰显强大韧性和潜力
2024/06/15苗士春🌕
【0527日报】互联网的里程碑正在消失的周一
2024/06/15樊娅彦l
6月来北京已现7次强对流天气，成因和防御要点是啥？
2024/06/14宁顺馥a
印度高温天气持续东部奥迪沙邦至少41人因高温死亡
2024/06/14贾威恒😜

安装应用

随时随地关注520111.COM

安全检测