全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二
金钱策略师
2024-10-08 23:22:13
0

快科技8月2日消息,根据国内权威大模型评估平台OpenCompass(司南)近日公布的CompassArena周榜,GPT-4o和科大讯飞的星火大模型分别占据了排行榜的前两位。

榜单采用专业用户投票方式,结合了用户对各款大模型的真实体验,更具客观性和说服力,可谓是含金量十足。

全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二

OpenCompass的评测体系涵盖了学科、语言、知识、理解、推理等多个维度,能够全面评估大模型的综合能力。

在最新三期的评选中,讯飞星火以Elo-1078和Elo-1081的高分连续三周位列前三,并两次获得第二,显示出其在大模型领域的强劲竞争力。

全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二

值得注意的是,科大讯飞在今年6月27日发布的星火V4.0版本上,已完成了对GPT-4 Turbo的整体超越。

根据八个国际主流测试集的横向评测,讯飞星火V4.0排名第一,在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面完成了整体超越。

此前,讯飞星火在《麻省理工科技评论》的横评中也获得了高分,凭借领先的语言能力、数学、理综等多项核心能力,斩获国产主流大模型榜首席位。

目前,讯飞星火的安卓端APP累计下载量已超过1.31亿次,位列国内工具类通用大模型APP第一,持续领跑国内大模型第一梯队。

相关内容

全靠用户投票!GPT-4o...
快科技8月2日消息,根据国内权威大模型评估平台OpenCompas...
2024-10-08 23:22:13

热门资讯

多只央企中概股官宣,申请自愿从... 原标题:多只央企中概股官宣,申请自愿从纽交所退市,包括中国石油等8月12日盘后,中国石油天然气股份有...
习近平:着力防范化解金融风险特... 省部级主要领导干部推动金融高质量发展专题研讨班16日上午在中央党校(国家行政学院)开班。中共中央总书...
过年穿这4双靴子+裙子,好看炸... 不管是冬季,还是春季,向来都是靴子的主场,谁让这么一双鞋子既兼顾温度又不失时髦呢?虽然说靴子的搭配套...
科顺股份(300737SZ):... 格隆汇7月22日丨科顺股份(300737)(300737.SZ)公布,公司于近日收到控股股东、实际控...
一场追逐星际的浪漫 一台运行近47年的计算机,在240亿公里之外被修好了,将继续与人类保持联系。这是一场属于星际的浪漫。...
前两月工业利润大增102%,装... 随着宏观组合政策落地显效,市场需求持续恢复,工业生产较快增长,规模以上工业企业效益实现大幅改善。国家...
引入地方国资战投之后,均胜电子... 3月5日,均胜电子(600699.SH)披露了公司重要子公司获得融资的消息。公告显示,宁波国资委通过...
媒体评戴伟浚落选国足:你不是梅... 在伊万科维奇由26人名单精简23人名单中,王振澳、戴伟浚、邓涵文落选了。戴伟浚确实是有拿球能力的球员...
百胜中国(09987HK)公布... 格隆汇8月9日丨百胜中国(09987.HK)公告,截至2024年6月30日止六个月,公司总收入同比增...
1971年陈洁如去世后,蒋介石... 编辑|晨芳前言蒋介石的儿子蒋纬国和蒋兴国可以说是大名鼎鼎,可是蒋介石的女儿蒋瑶光却是少有人知。这个女...