4月23日消息,由清华大学基础模型研究中心最新发布的2024年3月版《SuperBench大模型综合能力评测报告》中,共涵盖了14个具有海内外影响力的模型。
在此次评测中,文心4.0的表现令人瞩目,其性能接近国际顶级模型,且与顶尖模型的差距正在逐步缩小,堪称国内领先模型。
清华权威报告:文心一言4.0多项指标遥遥领先
例如,在人类对齐能力的评测中,文心4.0以卓越的表现位居国内首位。
在中文推理和中文语言的评测中,文心4.0遥遥领先,与其他模型相比,差距明显。在中文理解上,文心4.0的领先优势尤其突出,比第二名的GLM-4高出0.41分。
在语义理解的数学能力评测中,文心4.0与Claude-3并列全球第一,而GPT-4系列模型则位列第四和第五,其他模型的得分主要集中在55分左右,显著落后于领先群体。
在阅读理解能力的评测中,文心4.0超越了GPT-4 Turbo、Claude-3以及GLM-4,取得了最高的成绩。
在企业最关注的安全性评测中,文心4.0同样表现出色,力压国际一流的GPT-4系列模型和Claude-3,获得了最高分(89.1分),而Claude-3仅位列第四。
数据还显示,自去年3月16日文心一言首次亮相以来,用户数量已经突破了2亿,每天的API调用量也超过了2亿次。
免责声明:凡本网注明“来源:XXX(非本网)”的作品均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。
据媒体报道,Meta的首席人工智能科学家、深度学习领域的先驱杨立昆(Yann LeCun)近日对...
4月23日消息,由清华大学基础模型研究中心最新发布的2024年3月版《SuperBench大模型综合...
2024年3月19日,2024智能家居UP峰会CSHIA智能家居开年盛典成功举行。小度科技智能生态业...
在举办的第六届世界声博会暨2023科大讯飞全球1024开发者节上,科大讯飞宣布,基于昇腾生态的“飞星...
10月9日消息,目前,国内有多家科技大厂陆续发布自家大模型,被业内看作为AI大模型百“模”大战已经打...
最近,“百模大战”迎来了第一次专业会考,可以看作是各个大模型实力检验的“期中考试”。权威IT市场研究...
本周已有 568 人提交加盟信息
智家网客服中心竭诚为您服务