首页 > 综合 > 综合资讯 >

伊隆马斯克的Grok2 Beta版发布

发布时间:2024-08-16 14:46:47来源:

埃隆·马斯克的 AI 创业公司 xAI 发布了 Grok 2 模型的早期预览版,令人惊讶的是,它的表现甚至超过了Claude、Gemini甚至 ChatGPT。早期的Grok-1.5模型并没有受到好评,但 Grok-2 在 LMSYS 排行榜上表现出色。xAI 发布了两个新模型:Grok-2 和较小的 Grok-2 迷你模型。

xAI 表示,Grok-2 在推理、遵循指令以及提供准确和事实信息等关键领域取得了显著进步。在传统的 AI 基准测试中,Grok-2 在 MMLU 中的得分高达 87.5%,在 HumanEval 中的得分高达 88.4%。这尤其有趣,因为 MMLU 分数是使用 0-shot CoT 得出的。

Grok-2 在 LMSYS 上以“sus-column-r”的名称进行了测试。它获得了约 12,000 票,排名第三,仅次于 ChatGPT-4o-latest、Gemini-1.5-Pro-Experimental 和 GPT-40-2024-05-13。但是,它的表现优于 GPT-4o-mini、Claude 3.5 Sonnet、Gemini 1.5 Pro和Llama 3.1 405B。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。