马斯克发布Grok-1.5，强化推理和上下文，HumanEval得分超GPT-4

AI资讯 6小时前 0

▼

马斯克发布Grok-1.5，强化推理和上下文，HumanEval得分超GPT-4

AI资源网最新消息，继开源 Grok-1 后，xAI 刚刚官方发布了他们的最新模型 Grok-1.5。

据介绍，Grok-1.5 能够进行长语境理解和高级推理，并将于近日在 xAI 平台上向早期测试者和现有 Grok 用户开放。

Grok-1.5 最显着的改进之一是其在编码和数学相关任务中的表现。在给出的测试结果中，Grok-1.5 在 MATH 基准测试中取得了 50.6% 的得分，在 GSM8K 基准测试中取得了 90% 的得分。此外，在评估代码生成和解决问题能力的 HumanEval 基准测试中，Grok-1.5 获得了 74.1% 的高分，超过了 GPT-4。

马斯克发布Grok-1.5，强化推理和上下文，HumanEval得分超GPT-4 AI资讯图2张

另外，Grok-1.5 的一项新功能是在上下文窗口中处理多达 128K 字节的长上下文。这使得 Grok 的内存容量增加到以前上下文长度的 16 倍，从而能够利用更长文档中的信息。

此外，Grok-1.5 还能够处理更长、更复杂的提示，同时随着上下文窗口的扩大，仍能保持其指令跟随能力。在 NIAH（Needle In A Haystack）评估中，Grok-1.5 展示了强大的检索能力，可检索长度达 128K 字节的上下文中的嵌入文本，并取得了完美的检索结果。

马斯克发布Grok-1.5，强化推理和上下文，HumanEval得分超GPT-4 AI资讯图3张

xAI 官方还表示，随着 Grok-1.5 逐步向更广泛的用户推出，未来几天也会推出几项新功能。

详情链接：https://x.ai/blog/grok-1.5

▼

特别声明本页内容仅供参考，版权终归原著者所有，若有侵权，请联系我们删除。

相关文章