马斯克xAI推出Grok-1.5大语言模型可处理128k上下文

IT之家今日（3月29日）消息，马斯克旗下人工智能公司xAI今天在官方博客中宣布，正式推出Grok-1.5大语言模型。

Grok-1.5具有改进的推理能力和128k的上下文长度，其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5将在未来几天内在𝕏平台上向早期测试人员和现有的Grok用户推出。

马斯克xAI推出Grok-1.5大语言模型可处理128k上下文

在官方测试中，Grok-1.5在MATH基准上取得了50.6%的成绩，在GSM8K基准上取得了90%的成绩，这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外，它在评估代码生成和解决问题能力的HumanEval基准测试中得分为74.1%。

附测试对比表如下：

马斯克xAI推出Grok-1.5大语言模型可处理128k上下文

长上下文理解方面，Grok-1.5能够在其上下文窗口内处理多达128ktokens的长上下文。这使得Grok的内存容量增加到之前上下文长度的16倍，从而能够理解更长文档中的信息。

马斯克xAI推出Grok-1.5大语言模型可处理128k上下文

据介绍，Grok-1.5构建在基于JAX、Rust和Kubernetes的自定义分布式训练框架之上。自定义训练协调器可确保自动检测到有问题的节点并将其从训练作业中剔除。xAI还优化了检查点、数据加载和训练作业重新启动，以最大限度地减少发生故障时的停机时间。

相关推荐

tomcat用什么语言写的

tomcat是用java语言编写的。java语言面向对象、平台无关，可伸缩、安全，拥有广泛的生态系统，简化了tomcat的开发和部署。 Tomcat 用什么语言写的？ Tomcat 是用 Java 语言编写的。更详细的解释： Tomcat 是 Apache Software Found...
超文本标记语言html的特点

html 是一种创建网页的标记语言，具有以下特点：结构化文档结构格式化文本创建超链接提供交互性跨平台兼容易于学习可扩展性超文本标记语言 (HTML) 的特点超文本标记语言 (HTML) 是一种用于创建网页的标记语言。它使开发人员能够定...
2024 年构建大规模语言模型之旅

2024 年将见证大型语言模型 (llm) 的技术跃升，研究人员和工程师不断突破自然语言处理的界限。这些拥有海量参数的 llm 正在彻底改变我们与机器的交互方式，实现更自然的对话、代码生成和复杂推理。然而，构建这些庞然大物并非易事，...
李彦宏称大模型开源意义不大周鸿祎：别被忽悠了

在近日的一次内部讲话中，百度董事长李彦宏给开源大模型泼了不少冷水。李彦宏认为，大模型开源的意义不大，闭源模型在成本和能力上会持续领先。而对于大模型开源与闭源之争，360集团董事长周鸿祎在哈佛大学的演讲中表示，他...
html属于什么类型语言

html 是一种标记语言，用于定义网页的结构和内容。其特点包括：标记语言、声明式、结构化和超文本。它通过链接组织文档，为搜索引擎提供内容信息，并与 css、javascript 和编程语言的区别在于其功能和目的。 HTML 是什么类型语言？ ...
ruby语言的特点有哪些

ruby 语言的特点：易于学习，具有接近英语的简洁语法。面向对象，以对象方式组织数据和代码。动态类型化，允许变量在运行时更改数据类型。具有元编程功能，使程序员能够操作代码本身。支持块和闭包，提供强大的代码重用和可扩展性。...
pascal语言还有人用吗

尽管过去曾广泛流行，但 pascal 目前已被认为过时，主要使用于教育和爱好项目。虽然它易于学习且模块化，但它缺乏现代功能，且就业市场有限。 Pascal 语言是否仍在使用？ Pascal 是一种历史悠久的编程语言，由尼克劳斯·威尔特于 197...
ruby语言用来干什么

ruby 是一种面向对象的编程语言，广泛用于 web 开发（例如 rails 框架）、脚本和自动化、数据分析和科学计算、移动应用开发以及其他用途，包括游戏开发、机器学习和自然语言处理。 Ruby 语言的用途 Ruby 是一种面向对象的编程语言，...