马斯克旗下 xAI 发布 Grok3 推理模型,自称超越 o1、R1

2025-02-18 - admin

文章来源:凤凰网科技





图片来源:由无界AI生成



2月18日,马斯克旗下的xAI发布了大模型Grok 3。





此前,马斯克曾称Grok 3是“地球上最聪明的人工智能”。



在AIME'24数学能力测试中,Grok-3取得了52分,明显高于DeepSeek-V3的39分。在GPQA科学知识评估中,Grok-3以75分的优异成绩领先DeepSeek-V3的65分。此外,在LCB Oct-Feb编程能力测试中,Grok-3也以57分的成绩超越了DeepSeek-V3的36分。





据xAI官方介绍,Grok 3 在训练过程调用了 10 万个 Nvidia H100芯片,较前代产品 Grok 2 使用的 15,000 个 GPU 实现了数倍的跨越式提升。



Grok 3最大的亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。马斯克在发布会上表示,这种推理机制使得Grok 3在逻辑推理测试中的表现远超ChatGPT-5和谷歌的Gemini Ultra,能够构思出新颖的想法和解决方案。



Grok大模型已接入马斯克旗下社交媒体X平台,用户可在X上使用Grok聊天机器人。


- END -

226

僵化、泡沫、危机、破冰

僵化、泡沫、危机、破冰

作者:YBB Capital Researcher Ac-Core与上一轮由宏观经济繁荣推动的牛市不同,本轮加···

比特币牛市困境:宏观不确定性与行业创新停滞的双重夹击

比特币牛市困境:宏观不确定性与行业创新停滞的双重夹击

● 与上一轮由宏观经济繁荣推动的牛市不同,本轮加密市场主要受到宏观经济不确定性影响···

比特币周期理论已死?

比特币周期理论已死?

比特币周期理论,尤其是与比特币减半事件的关联,一直以来被视为预测比特币价格走势的···

BTC 减半驱动的四年周期,失效了吗?

BTC 减半驱动的四年周期,失效了吗?

减半离 BTC 触底和触顶的时间皆为 500 多天,最近 5 次都奏效了。这一规律会在下一次失···

Sam Altman 对谈 a16z 联创:将激进押注基础设施,sora 是重要战略工具

Sam Altman 对谈 a16z 联创:将激进押注基础设施,sora 是重要战略工具

撰文:龙玥 OpenAI正在从一家研究实验室向一个垂直整合的“AI帝国”转型。 10月8日···