Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

分類：行業(yè)新聞
作者：
來源：
發(fā)布時(shí)間：2025-02-20 16:48
訪問量：

【概要描述】2月18日午間，馬斯克旗下人工智能公司xAI召開發(fā)布會(huì)，正式發(fā)布新一代聊天機(jī)器人Grok-3。此前，馬斯克就在社交平臺(tái)X上發(fā)布預(yù)告，稱Grok-3為“地球上最聰明的AI”。

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

【概要描述】2月18日午間，馬斯克旗下人工智能公司xAI召開發(fā)布會(huì)，正式發(fā)布新一代聊天機(jī)器人Grok-3。此前，馬斯克就在社交平臺(tái)X上發(fā)布預(yù)告，稱Grok-3為“地球上最聰明的AI”。

分類：行業(yè)新聞
作者：
來源：
發(fā)布時(shí)間：2025-02-20 16:48
訪問量：

北京時(shí)間2月18日午間，馬斯克旗下人工智能公司xAI召開發(fā)布會(huì)，正式發(fā)布新一代聊天機(jī)器人Grok-3。

此前，馬斯克就在社交平臺(tái)X上發(fā)布預(yù)告，稱Grok-3為“地球上最聰明的AI”。

01

Grok-3發(fā)布現(xiàn)場

在等到12:20分、線上觀看人數(shù)達(dá)到100萬時(shí)，直播終于開始，馬斯克也亮相直播間。直播背景上也寫著本次直播的主題“our mission is to understand universe我們的使命是了解整個(gè)宇宙”。

馬斯克在直播中表示，“Grok”的名字來自海因萊因的小說《異鄉(xiāng)異客》。在書中，“Grok”由一位在火星上長大的角色使用，意指對某事物全面且深刻的理解。

據(jù)xAI團(tuán)隊(duì)介紹，準(zhǔn)確地說，Grok-3是一個(gè)系列，不只是某一個(gè)模型，將發(fā)布多個(gè)子版本。目前Grok-3 mini可以更快地回答問題，但會(huì)犧牲一些準(zhǔn)確性。從今天開始將陸續(xù)推出其他版本。

馬斯克在發(fā)布會(huì)現(xiàn)場表示，“我們認(rèn)為它比Grok-2強(qiáng)大一個(gè)數(shù)量級”。據(jù)悉，Grok-3在很短的時(shí)間內(nèi)超越了上一代Grok-2，且計(jì)算量是前代Grok-2的十倍。

10萬張卡高訓(xùn)練成本

直播中介紹，Grok-3的訓(xùn)練依托于被稱為“Colossus”的超級計(jì)算集群——位于美國孟菲斯，一個(gè)包含大約 20 萬塊 GPU 的數(shù)據(jù)中心。

在訓(xùn)練過程中，團(tuán)隊(duì)直接使用了10萬塊英偉達(dá)H100 GPU集群進(jìn)行大規(guī)模訓(xùn)練，并克服了散熱、電力等問題帶來的挑戰(zhàn)，僅用了122天就建成并完成了第一階段的預(yù)訓(xùn)練。現(xiàn)在他們計(jì)劃將集群規(guī)模繼續(xù)擴(kuò)大，92天增加到20萬塊GPU以維持算力優(yōu)勢。

Grok-3采用了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合的方法，并引入了“思維鏈”（Chain Of Thought）推理能力，讓其能夠像人類認(rèn)知過程一樣逐步處理復(fù)雜任務(wù)。通過深度學(xué)習(xí)，模型能夠從大量數(shù)據(jù)中提取特征和模式。強(qiáng)化學(xué)習(xí)使Grok-3能夠在訓(xùn)練過程中不斷調(diào)整自身的策略，以獲得更高的獎(jiǎng)勵(lì)信號。在推理任務(wù)中，Grok-3通過多次嘗試和驗(yàn)證，不斷優(yōu)化自身的推理路徑，從而找到最優(yōu)解。

Grok-3測試數(shù)據(jù)

為了全面評估Grok-3的性能，xAI團(tuán)隊(duì)在多個(gè)領(lǐng)域進(jìn)行了基準(zhǔn)測試，涵蓋Math（AIME 24）、Science（GPQA）和 Coding（LCB Oct-Feb）三個(gè)方面。

測試結(jié)果顯示，Grok-3在三個(gè)領(lǐng)域的表現(xiàn)都很出色。Grok-3 大幅超過 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和GPT-4o。這些被用來對比的模型的性能與 Grok-3 mini 相近。

除了基準(zhǔn)測試，xAI利用大模型競技場Chatbot Arena（LMSYS）平臺(tái)，對Grok-3進(jìn)行了盲測。

在本次盲測中，Grok-3的早期版本取得了令人矚目的成績，得分達(dá)到1402分，在所有類別中均排名第一，且分?jǐn)?shù)還在不斷上升，超過了包括DeepSeek-R1在內(nèi)的所有其他模型，也成為有史以來首個(gè)突破1400分的模型。

這證明Grok-3在實(shí)際應(yīng)用中的強(qiáng)大性能，它能夠在復(fù)雜的測試環(huán)境中脫穎而出，為用戶提供高質(zhì)量的答案。

Grok-3現(xiàn)場演示

直播中，xAI團(tuán)隊(duì)還進(jìn)行了Grok-3能力現(xiàn)場演示。

如“生成從地球發(fā)射、著陸火星然后在下一個(gè)發(fā)射窗口返回地球的3D動(dòng)圖的代碼。”

同時(shí)，畫面上顯示出了飛船在地球和火星間往返的動(dòng)畫。

再比如“使用 pygame 制作一款混合俄羅斯方塊（Tetris）和寶石迷陣（Bejeweled）的游戲，代碼可以很長，效果要炫酷。”

在實(shí)際運(yùn)行中，游戲呈現(xiàn)出了創(chuàng)新獨(dú)特的玩法：當(dāng)連接至少三個(gè)相同顏色的方塊時(shí)，重力機(jī)制啟動(dòng)，方塊消失，其他方塊隨之掉落，類似“寶石迷陣”的消除機(jī)制；同時(shí)，游戲也保留了“俄羅斯方塊”的基本元素，但具體的行消除機(jī)制可能存在多種變體，這也為AI開發(fā)游戲奠定了基礎(chǔ)。

總之，從演示來看，Grok-3各項(xiàng)能力都在線的。馬斯克稱，xAI正在籌建一家人工智能游戲工作室，該工作室將專注于為消費(fèi)者提供服務(wù)。

開發(fā)深度搜索開源Grok-2

本次發(fā)布，xAI團(tuán)隊(duì)表示正在開發(fā)名為Deepsearch的Grok-3智能搜索引擎。

據(jù)工程師介紹，Deepsearch是一款推理聊天機(jī)器人，能夠闡述其理解查詢內(nèi)容的過程以及規(guī)劃回復(fù)的方式。演示顯示，它具備深入研究、頭腦風(fēng)暴、分析數(shù)據(jù)、生成圖像、編寫和調(diào)試代碼的功能。這將成為其AI智能體的核心能力之一。

對于Grok-3是否會(huì)開源，馬斯克表示，“我們通常會(huì)在新模型發(fā)布的時(shí)候，開源上一代模型，所以幾個(gè)月后，我們也會(huì)對Grok-2進(jìn)行開源?！?/span>

訂閱及定價(jià)

據(jù)介紹，X Premium+的訂閱用戶（每月22美元）將首先獲得使用Grok-3，其他功能則需要訂閱xAI稱之為Super Grok的版本。

Super Grok的價(jià)格為每月30美元或每年300美元，可解鎖更多推理和DeepSearch查詢功能以及無限制圖像生成服務(wù)。馬斯克還透露，未來一周內(nèi)Grok應(yīng)用程序?qū)⒃黾诱Z音模式，幾周后Grok-3模型和DeepSearch功能將進(jìn)入xAI的企業(yè)API。

02

Grok發(fā)布回顧

xAI公司成立于2023年7月，專注于大模型開發(fā)，公司團(tuán)隊(duì)成員主要來自O(shè)penAI、谷歌DeepMind、微軟研究院和特斯拉等知名企業(yè)。

在成立不到半年，xAI公司便發(fā)布了Grok-1，隨后又在去年8月發(fā)布了Grok-2。

Grok-3的發(fā)布原計(jì)劃是在2024年底，但現(xiàn)實(shí)卻事與愿違。據(jù)業(yè)內(nèi)分析，因xAI團(tuán)隊(duì)規(guī)模相對較小，在人力、資源調(diào)配等方面可能面臨諸多挑戰(zhàn)，這在一定程度上拖慢了項(xiàng)目的推進(jìn)速度。而DeepSeek的橫空出世，或許加速了Grok-3的研發(fā)，讓它在2025年初亮相。

版本	Grok-1	Grok-2
參數(shù)量	3140億參數(shù)（混合專家模型，MoE架構(gòu)，每個(gè)token激活25%的權(quán)重）	未明確公布參數(shù)（推測與Grok-1相近或更高），提供輕量化版本Grok-2 mini
核心特點(diǎn)	超大規(guī)模開源模型	強(qiáng)化指令遵循與工具調(diào)用
	基于JAX和Rust的自定義訓(xùn)練棧	多模態(tài)支持（集成Flux圖像生成技術(shù)）
	支持8192 tokens上下文長度	輕量化模型優(yōu)化（Grok-2 mini）
訓(xùn)練數(shù)據(jù)	截至2023年第三季度的互聯(lián)網(wǎng)數(shù)據(jù)+AI合成數(shù)據(jù)，未針對任務(wù)微調(diào)	引入更多高質(zhì)量真實(shí)數(shù)據(jù)，支持多語言（中英文），結(jié)合實(shí)時(shí)檢索能力
推理能力	HumanEval編碼任務(wù)63.2%	GPQA（科學(xué)問答）和MATH（數(shù)學(xué)競賽）準(zhǔn)確率提升10%-20%
	MMLU測試73%	GPQA（科學(xué)問答）和MATH（數(shù)學(xué)競賽）準(zhǔn)確率提升10%-20%
	弱于GPT-4	接近或超過GPT-4o
多模態(tài)支持	無（純文本處理）	支持文生圖、視覺處理與多模態(tài)交互（趣味/常規(guī)模式切換）
應(yīng)用場景	通用自然語言處理（問答、信息檢索、創(chuàng)意寫作）	代碼生成與調(diào)試、圖像生成、多語言信息處理、實(shí)時(shí)數(shù)據(jù)整合
開源情況	已開源（Apache 2.0協(xié)議，權(quán)重和架構(gòu)全開放）	尚未開源，但提供企業(yè)API
性能提升	高性能計(jì)算支持	性能顯著提升，推理速度更快

Grok-3的發(fā)布將加劇全球AI大模型的“軍備競賽”，其技術(shù)突破與生態(tài)布局將推動(dòng)行業(yè)向更高算力投入、更復(fù)雜推理能力及更垂直的應(yīng)用場景發(fā)展。然而，其面臨的挑戰(zhàn)同樣顯著：

商業(yè)化壓力：高昂的算力成本可能限制Grok-3的普及，需通過訂閱制（如SuperGrok）和開源策略平衡投入與回報(bào)；
倫理與合規(guī)風(fēng)險(xiǎn)：集成社交媒體實(shí)時(shí)數(shù)據(jù)可能加劇信息偏見與濫用問題；
技術(shù)追趕速度：DeepSeek等競爭對手通過低推理成本與開源生態(tài)快速滲透市場，Grok-3需持續(xù)迭代以維持優(yōu)勢。

未來，AI行業(yè)可能呈現(xiàn)“多極競爭”格局，頭部廠商通過技術(shù)差異化（如Grok的推理能力、DeepSeek的成本優(yōu)勢）爭奪市場份額，而中小廠商則聚焦垂直場景的輕量化應(yīng)用。

上一個(gè): 2024年中國智能算力增長74.1%

下一個(gè): AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

上一個(gè): 2024年中國智能算力增長74.1%

下一個(gè): AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

色噜噜狠狠狠狠色综合久_岳女在一起双飞_最近最新中文字幕大全_孕妇大肚无码孕交

公司新聞

行業(yè)新聞

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

友情鏈接

色噜噜狠狠狠狠色综合久_岳女在一起双飞_最近最新中文字幕大全_孕妇大肚无码孕交

公司新聞

行業(yè)新聞

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

友情鏈接

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”