色噜噜狠狠狠狠色综合久_岳女在一起双飞_最近最新中文字幕大全_孕妇大肚无码孕交

簡體 English
返回
/
/
/
Grok-3正式發(fā)布!馬斯克:“地球上最聰明的AI”

Grok-3正式發(fā)布!馬斯克:“地球上最聰明的AI”

  • 分類:行業(yè)新聞
  • 作者:
  • 來源:
  • 發(fā)布時(shí)間:2025-02-20 16:48
  • 訪問量:

【概要描述】2月18日午間,馬斯克旗下人工智能公司xAI召開發(fā)布會(huì),正式發(fā)布新一代聊天機(jī)器人Grok-3。此前,馬斯克就在社交平臺(tái)X上發(fā)布預(yù)告,稱Grok-3為“地球上最聰明的AI”。

Grok-3正式發(fā)布!馬斯克:“地球上最聰明的AI”

【概要描述】2月18日午間,馬斯克旗下人工智能公司xAI召開發(fā)布會(huì),正式發(fā)布新一代聊天機(jī)器人Grok-3。此前,馬斯克就在社交平臺(tái)X上發(fā)布預(yù)告,稱Grok-3為“地球上最聰明的AI”。

  • 分類:行業(yè)新聞
  • 作者:
  • 來源:
  • 發(fā)布時(shí)間:2025-02-20 16:48
  • 訪問量:
詳情

北京時(shí)間2月18日午間,馬斯克旗下人工智能公司xAI召開發(fā)布會(huì),正式發(fā)布新一代聊天機(jī)器人Grok-3。

 

此前,馬斯克就在社交平臺(tái)X上發(fā)布預(yù)告,稱Grok-3為“地球上最聰明的AI”。

 

 

 

01
Grok-3發(fā)布現(xiàn)場


在等到12:20分、線上觀看人數(shù)達(dá)到100萬時(shí),直播終于開始,馬斯克也亮相直播間。直播背景上也寫著本次直播的主題“our mission is to understand universe我們的使命是了解整個(gè)宇宙”。

 

 

馬斯克在直播中表示,“Grok”的名字來自海因萊因的小說《異鄉(xiāng)異客》。在書中,“Grok”由一位在火星上長大的角色使用,意指對某事物全面且深刻的理解。

據(jù)xAI團(tuán)隊(duì)介紹,準(zhǔn)確地說,Grok-3是一個(gè)系列,不只是某一個(gè)模型,將發(fā)布多個(gè)子版本。目前Grok-3 mini可以更快地回答問題,但會(huì)犧牲一些準(zhǔn)確性。從今天開始將陸續(xù)推出其他版本。

馬斯克在發(fā)布會(huì)現(xiàn)場表示,“我們認(rèn)為它比Grok-2強(qiáng)大一個(gè)數(shù)量級”。據(jù)悉,Grok-3在很短的時(shí)間內(nèi)超越了上一代Grok-2,且計(jì)算量是前代Grok-2的十倍。

 

 10萬張卡高訓(xùn)練成本 

直播中介紹,Grok-3的訓(xùn)練依托于被稱為“Colossus”的超級計(jì)算集群——位于美國孟菲斯,一個(gè)包含大約 20 萬塊 GPU 的數(shù)據(jù)中心。

在訓(xùn)練過程中,團(tuán)隊(duì)直接使用了10萬塊英偉達(dá)H100 GPU集群進(jìn)行大規(guī)模訓(xùn)練,并克服了散熱、電力等問題帶來的挑戰(zhàn),僅用了122天就建成并完成了第一階段的預(yù)訓(xùn)練。現(xiàn)在他們計(jì)劃將集群規(guī)模繼續(xù)擴(kuò)大,92天增加到20萬塊GPU以維持算力優(yōu)勢。

 

 

Grok-3采用了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合的方法,并引入了“思維鏈”(Chain Of Thought)推理能力,讓其能夠像人類認(rèn)知過程一樣逐步處理復(fù)雜任務(wù)。通過深度學(xué)習(xí),模型能夠從大量數(shù)據(jù)中提取特征和模式。強(qiáng)化學(xué)習(xí)使Grok-3能夠在訓(xùn)練過程中不斷調(diào)整自身的策略,以獲得更高的獎(jiǎng)勵(lì)信號。在推理任務(wù)中,Grok-3通過多次嘗試和驗(yàn)證,不斷優(yōu)化自身的推理路徑,從而找到最優(yōu)解。

 

 Grok-3測試數(shù)據(jù) 

 

為了全面評估Grok-3的性能,xAI團(tuán)隊(duì)在多個(gè)領(lǐng)域進(jìn)行了基準(zhǔn)測試,涵蓋Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三個(gè)方面。

 

測試結(jié)果顯示,Grok-3在三個(gè)領(lǐng)域的表現(xiàn)都很出色。Grok-3 大幅超過 Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet 和GPT-4o。這些被用來對比的模型的性能與 Grok-3 mini 相近。

 

 

 

除了基準(zhǔn)測試,xAI利用大模型競技場Chatbot Arena(LMSYS)平臺(tái),對Grok-3進(jìn)行了盲測。

在本次盲測中,Grok-3的早期版本取得了令人矚目的成績,得分達(dá)到1402分,在所有類別中均排名第一,且分?jǐn)?shù)還在不斷上升,超過了包括DeepSeek-R1在內(nèi)的所有其他模型,也成為有史以來首個(gè)突破1400分的模型。

這證明Grok-3在實(shí)際應(yīng)用中的強(qiáng)大性能,它能夠在復(fù)雜的測試環(huán)境中脫穎而出,為用戶提供高質(zhì)量的答案。

 

 

 

 Grok-3現(xiàn)場演示 

直播中,xAI團(tuán)隊(duì)還進(jìn)行了Grok-3能力現(xiàn)場演示。

如“生成從地球發(fā)射、著陸火星然后在下一個(gè)發(fā)射窗口返回地球的3D動(dòng)圖的代碼。”

 

 

同時(shí),畫面上顯示出了飛船在地球和火星間往返的動(dòng)畫。

 

 

 

再比如“使用 pygame 制作一款混合俄羅斯方塊(Tetris)和寶石迷陣(Bejeweled)的游戲,代碼可以很長,效果要炫酷。”

 

 

在實(shí)際運(yùn)行中,游戲呈現(xiàn)出了創(chuàng)新獨(dú)特的玩法:當(dāng)連接至少三個(gè)相同顏色的方塊時(shí),重力機(jī)制啟動(dòng),方塊消失,其他方塊隨之掉落,類似“寶石迷陣”的消除機(jī)制;同時(shí),游戲也保留了“俄羅斯方塊”的基本元素,但具體的行消除機(jī)制可能存在多種變體,這也為AI開發(fā)游戲奠定了基礎(chǔ)。

 

 

 

總之,從演示來看,Grok-3各項(xiàng)能力都在線的。馬斯克稱,xAI正在籌建一家人工智能游戲工作室,該工作室將專注于為消費(fèi)者提供服務(wù)。

 

 開發(fā)深度搜索 開源Grok-2 

本次發(fā)布,xAI團(tuán)隊(duì)表示正在開發(fā)名為Deepsearch的Grok-3智能搜索引擎。

據(jù)工程師介紹,Deepsearch是一款推理聊天機(jī)器人,能夠闡述其理解查詢內(nèi)容的過程以及規(guī)劃回復(fù)的方式。演示顯示,它具備深入研究、頭腦風(fēng)暴、分析數(shù)據(jù)、生成圖像、編寫和調(diào)試代碼的功能。這將成為其AI智能體的核心能力之一。

 

 

對于Grok-3是否會(huì)開源,馬斯克表示,“我們通常會(huì)在新模型發(fā)布的時(shí)候,開源上一代模型,所以幾個(gè)月后,我們也會(huì)對Grok-2進(jìn)行開源?!?/span>

 訂閱及定價(jià) 

據(jù)介紹,X Premium+的訂閱用戶(每月22美元)將首先獲得使用Grok-3,其他功能則需要訂閱xAI稱之為Super Grok的版本。

Super Grok的價(jià)格為每月30美元或每年300美元,可解鎖更多推理和DeepSearch查詢功能以及無限制圖像生成服務(wù)。馬斯克還透露,未來一周內(nèi)Grok應(yīng)用程序?qū)⒃黾诱Z音模式,幾周后Grok-3模型和DeepSearch功能將進(jìn)入xAI的企業(yè)API。

 

 

 

02
Grok發(fā)布回顧

 

xAI公司成立于2023年7月,專注于大模型開發(fā),公司團(tuán)隊(duì)成員主要來自O(shè)penAI、谷歌DeepMind、微軟研究院和特斯拉等知名企業(yè)。

在成立不到半年,xAI公司便發(fā)布了Grok-1,隨后又在去年8月發(fā)布了Grok-2。

Grok-3的發(fā)布原計(jì)劃是在2024年底,但現(xiàn)實(shí)卻事與愿違。據(jù)業(yè)內(nèi)分析,因xAI團(tuán)隊(duì)規(guī)模相對較小,在人力、資源調(diào)配等方面可能面臨諸多挑戰(zhàn),這在一定程度上拖慢了項(xiàng)目的推進(jìn)速度。而DeepSeek的橫空出世,或許加速了Grok-3的研發(fā),讓它在2025年初亮相。

 

版本

Grok-1

Grok-2

參數(shù)量

3140億參數(shù)(混合專家模型,MoE架構(gòu),每個(gè)token激活25%的權(quán)重)

未明確公布參數(shù)(推測與Grok-1相近或更高),提供輕量化版本Grok-2 mini

核心特點(diǎn)

超大規(guī)模開源模型

強(qiáng)化指令遵循與工具調(diào)用

基于JAX和Rust的自定義訓(xùn)練棧

多模態(tài)支持(集成Flux圖像生成技術(shù))

支持8192 tokens上下文長度

輕量化模型優(yōu)化(Grok-2 mini)

訓(xùn)練數(shù)據(jù)

截至2023年第三季度的互聯(lián)網(wǎng)數(shù)據(jù)+AI合成數(shù)據(jù),未針對任務(wù)微調(diào)

引入更多高質(zhì)量真實(shí)數(shù)據(jù),支持多語言(中英文),結(jié)合實(shí)時(shí)檢索能力

推理能力

HumanEval編碼任務(wù)63.2%

GPQA(科學(xué)問答)和MATH(數(shù)學(xué)競賽)準(zhǔn)確率提升10%-20%

MMLU測試73%

弱于GPT-4

接近或超過GPT-4o

多模態(tài)支持

無(純文本處理)

支持文生圖、視覺處理與多模態(tài)交互(趣味/常規(guī)模式切換)

應(yīng)用場景

通用自然語言處理(問答、信息檢索、創(chuàng)意寫作)

代碼生成與調(diào)試、圖像生成、多語言信息處理、實(shí)時(shí)數(shù)據(jù)整合

開源情況

已開源(Apache 2.0協(xié)議,權(quán)重和架構(gòu)全開放)

尚未開源,但提供企業(yè)API

性能提升

高性能計(jì)算支持

性能顯著提升,推理速度更快

 








 

Grok-3的發(fā)布將加劇全球AI大模型的“軍備競賽”,其技術(shù)突破與生態(tài)布局將推動(dòng)行業(yè)向更高算力投入、更復(fù)雜推理能力及更垂直的應(yīng)用場景發(fā)展。然而,其面臨的挑戰(zhàn)同樣顯著:

  • 商業(yè)化壓力:高昂的算力成本可能限制Grok-3的普及,需通過訂閱制(如SuperGrok)和開源策略平衡投入與回報(bào);

  • 倫理與合規(guī)風(fēng)險(xiǎn):集成社交媒體實(shí)時(shí)數(shù)據(jù)可能加劇信息偏見與濫用問題;

  • 技術(shù)追趕速度:DeepSeek等競爭對手通過低推理成本與開源生態(tài)快速滲透市場,Grok-3需持續(xù)迭代以維持優(yōu)勢。


未來,AI行業(yè)可能呈現(xiàn)“多極競爭”格局,頭部廠商通過技術(shù)差異化(如Grok的推理能力、DeepSeek的成本優(yōu)勢)爭奪市場份額,而中小廠商則聚焦垂直場景的輕量化應(yīng)用。

img

地址:遼寧省大連市金普新區(qū)黃海大道156號 
郵箱:
tgjt@tg-group.cn
熱線:0411-39278599

在線客服
客服熱線
客服熱線
134 7869 1991 134 7869 1991
服務(wù)時(shí)間:
9:00 - 17:00
客服熱線
客服組:
天港數(shù)據(jù)
客服組:
公眾號二維碼

友情鏈接

大連云數(shù)據(jù)科技                    大連大數(shù)據(jù)產(chǎn)業(yè)發(fā)展研究院                           大連德泰控股

COPYRIGHT ? 2021 大連天港科技集團(tuán)有限公司 ALL RIGHT SERVER

遼ICP備20003558號-3  網(wǎng)站建設(shè):中企動(dòng)力  大連