AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

分類：行業(yè)新聞
作者：
來(lái)源：
發(fā)布時(shí)間：2025-02-20 16:46
訪問(wèn)量：

【概要描述】

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

【概要描述】

分類：行業(yè)新聞
作者：
來(lái)源：
發(fā)布時(shí)間：2025-02-20 16:46
訪問(wèn)量：

當(dāng)?shù)貢r(shí)間2月17日晚，馬斯克的新一代AI模型Grok 3及其精簡(jiǎn)版Grok 3 mini在一場(chǎng)備受矚目的發(fā)布會(huì)中震撼亮相。Grok 3以由20萬(wàn)塊GPU組成的超級(jí)計(jì)算機(jī)集群Colossus為強(qiáng)大后盾，在AI競(jìng)技場(chǎng)中一路過(guò)關(guān)斬將，狂破1400分，成功登頂排行榜。早在發(fā)布會(huì)前幾天，馬斯克就在其社交平臺(tái)X上為Grok 3造勢(shì)，稱其為“地球上最聰明的人工智能”。

在AI基準(zhǔn)測(cè)試開(kāi)放平臺(tái)lmarena.ai上，經(jīng)過(guò)約8000次投票后，早期版本的Grok 3（代號(hào)chocolate）在Arena排行榜上一騎絕塵，且在所有分類中均拔得頭籌。在各項(xiàng)能力測(cè)試中，Grok 3的表現(xiàn)堪稱驚艷。在數(shù)學(xué)能力測(cè)試（AIME'24）里，Grok 3斬獲52分，將DeepSeek - V3的39分和GPT-4o的9分遠(yuǎn)遠(yuǎn)拋在身后；科學(xué)知識(shí)評(píng)估（GPQA）中，它以75分的成績(jī)遙遙領(lǐng)先，DeepSeek - V3和GPT-4o分別只有65分和50分；編程能力測(cè)試（LCB Oct - Feb）中，57分的成績(jī)也遠(yuǎn)超DeepSeek - V3的36分和GPT-4o的34分。推理模型比較中，Grok 3 Reasoning Beta也戰(zhàn)勝了OpenAI的o3 - mini、DeepSeek的R1和Gemini - 2 Flash Thinking等推理模型。

發(fā)布會(huì)現(xiàn)場(chǎng)，Grok 3的強(qiáng)大實(shí)力得到了更直觀的展示。當(dāng)被要求生成一段代碼，繪制從地球發(fā)射火箭，降落在火星，然后在下一個(gè)發(fā)射窗口返回地球的三維動(dòng)畫(huà)圖表時(shí)，它迅速完成任務(wù)，生成的動(dòng)畫(huà)經(jīng)研究人員檢查完全正確，大量復(fù)雜數(shù)學(xué)和物理計(jì)算對(duì)它來(lái)說(shuō)似乎輕而易舉。隨后，編寫(xiě)結(jié)合俄羅斯方塊和寶石迷城的游戲，Grok 3也順利完成，展現(xiàn)出強(qiáng)大的編程和邏輯思維能力。

xAI工程師介紹，雖然Grok起步較晚，但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超過(guò)或媲美Gemini、DeepSeek和ChatGPT等對(duì)手。

OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy在親身體驗(yàn)后評(píng)價(jià)道，Grok 3 + Thinking的表現(xiàn)與ChatGPT的某些高級(jí)版本相當(dāng)，略微優(yōu)于DeepSeek R1等模型。然而，在某些特定問(wèn)題上，例如解碼任務(wù)，Grok 3的表現(xiàn)可能不及DeepSeek R1。

另一邊，GPT-4o也悄然更新版本。

OpenAI 放開(kāi)成人內(nèi)容？體驗(yàn)新版 GPT-4o 后，我想再次感謝 DeepSeek

除了在數(shù)學(xué)單項(xiàng)中排名第6外，GPT-4o在創(chuàng)意寫(xiě)作、編程和長(zhǎng)文本查詢等多個(gè)單項(xiàng)上都拿下第一。從網(wǎng)友測(cè)試反饋來(lái)看，新版GPT-4o不僅更“聰明”，而且更具“個(gè)性”，回復(fù)時(shí)的語(yǔ)氣更擬人化，還會(huì)時(shí)不時(shí)使用一些表情包。OpenAI CEO奧特曼評(píng)價(jià)新版GPT-4o相當(dāng)不錯(cuò)，并表示它不久將變得更好，還將其定義為“全網(wǎng)最佳搜索產(chǎn)品”。

在xAI公司的Grok 3取得重大進(jìn)展之時(shí)，AI行業(yè)的其他同行們也在飛速前進(jìn)。2025年，DeepSeek的V3和R1版本引發(fā)了新的行業(yè)浪潮，尤其是R1大模型備受業(yè)內(nèi)贊譽(yù)。R1大模型采用了MOE架構(gòu)（混合專家，Mixture-of-Experts），這一架構(gòu)同樣被應(yīng)用于Grok的初代版本中。在開(kāi)源的大環(huán)境中，各家如何憑借自身的技術(shù)實(shí)力練就卓越的AI“武功”，成為了行業(yè)關(guān)注的焦點(diǎn)。

在DeepSeek-R1模型的沖擊下，不少公司都陸續(xù)放出大招。

2月6日，OpenAI宣布擴(kuò)大ChatGPT搜索功能的用戶范圍，任何人無(wú)需注冊(cè)，就可以使用ChatGPT的搜索功能；同日，谷歌正式推出Gemini 2.0系列模型，包括Flash、Pro及Flash-Lite版本，繼續(xù)提升AI能力，并提供更具性價(jià)比的解決方案。

2月13日，Sam Altman宣布，將很快發(fā)布GPT-5，并且免費(fèi)無(wú)限使用；同日，文心一言官宣將于4月1日0時(shí)起全面免費(fèi)，并且即日起上線深度搜索功能。

AI領(lǐng)域的競(jìng)爭(zhēng)愈發(fā)激烈，在技術(shù)、Agent應(yīng)用競(jìng)速的同時(shí)，大模型廠商的融資也在競(jìng)速。為整個(gè)行業(yè)的發(fā)展注入了新的活力，也讓我們對(duì)AI的未來(lái)充滿了更多的期待與想象。

當(dāng)?shù)貢r(shí)間2月17日晚，馬斯克的新一代AI模型Grok 3及其精簡(jiǎn)版Grok 3 mini在一場(chǎng)備受矚目的發(fā)布會(huì)中震撼亮相。Grok 3以由20萬(wàn)塊GPU組成的超級(jí)計(jì)算機(jī)集群Colossus為強(qiáng)大后盾，在AI競(jìng)技場(chǎng)中一路過(guò)關(guān)斬將，狂破1400分，成功登頂排行榜。早在發(fā)布會(huì)前幾天，馬斯克就在其社交平臺(tái)X上為Grok 3造勢(shì)，稱其為“地球上最聰明的人工智能”。

在AI基準(zhǔn)測(cè)試開(kāi)放平臺(tái)lmarena.ai上，經(jīng)過(guò)約8000次投票后，早期版本的Grok 3（代號(hào)chocolate）在Arena排行榜上一騎絕塵，且在所有分類中均拔得頭籌。在各項(xiàng)能力測(cè)試中，Grok 3的表現(xiàn)堪稱驚艷。在數(shù)學(xué)能力測(cè)試（AIME'24）里，Grok 3斬獲52分，將DeepSeek - V3的39分和GPT-4o的9分遠(yuǎn)遠(yuǎn)拋在身后；科學(xué)知識(shí)評(píng)估（GPQA）中，它以75分的成績(jī)遙遙領(lǐng)先，DeepSeek - V3和GPT-4o分別只有65分和50分；編程能力測(cè)試（LCB Oct - Feb）中，57分的成績(jī)也遠(yuǎn)超DeepSeek - V3的36分和GPT-4o的34分。推理模型比較中，Grok 3 Reasoning Beta也戰(zhàn)勝了OpenAI的o3 - mini、DeepSeek的R1和Gemini - 2 Flash Thinking等推理模型。

發(fā)布會(huì)現(xiàn)場(chǎng)，Grok 3的強(qiáng)大實(shí)力得到了更直觀的展示。當(dāng)被要求生成一段代碼，繪制從地球發(fā)射火箭，降落在火星，然后在下一個(gè)發(fā)射窗口返回地球的三維動(dòng)畫(huà)圖表時(shí)，它迅速完成任務(wù)，生成的動(dòng)畫(huà)經(jīng)研究人員檢查完全正確，大量復(fù)雜數(shù)學(xué)和物理計(jì)算對(duì)它來(lái)說(shuō)似乎輕而易舉。隨后，編寫(xiě)結(jié)合俄羅斯方塊和寶石迷城的游戲，Grok 3也順利完成，展現(xiàn)出強(qiáng)大的編程和邏輯思維能力。

xAI工程師介紹，雖然Grok起步較晚，但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超過(guò)或媲美Gemini、DeepSeek和ChatGPT等對(duì)手。

OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy在親身體驗(yàn)后評(píng)價(jià)道，Grok 3 + Thinking的表現(xiàn)與ChatGPT的某些高級(jí)版本相當(dāng)，略微優(yōu)于DeepSeek R1等模型。然而，在某些特定問(wèn)題上，例如解碼任務(wù)，Grok 3的表現(xiàn)可能不及DeepSeek R1。

另一邊，GPT-4o也悄然更新版本。

除了在數(shù)學(xué)單項(xiàng)中排名第6外，GPT-4o在創(chuàng)意寫(xiě)作、編程和長(zhǎng)文本查詢等多個(gè)單項(xiàng)上都拿下第一。從網(wǎng)友測(cè)試反饋來(lái)看，新版GPT-4o不僅更“聰明”，而且更具“個(gè)性”，回復(fù)時(shí)的語(yǔ)氣更擬人化，還會(huì)時(shí)不時(shí)使用一些表情包。OpenAI CEO奧特曼評(píng)價(jià)新版GPT-4o相當(dāng)不錯(cuò)，并表示它不久將變得更好，還將其定義為“全網(wǎng)最佳搜索產(chǎn)品”。

在xAI公司的Grok 3取得重大進(jìn)展之時(shí)，AI行業(yè)的其他同行們也在飛速前進(jìn)。2025年，DeepSeek的V3和R1版本引發(fā)了新的行業(yè)浪潮，尤其是R1大模型備受業(yè)內(nèi)贊譽(yù)。R1大模型采用了MOE架構(gòu)（混合專家，Mixture-of-Experts），這一架構(gòu)同樣被應(yīng)用于Grok的初代版本中。在開(kāi)源的大環(huán)境中，各家如何憑借自身的技術(shù)實(shí)力練就卓越的AI“武功”，成為了行業(yè)關(guān)注的焦點(diǎn)。

在DeepSeek-R1模型的沖擊下，不少公司都陸續(xù)放出大招。

2月6日，OpenAI宣布擴(kuò)大ChatGPT搜索功能的用戶范圍，任何人無(wú)需注冊(cè)，就可以使用ChatGPT的搜索功能；同日，谷歌正式推出Gemini 2.0系列模型，包括Flash、Pro及Flash-Lite版本，繼續(xù)提升AI能力，并提供更具性價(jià)比的解決方案。

2月13日，Sam Altman宣布，將很快發(fā)布GPT-5，并且免費(fèi)無(wú)限使用；同日，文心一言官宣將于4月1日0時(shí)起全面免費(fèi)，并且即日起上線深度搜索功能。

AI領(lǐng)域的競(jìng)爭(zhēng)愈發(fā)激烈，在技術(shù)、Agent應(yīng)用競(jìng)速的同時(shí)，大模型廠商的融資也在競(jìng)速。為整個(gè)行業(yè)的發(fā)展注入了新的活力，也讓我們對(duì)AI的未來(lái)充滿了更多的期待與想象。

上一個(gè): Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

下一個(gè): 2025年數(shù)據(jù)中心值得關(guān)注的冷卻趨勢(shì)和策略

上一個(gè): Grok-3正式發(fā)布！馬斯克：“地球上最聰明的AI”

下一個(gè): 2025年數(shù)據(jù)中心值得關(guān)注的冷卻趨勢(shì)和策略

色噜噜狠狠狠狠色综合久_岳女在一起双飞_最近最新中文字幕大全_孕妇大肚无码孕交

公司新聞

行業(yè)新聞

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

友情鏈接

色噜噜狠狠狠狠色综合久_岳女在一起双飞_最近最新中文字幕大全_孕妇大肚无码孕交

公司新聞

行業(yè)新聞

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

友情鏈接

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐

AI領(lǐng)域風(fēng)云激蕩：Grok 3、GPT-4與DeepSeek的激烈角逐