Grok 3 – Az xAI legújabb mesterséges intelligencia modellje

Grok 3 Elon Musk xAI vállalatának legújabb AI modellje, amely 2025 elején jelent meg. Musk „a Föld legokosabb mesterséges intelligenciájaként" hivatkozott rá a bemutatáskor. A modell jelenleg béta fázisban van, és ingyenesen elérhető a szerverkapacitás eléréséig, ezt követően teljes hozzáféréshez előfizetés szükséges.
Változatok és alapvető képességek
A Grok 3 több változatban érhető el:
- Standard változat: Az alapmodell, amely általános feladatokra használható.
- Mini változat: Kisebb erőforrásigényű, költséghatékony verzió STEM feladatokhoz, kevesebb hangsúllyal a világismereten. Az AIME 2024-en 95,8%-os, a LiveCodeBench-en 80,4%-os teljesítményt nyújt.
- Reasoning változat: Speciálisan a logikai és következtetési feladatokra optimalizált verzió, amely képes lépésről lépésre lebontani a döntéshozatali folyamatot és önellenőrzést végezni.
A Grok 3 kiemelkedik a komplex gondolkodási feladatokban, matematikában, kódolásban és világismeretben. Teljesítményét jól mutatják a benchmark eredményei más vezető AI modellekkel összehasonlítva:
Benchmark | Grok 3 Beta | Grok 3 mini Beta | Gemini 2.0 | DeepSeek-V3 | GPT-4o | Claude 3.5 Sonnet |
---|---|---|---|---|---|---|
AIME'24 | 52,2% | 39,7% | — | 39,2% | 9,3% | 16,0% |
GPQA | 75,4% | 66,2% | 64,7% | 59,1% | 53,6% | 65,0% |
LCB | 57,0% | 41,5% | 36,0% | 33,1% | 32,3% | 40,2% |
MMLU-pro | 79,9% | 78,9% | 79,1% | 75,9% | 72,6% | 78,0% |
LOFT (128k) | 83,3% | 83,1% | 75,6% | — | 78,0% | 69,9% |
SimpleQA | 43,6% | 21,7% | 44,3% | 24,9% | 38,2% | 28,4% |
MMMU | 73,2% | 69,4% | 72,7% | — | 69,1% | 70,4% |
EgoSchema | 74,5% | 74,3% | 71,9% | — | 72,2% | — |
A benchmarkok magyarázata:
- AIME'24: Magas szintű matematikai problémák megoldása.
- GPQA: Posztgraduális szintű szakmai kérdések megválaszolása.
- LCB: Valós idejű kódolási képességek mérése.
- MMLU-pro: Széleskörű nyelvi megértés és szakmai tudás mérése.
- LOFT (128k): Hosszú szövegek megértése és feldolgozása 128 ezer tokenes kontextusban.
- SimpleQA: Egyszerű kérdés-válasz teszt, amely a modell általános tudását méri.
- MMMU: Többféle modalitás (szöveg, kép, stb.) együttes megértése.
- EgoSchema: A modell képessége a világ első személyű perspektívából való értelmezésére.
Különösen figyelemre méltó az AIME'24 matematikai versenyen elért 52,2%-os eredmény, amely jelentősen meghaladja a GPT-4o (9,3%) és Claude 3.5 Sonnet (16,0%) teljesítményét. A hosszú kontextuskezelést mérő LOFT benchmarkon is kimagasló eredményt ért el a Grok 3 Beta (83,3%), ami a nagy kontextusablak hatékonyságát bizonyítja. A modell akár 1 millió tokenes kontextusablakot is támogat, ami nyolcszor nagyobb, mint a korábbi modelleké.
A modell a Colossus szuperszámítógépen lett betanítva, amely a világ legnagyobb AI-képzési rendszereként 200.000 GPU-val rendelkezik, és 99%-os üzemidőt biztosít, miközben több mint 80.000 GPU-val futtat feladatokat.
Innovatív funkciók
Grok Chat és Hangmód
A Grok Chat az X (korábban Twitter) platformon integrált chatfelület, amelyen keresztül a felhasználók a Grok modellekkel kommunikálhatnak. Az X Premium+ előfizetők hozzáférhetnek a Grok 3 modellekhez a Grok weboldalon, mobilalkalmazásban és az X felületén is.
A Grok Voice természetes, folyékony párbeszédes interakciót kínál, amely hangalapú kommunikáción keresztül javítja a felhasználói élményt. A szolgáltatás különböző hangmódokat kínál:
- Asszisztens Mód: Basic segítő funkció
- Meditációs Mód
- Romantikus Mód
- Motivációs Mód
- Összeesküvés-elmélet Mód: Összeesküvés elméleteket mesél, és a felhasználó összeesküvés elméleteit sem cáfolja meg.
- Vitatkozó Mód
- Szexuális Mód: Intim vagy erotikus tartalmú interakciókhoz kialakított hangnem.
A Grok Chat egyik jellemzője a cenzúramentesség, amely lehetővé teszi a felhasználók számára, hogy érzékeny vagy ellentmondásos témákról is nyíltan beszélgessenek.
DeepSearch
A DeepSearch egy villámgyors AI-ügynök, amely az igazság keresésére terveztek. Különböző forrásokból szintetizál információkat, átgondolja az ellentmondásokat, és valós idejű híreket, tanácsokat és kutatásokat biztosít. Gyakorlatilag a Grok Chat integrált böngészőként is működik: a kérdés beírása után a modell automatikusan elindítja a keresést, majd a talált cikkek, adatok alapján ad válaszokat forráshivatkozásokkal ellátva.
Think mód

A Think mód lehetővé teszi az AI számára, hogy lépésről lépésre gondolkodjon, javítsa a hibákat, és alternatív megoldásokat keressen. Ez a funkció különösen hasznos a STEM területek kihívást jelentő problémáinak megoldásában. Ilyenkor a modell mintegy "lassabban, de biztosabban" halad, belsőleg végigveszi az érvelést, mielőtt választ generál.
A Think mód használata során a Grok 3 bonyolult problémákat is magabiztosabban old meg, ami versenyelőnyt jelent például matematikai feladványok vagy komplex kódfeladatok esetén, mivel önmagát ellenőrzi és logikailag bontja a problémát.
Big Brain mód
A Grok 3 egy másik különleges üzemmódja a Big Brain, ami további számítási erőforrásokat allokál a modellnek a nagyon összetett, több lépéses feladatokhoz. A modell akár 1 millió tokenes kontextusablakot is támogat, ami nyolcszor nagyobb, mint a korábbi modelleké, lehetővé téve a kiterjedt adatbevitelek hatékony kezelését.
Üzleti példával élve: egy komplex pénzügyi előrejelzés vagy hosszú jogi dokumentum elemzése során érdemes lehet Big Brain módot használni, hogy a modell biztosan minden releváns tényezőt figyelembe vegyen.
Hozzáférés és előfizetési modellek
A Grok 3 jelenleg ingyenesen elérhető, de használati korlátokkal, különösen a nem előfizetők számára. A jobb hozzáférés érdekében az xAI két fő előfizetési lehetőséget kínál:
- X Premium+: Havi 40 dollárba kerül, és megnövelt hozzáférést biztosít a Grok 3-hoz, korai hozzáférést a fejlett funkciókhoz, mint a Voice Mode, és magasabb használati limiteket. Az X-en és a Grok.com-on érhető el, a Premium+ felhasználók hozzáférnek a Think és DeepSearch funkciókhoz.
- SuperGrok: Önálló előfizetés havi 30 dollárért, amely az X Premium+-hoz hasonló előnyöket kínál, de nem igényel X Premium előfizetést. Azoknak a felhasználóknak tervezték, akik az X ökoszisztémától függetlenül szeretnének a Grok 3-mal foglalkozni. Kedvezmények is elérhetők, például 50%-os csökkentés a meglévő Premium+ előfizetőknek és 25% más előfizetőknek.
Jelenlegi állapot és jövőbeli tervek
2025. március 13-án a Grok 3 béta fázisban van, és folyamatosan kerül bevezetésre a felhasználók számára. Az X-en és a Grok.com-on érhető el, az X Premium és Premium+ felhasználók számára folyamatosan válik elérhetővé. Az ingyenes felhasználók korlátozott hozzáféréssel rendelkeznek, míg a Premium+ és SuperGrok előfizetők magasabb limiteket élveznek a funkciókhoz.
A Grok 3, Grok 3 mini és DeepSearch API hamarosan érkezik, vállalati partnerségekkel, amelyek a vállalati konzolon keresztül érhetők el. Az xAI jövőbeli tervei között szerepel a folyamatos képzés a Colossus szuperszámítógépen, amely célja, hogy 1 millió GPU-ra skálázódjon. Gyakori frissítések várhatók, olyan új funkciókkal, mint az eszközhasználat, kódvégrehajtás és fejlett ügynöki képességek.
A DeepSearch és a Think/Big Brain módok kombinációja azt eredményezi, hogy a Grok 3 jóval megbízhatóbb és informatívabb válaszokat ad, mint elődei. Musk állítása szerint a Grok 3 "nagyságrenddel okosabb" lett a Grok 2-höz képest, köszönhetően több mint tízszeres számítási kapacitásnak a betanítás során.
Üzleti szemszögből az X platform integrációja azt is jelenti, hogy a Grok Chat valós idejű közösségi média ismeretekkel bír: nyomon követi az X posztokat, magyarázatokat fűz trending tartalmakhoz, sőt mémeket generál a közönség szórakoztatására. Ez különleges képesség, amivel a Grok a vállalati kommunikációban is használható – például egy marketingcsapat elemezheti a közösségi média visszhangot egy kampányról a Grok segítségével, vagy gyorsan előállíthat friss, trendi tartalmakat.