Skip to content Skip to footer
Contenuto sviluppato con intelligenza artificiale, ideato e revisionato da redattori umani.
···

La presentazione di Grok 4, guidata da Elon Musk insieme ai ricercatori di xAI, ha illustrato con precisione le caratteristiche della nuova generazione del modello linguistico e i miglioramenti rispetto alle versioni precedenti.

Il pre-training ha impiegato un volume di calcolo cento volte superiore rispetto a Grok 2, mentre la fase di reinforcement learning è stata potenziata con un impegno computazionale dieci volte più elevato rispetto a Grok 3. L’infrastruttura utilizzata, denominata Colossus, comprende circa 200.000 GPU. L’integrazione esplicita di strumenti durante l’addestramento, evoluzione del precedente approccio “deep search”, ha rafforzato la capacità del modello di utilizzare risorse esterne in modo efficace e coerente.

Sui test accademici, Grok 4 raggiunge punteggi perfetti nel SAT e risultati quasi perfetti nel GRE in tutte le aree disciplinari, incluse scienze umane, biologia e ingegneria. All’interno del benchmark “Humanity’s Last Exam”, composto da 2.500 problemi a livello di dottorato, Grok 4 Heavy, una versione avanzata con architettura a più agenti collaborativi, ha risolto oltre il 50 % delle domande, mentre gli altri modelli di riferimento rimangono stabilmente sotto il 10 %.

Nel benchmark privato RKGI v2, Grok 4 raggiunge il 15,88 % di accuratezza, posizionandosi nettamente al di sopra di ogni concorrente nei tre mesi precedenti. Lo stesso andamento si osserva nei benchmark GBQA, AIME-25 (con punteggio massimo), Live Coding Bench, HMMT e USAMO, dove il margine rispetto al secondo classificato è rilevante.

La modalità vocale di Grok è stata aggiornata con cinque nuove voci, tra cui “S” e “Eve”, migliorando significativamente la latenza (ridotta della metà) e la qualità prosodica. Secondo quanto riportato, l’utilizzo della modalità vocale è aumentato di dieci volte rispetto alla precedente versione. Le voci sono ora in grado di eseguire risposte ritmiche, canzoni brevi e interazioni vocali naturali senza sovrapposizioni.

In parallelo alla presentazione è stata resa disponibile la nuova API, che include una finestra di contesto da 256.000 token. È stato annunciato che l’accesso verrà gradualmente esteso agli utenti della modalità “Super Grok”. Tra le dimostrazioni applicative mostrate durante la diretta, si segnala il simulatore Vending Bench, in cui Grok 4 ha raddoppiato il patrimonio netto rispetto al record precedente mantenendo strategie coerenti su orizzonti temporali più lunghi.

Presso l’ARC Institute, Grok 4 è stato utilizzato per filtrare milioni di log sperimentali, accelerando la selezione di ipotesi genetiche basate su CRISPR. Il modello ha inoltre ottenuto, secondo valutazioni indipendenti, i migliori risultati nella lettura di radiografie toraciche e viene già testato per applicazioni in ambito finanziario.

Sul fronte evolutivo, è previsto a breve il rilascio di una versione ottimizzata per il coding, con capacità potenziate nella scrittura e interpretazione di codice, con capacità potenziate nella scrittura e interpretazione di codice. Parallelamente, il team di xAI sta lavorando all’addestramento di una nuova versione multimodale, con capacità di interpretazione visiva, supportata da oltre 100.000 GPU GB200, con avvio previsto entro un mese dalla presentazione, di una fase di addestramento video end-to-end, con input e output basati su sequenze di pixel.

Durante la diretta, Musk ha sottolineato che l’obiettivo non è più eccellere nei test accademici, considerati ormai insufficienti, ma dimostrare utilità pratica nel mondo fisico. In quest’ottica, Grok 4 sarà integrato con ambienti di simulazione avanzati (CFD, FEM) e con il robot umanoide Optimus, al fine di validare le proposte generate attraverso criteri fisici e ingegneristici.

Grok 4 si presenta come un modello adatto a sostenere compiti ad alta complessità, capace di affrontare ambienti dinamici e scenari reali, con una roadmap dichiarata che include miglioramenti su codifica, visione e generazione video. La diretta ha confermato l’intento di xAI di posizionare Grok come una delle piattaforme di riferimento nel campo dell’intelligenza artificiale avanzata.

Grok 4 combina architettura multi-agente, strumenti integrati e una modalità vocale evoluta per affrontare compiti di ragionamento a livello avanzato. Ottiene risultati eccellenti nei test accademici, con prestazioni superiori alla media in contesti complessi. Allo stesso tempo, solleva interrogativi su alcuni aspetti tecnici e culturali: la gestione del bias nei contenuti, la sostenibilità computazionale della versione Heavy e il ritardo nell’implementazione delle capacità visive e video. L’apertura verso sviluppatori e utenti è uno dei tratti più evidenti, ma la tenuta complessiva del progetto sarà misurata nei prossimi rilasci.