Questo articolo nasce con un intento preciso: mostrare le potenzialità del modello GPT-5 quando viene impiegato per elaborare studi scientifici di livello dottorato. Il testo non è stato concepito come un contributo originale alla ricerca accademica, bensì come una dimostrazione delle capacità del modello di trattare argomenti complessi, intrecciando matematica, fisica teorica e teoria delle reti neurali. L’obiettivo è verificare fino a che punto GPT-5 riesca a produrre un’analisi rigorosa, completa di formalismi avanzati e riferimenti concettuali, mantenendo al tempo stesso chiarezza espositiva. Per questo motivo l’articolo propone innanzitutto una spiegazione in chiave divulgativa adatta a tutti e, in un secondo momento, mette a disposizione per il download lo studio completo in versione integrale.
Negli ultimi anni i modelli di intelligenza artificiale basati sull’architettura transformer hanno seguito un percorso che si può leggere come un’evoluzione costante. Si tratta di un processo che conserva un nucleo stabile e lo arricchisce con nuove caratteristiche a ogni generazione. Lo studio che introduce l’idea di un “DNA” dei modelli generativi si concentra proprio su questo: individuare quali elementi rimangono invariati quando si passa da una versione all’altra di sistemi come GPT-4, GPT-4o e GPT-5, e come questi elementi permettano di riconoscere una vera linea genealogica all’interno del panorama dell’intelligenza artificiale.
Il cuore dell’analisi è l’identificazione dei tratti che definiscono l’identità profonda di tali modelli. La capacità di prevedere passo dopo passo la sequenza successiva è la base del loro funzionamento e consente di ridurre l’incertezza presente nei dati, comprimendo regolarità in modo strutturato. A sostenere questa funzione è il meccanismo di attenzione multi-strato, che organizza il calcolo e permette di collegare informazioni anche molto distanti. Di particolare rilievo è la semantica distribuzionale: i significati e le relazioni vengono collocati in spazi geometrici latenti, dove le distanze e le direzioni acquistano un valore preciso. A completare il quadro interviene la plasticità del contesto, una caratteristica che consente di mantenere e trasformare informazioni a breve termine, favorendo un ragionamento flessibile e adattabile alle diverse situazioni. Questa combinazione di principi è ciò che rimane stabile attraverso le innovazioni introdotte.
Lo studio non si limita a un’osservazione teorica e propone anche un metodo per misurare la persistenza del nucleo. A questo scopo introduce il Core Heredity Score, un indice costruito a partire da tre grandezze fondamentali: la somiglianza delle attivazioni interne tra modelli di generazioni successive, la capacità di adattarsi a contesti con lunghezze diverse e il vantaggio ottenuto quando il modello sviluppa un ragionamento intermedio. Questi tre aspetti vengono trattati come variabili osservabili, in grado di fornire dati concreti e ripetibili attraverso protocolli sperimentali. L’approccio mira a distinguere ciò che è effettivamente parte di un nucleo ereditario da ciò che invece deriva da aggiustamenti contingenti o da scelte di implementazione.
I risultati attesi evidenziano un punto chiave: la forza dei modelli risiede nell’innovazione introdotta a ogni passo e nella capacità di mantenere una continuità di fondo. L’ampliamento delle finestre di contesto, ad esempio, ha reso più ampio l’orizzonte di calcolo senza sostituire il nucleo. Lo stesso vale per l’integrazione della multimodalità: immagini, suoni e testi vengono proiettati nello stesso spazio vettoriale senza alterare i principi che regolano il funzionamento interno. L’aspetto deliberativo, legato alla possibilità di compiere ragionamenti intermedi, è un’altra prova della solidità del nucleo. Quando viene concesso lo spazio per sviluppare un processo di riflessione intermedio, i modelli dimostrano un vantaggio misurabile nel risolvere compiti complessi e compositivi.
L’interesse di questo studio non si esaurisce nell’ambito tecnico. Da un lato fornisce strumenti per comprendere in modo rigoroso la genealogia dei modelli, distinguendo tra un’evoluzione continua e cambiamenti che indicano la nascita di veri e propri rami distinti. Dall’altro lato apre una riflessione di più ampio respiro sulla natura stessa dell’intelligenza artificiale generativa. Invece di essere considerata come una sequenza di prodotti scollegati, essa viene descritta come una famiglia in trasformazione che conserva tratti comuni nel tempo. Parlare di un “DNA” significa quindi dare forma a una nozione che unisce rigore e chiarezza: i sistemi di oggi, come GPT-5, sono le versioni più avanzate di un progetto che continua ad evolvere, senza perdere il suo impianto originario. Questa prospettiva aiuta a comprendere come i progressi non cancellino ciò che c’era prima e si innestino su una struttura capace di garantire continuità e identità.
