Anthropic ha annunciato il 29 settembre 2025 Claude Sonnet 4.5, nuova versione della linea Claude descritta come un passo rilevante nelle capacità di coding, nello sviluppo di agenti e nelle attività di “computer use”. L’azienda sottolinea miglioramenti nelle capacità di programmazione, nel ragionamento, nella matematica e nella risoluzione di problemi logici complessi. Con questo rilascio viene presentato un ecosistema arricchito da strumenti che hanno l’obiettivo di rendere il modello più solido e più performante su compiti di lunga durata, tipici sia della programmazione industriale che della gestione operativa di applicazioni e flussi digitali quotidiani. La presentazione si inserisce in una strategia più ampia con cui Anthropic mira a posizionare Claude come una piattaforma di lavoro completa.
Uno dei punti chiave messi in evidenza riguarda i risultati ottenuti nei benchmark pubblici. Claude Sonnet 4.5 è stato indicato come primo in classifica su SWE-bench Verified, un set di prove che misura la capacità dei modelli di risolvere bug reali e di completare attività in repository autentici, non simulati. Secondo i dati diffusi, il modello è in grado di affrontare sequenze di problemi con continuità superiore alle versioni precedenti, mantenendo il contesto anche per oltre trenta ore di lavoro ininterrotto su compiti complessi. Questo dato viene interpretato come indicazione di una tenuta prolungata, condizione necessaria per chi deve gestire progetti che non si esauriscono in pochi passaggi e che richiedono pianificazione e memoria a lungo termine.
Un’attenzione particolare viene rivolta alla capacità di utilizzare direttamente il computer. Nei test OSWorld, che valutano scenari di utilizzo pratico su browser e applicazioni, la versione 4.5 ha raggiunto il 61,4%, un progresso sensibile rispetto al 42,2% segnalato appena quattro mesi prima per Sonnet 4. L’azienda associa questo incremento a dimostrazioni in cui il modello compila fogli di calcolo, esplora siti web, completa moduli e interagisce con sistemi software in modo sequenziale, attività che si avvicinano alle operazioni quotidiane di uffici e reparti tecnici.
Accanto al miglioramento del modello, Anthropic ha introdotto una serie di novità nei suoi strumenti dedicati agli sviluppatori. In Claude Code sono stati integrati i checkpoint, utili per salvare stati intermedi e tornare a versioni precedenti del lavoro in modo rapido, insieme a un terminale rinnovato e a un’estensione dedicata a Visual Studio Code, che amplia l’integrazione con l’ambiente di sviluppo più diffuso. All’interno delle app Claude viene introdotta la possibilità di eseguire direttamente codice e creare file come fogli elettronici, documenti e presentazioni, consentendo di mantenere il flusso operativo all’interno della conversazione senza ricorrere a passaggi esterni. A questo si aggiunge il rilascio dell’estensione Claude for Chrome, resa disponibile per gli utenti Max che erano già in lista d’attesa.
Un altro aspetto rilevante è il rilascio del Claude Agent SDK, pacchetto software pensato per sviluppatori interessati alla costruzione di agenti basati su Claude. Anthropic spiega che questo kit deriva direttamente dall’infrastruttura interna usata per realizzare Claude Code e che raccoglie mesi di lavoro sul coordinamento dei sotto-agenti, sulla gestione della memoria e sul controllo dei permessi. L’intento è quello di ridurre il divario tra fase di prototipo e implementazione operativa, fornendo strumenti già validati in un contesto aziendale. Con questa scelta, l’azienda mira a facilitare l’adozione del modello in progetti su scala più ampia, dal settore dei servizi alla ricerca applicata.
Accanto al modello stabile, viene proposta un’anteprima di ricerca denominata “Imagine with Claude”. Si tratta di una versione sperimentale a disponibilità limitata nel tempo, concepita per mostrare il comportamento del modello in contesti interattivi dinamici. In questa modalità, il software viene generato in tempo reale mentre l’utente interagisce con l’interfaccia, creando un’esperienza più vicina allo sviluppo simultaneo che a una semplice richiesta testuale. L’anteprima è offerta agli abbonati Max per cinque giorni, con l’obiettivo di osservare l’efficacia del modello in ambienti che non seguono flussi predefiniti.
Per quanto riguarda l’integrazione tecnica, Sonnet 4.5 è reso disponibile tramite API con il nome claude-sonnet-4-5. Le tariffe rimangono invariate rispetto alla versione precedente, con 3 dollari per milione di token in input e 15 dollari per milione di token in output. Anthropic invita gli utenti ad adottare la nuova versione, presentandola come sostituzione diretta che non richiede modifiche sostanziali nei flussi di lavoro già implementati. Questa continuità nei costi e nelle modalità di accesso mira a favorire una migrazione rapida e senza ostacoli.

