AI

Claude Fable 5 torna disponibile globalmente dal 1° luglio

Il governo USA ha revocato i controlli su Claude Fable 5: dal 1° luglio torna disponibile globalmente. Ecco cosa era successo e come Anthropic ha risposto.

Il governo degli Stati Uniti ha revocato i controlli all’esportazione applicati ai modelli Claude Fable 5 e Claude Mythos 5, aprendo la strada al ripristino dell’accesso globale. Anthropic ha annunciato che Fable 5 tornerà disponibile a partire dal 1° luglio per gli utenti di tutto il mondo sulla Claude Platform, Claude.ai, Claude Code e Claude Cowork.

La sospensione e il ritorno di Fable 5

Il 12 giugno, il governo statunitense aveva imposto controlli all’esportazione su entrambi i modelli, costringendo Anthropic a sospendere l’accesso a tutti gli utenti. L’ordine era entrato in vigore immediatamente e, non disponendo di un sistema affidabile per verificare la nazionalità in tempo reale, la società aveva scelto di bloccare l’accesso in modo generalizzato.

Con la revoca dei controlli, Fable 5 sarà incluso fino al 50% dei limiti di utilizzo settimanali per i piani Pro, Max, Team e alcune soluzioni Enterprise fino al 7 luglio, dopodiché sarà disponibile tramite crediti d’uso. Anthropic ha comunicato che riattiverà l’accesso anche su AWS, Google Cloud e Microsoft Foundry nel minor tempo possibile.

Per quanto riguarda Mythos 5, l’accesso è stato ripristinato il 26 giugno per un gruppo selezionato di organizzazioni statunitensi, a seguito dell’approvazione governativa. Anthropic sta continuando a coordinarsi con le autorità per estendere l’accesso ai partner del programma Glasswing, sia nazionali che internazionali.

Cosa aveva scatenato i controlli all’esportazione

Fable 5 e Mythos 5 erano stati lanciati il 9 giugno. I due modelli condividono la stessa architettura di base, ma Fable 5 era stato rilasciato con salvaguardie più rigide per l’uso generale, mentre Mythos 5, con meno restrizioni, era stato messo a disposizione solo di un ristretto gruppo di partner fidati nell’ambito del progetto Glasswing, per applicazioni di cybersicurezza difensiva.

La direttiva del 12 giugno era scattata dopo che il governo era venuto a conoscenza di un report in cui i ricercatori di Amazon avevano individuato un metodo per aggirare le salvaguardie di Fable 5: tramite particolari prompt, il modello era stato indotto a identificare alcune vulnerabilità software. In un caso, aveva anche prodotto codice che dimostrava come sfruttare una di quelle vulnerabilità.

Nelle due settimane successive, Anthropic ha collaborato strettamente con il governo e con Amazon per analizzare il report e le prove raccolte. I test condotti hanno rivelato che molti modelli meno avanzati, tra cui Claude Opus 4.8, GPT-5.5 e Kimi K2.7, erano in grado di identificare le stesse vulnerabilità riscontrate da Fable 5. Per quanto riguarda la dimostrazione di sfruttamento della singola vulnerabilità, ogni modello testato ha prodotto risultati analoghi, inclusi Claude Haiku 4.5, Sonnet 4.6, Opus 4.6, Opus 4.7, Opus 4.8, GPT-5.4, GPT-5.5 e Kimi K2.7.

Un nuovo classificatore per bloccare il bypass

Anthropic ha sottolineato che la tecnica segnalata non aveva esposto capacità cyber esclusive di Mythos 5, ma si trattava di un caso limite per le salvaguardie di Fable 5, legato a operazioni di cybersicurezza difensiva di routine. Ciononostante, la società ha agito rapidamente, sviluppando in collaborazione con il governo un classificatore di sicurezza migliorato, progettato per individuare e bloccare il comportamento descritto nel report.

Il nuovo classificatore blocca la tecnica specifica descritta nel report di Amazon in oltre il 99% dei casi. In una frazione minima di casi, il modello potrebbe fornire informazioni non abbastanza dettagliate da rappresentare un aiuto concreto per un potenziale attaccante. Gli utenti verranno avvisati quando una richiesta a Fable 5 viene bloccata, e la stessa sarà reindirizzata a Opus 4.8.

I ricercatori del Center for AI Standards and Innovation (CAISI) del Dipartimento del Commercio degli Stati Uniti hanno testato sia le salvaguardie precedenti che quelle nuove, confermando che entrambe sono di livello straordinariamente elevato.

Il costo delle salvaguardie: più falsi positivi

Anthropic ha riconosciuto che il nuovo classificatore comporta un aumento dei falsi positivi durante attività ordinarie di coding e debugging. La società ha spiegato che, per Fable 5, il margine di sicurezza è stato deliberatamente impostato su un valore molto più ampio rispetto a qualsiasi lancio precedente, accettando consapevolmente la frustrazione degli utenti di fronte a rifiuti su richieste lecite, in cambio di una maggiore disponibilità delle altre funzionalità del modello.

Claude Mythos 5 è in grado di individuare e sfruttare vulnerabilità software in modo più efficace di qualsiasi altro modello e di quasi tutti gli esperti di sicurezza umani, il che lo rende particolarmente attraente per potenziali attori malintenzionati. Fable 5, invece, non offre capacità offensive uniche: il mese precedente al lancio, Anthropic aveva raddoppiato il numero di ricercatori e ingegneri dedicati alla sicurezza, trasferendo personale da vari team interni.

Anthropic ha concluso che continuerà a perfezionare i propri sistemi di sicurezza per distinguere meglio tra usi legittimi e tentativi di abuso, riducendo progressivamente i falsi positivi.

Torna indietro