«L’OpenAI francese». Questa espressione circola sulla stampa economica e nei comitati, e colloca Mistral come sfidante in una corsa in cui OpenAI e Anthropic sarebbero in testa. È una semplificazione comoda. È errata per lo stesso motivo per cui contrapporre OVH ad AWS portava a conclusioni distorte: si mettono sullo stesso piano due entità che non funzionano secondo la stessa logica. Mistral non sta rincorrendo OpenAI. Mistral sta seguendo un’altra strada.
Analizziamo ciò che ciascuno sta costruendo, senza accusare nessuno e senza teatralità.
Ciò che ogni campo sta realmente costruendo
OpenAI e Anthropic stanno sviluppando modelli all’avanguardia. L’obiettivo è la massima capacità, raggiunta grazie alla scala: addestramenti che ammontano a centinaia di milioni di dollari, parchi di calcolo che solo pochi attori al mondo possono mettere insieme, team di ricerca sulla sicurezza dimensionati per una scommessa a lungo termine sull’AGI. Il modello economico segue questa logica. Si raccolgono miliardi, si accettano anni di perdite, si punta innanzitutto al mercato statunitense, dove si trovano riuniti capitale, domanda e infrastrutture energetiche. La redditività immediata non è il criterio. Lo è invece la posizione di leadership all’avanguardia.
Mistral sviluppa modelli efficienti. L’obiettivo non è il record assoluto di capacità, ma il miglior rapporto tra prestazioni, costo e implementabilità. L’architettura lo dimostra: i modelli basati su una combinazione di esperti, in cui solo una frazione dei parametri viene attivata ad ogni richiesta, riducono il costo dell’inferenza senza compromettere la qualità. I pesi aperti di una parte della gamma consentono l’inferenza locale, sull’infrastruttura del cliente, senza ricorrere a un’API remota. Anche il modello economico va in questa direzione: un’API aziendale, implementazioni in loco, contratti in cui il controllo dei costi e la localizzazione dell’elaborazione contano tanto quanto il punteggio in una classifica.
Due infrastrutture, due scommesse. Una presuppone un accesso illimitato alla potenza di calcolo e un mercato che finanzia la corsa sfrenata. L’altra presuppone che sia possibile soddisfare una domanda reale con modelli più piccoli, meglio posizionati e meno costosi da gestire.
Perché il confronto è una trappola
I nomi si assomigliano. Sono aziende di IA, pubblicano modelli, mostrano punteggi sugli stessi benchmark. Da qui nasce il riflesso di allinearle su un’unica scala e di interpretare il divario come un ritardo. Questo riflesso è fuorviante, perché attribuisce a Mistral un obiettivo che non è il suo.
Affermare che Mistral «sta rimanendo indietro» rispetto a OpenAI presuppone che entrambe puntino allo stesso obiettivo. Ma puntare all’avanguardia e puntare all’efficienza non si misurano con lo stesso metro. Un modello che gira su un server aziendale, con un costo di inferenza noto, soggetto alla normativa europea, non perde alcuna gara pur essendo meno potente del modello all’avanguardia del momento. Risponde a un’altra domanda. La classifica in base alla capacità lorda è una classifica tra le tante, non il quadro di riferimento universale.
I mercati differiscono tanto quanto i modelli. OpenAI e Anthropic si rivolgono innanzitutto a un mercato statunitense che paga per la capacità all’avanguardia e tollera la dipendenza da un’API remota. Mistral si rivolge alle organizzazioni europee per le quali il luogo di elaborazione, la normativa applicabile e i costi di inferenza sono vincoli di primaria importanza. Confrontare i due modelli equivale a rimproverare a un treno regionale di non essere all’altezza di un treno a lunga percorrenza. Entrambi trasportano persone, ma non percorrono lo stesso tragitto.
Cosa cambia per la sovranità
La vera domanda in materia di sovranità non è «chi ha il modello più potente». È «di quale livello di IA ho bisogno per il mio utilizzo, e a quali condizioni». La risposta cambia completamente il ragionamento.
Il costo dell’inferenza è il primo punto. Un modello all’avanguardia fatturato per ogni chiamata API trasforma ogni utilizzo in una spesa ricorrente, indicizzata sui prezzi di un fornitore estero. Un modello efficiente implementato sulla propria infrastruttura trasforma questa spesa in un costo operativo controllato. Per un utilizzo su larga scala, la differenza di costo incide molto più di qualche punto di capacità.
La dipendenza dal modello è il secondo punto. Chiamare un’API di frontiera significa affidare il proprio flusso di dati e la continuità del proprio servizio a un operatore che non si controlla, in base a un diritto che non è proprio. Eseguire un modello a pesi aperti in casa propria significa mantenere il calcolo all’interno del proprio perimetro. La questione si ricollega a quella del cloud: ciò che conta non è dove si trovano i dati, ma chi può accedervi e con quali diritti.
La portabilità è il terzo aspetto. I modelli che si possono scaricare, ospitare e modificare si sostituiscono a vicenda senza dover riscrivere tutto da capo. La dipendenza da un’API proprietaria imprigiona nell’ecosistema dell’editore. La reversibilità si verifica solo alla prova di un’effettiva uscita dal sistema e si gioca tanto a livello del modello quanto a quello dell’hosting.
Resta da capire quale livello sia rilevante per quale utilizzo. Un assistente legale che gestisce fascicoli riservati non ha le stesse esigenze di un ricercatore che effettua ricerche sul web. Il primo vuole che l’elaborazione avvenga in un ambiente controllato, anche a costo di sacrificare le massime prestazioni. L’altro vuole la massima capacità disponibile e tollera l’API remota. Identificare correttamente l’uso è la condizione per scegliere il livello giusto.
Cosa può costruire l’Europa
L’Europa sa come costruire in modo efficiente. Mistral lo dimostra: è possibile produrre modelli competitivi con mezzi che non hanno nulla a che vedere con quelli degli attori americani, a condizione di puntare al rapporto costo-prestazioni piuttosto che al record assoluto. È un ambito in cui il ritardo in termini di capitale non preclude l’accesso, perché il vantaggio non si ottiene solo grazie alla potenza di calcolo.
L’Europa non è ancora in grado di costruire la frontiera, e il motivo è strutturale, non una questione di talento. Il modello di frontiera richiede un accesso alla potenza di calcolo, un capitale di rischio e una domanda interna che non esistono allo stesso livello da questa parte dell’Atlantico. È la stessa disparità di terreno che separa un provider nato da un vincolo di bilancio da un’utilità industriale nata da un progetto di potenza. Non si costruisce la stessa cosa con le stesse mani quando il terreno non è lo stesso.
La conclusione non è un’ammissione di sconfitta, ma una messa a punto. Un continente che non possiede ancora i mezzi industriali del modello di frontiera non può affrontare la stessa discussione sulla sovranità di un continente che li possiede. Ma la sovranità dell’IA non si riduce al possesso del modello più potente. Si gioca innanzitutto sulla capacità di soddisfare le proprie esigenze reali con modelli implementabili, controllati in termini di costi e di aspetti legali. Su questo terreno, puntare all’efficienza non significa rassegnarsi a un ruolo secondario. Significa rispondere alla domanda che si pone realmente.
Fonti
- Mistral AI, documentazione dei modelli e architettura a miscela di esperti, mistral.ai
- OpenAI e Anthropic, comunicazioni sulle capacità all’avanguardia e sulla ricerca in materia di sicurezza
- Stanford HAI, AI Index Report, sui costi di addestramento e la scala di calcolo
- Commissione europea, lavori sull’infrastruttura di calcolo e sulla strategia in materia di IA
- Deloitte Insights, prospettive sul cloud computing