Mistral ist nicht das französische OpenAI

„Das französische OpenAI.“ Dieser Ausdruck macht in der Wirtschaftspresse und in Fachgremien die Runde und stuft Mistral als Herausforderer in einem Wettlauf ein, an dessen Spitze OpenAI und Anthropic stehen sollen. Diese Vereinfachung ist bequem. Sie ist jedoch aus demselben Grund falsch, aus dem auch der Vergleich von OVH mit AWS zu verzerrten Schlussfolgerungen führte: Man stellt zwei Dinge auf eine Stufe, die nicht nach derselben Logik funktionieren. Mistral läuft nicht hinter OpenAI her. Mistral läuft einen anderen Weg.

Schauen wir uns einmal an, was jeder aufbaut, ohne jemandem Vorwürfe zu machen und ohne großes Theater.

Was jede Seite tatsächlich aufbaut

OpenAI und Anthropic entwickeln Modelle auf dem neuesten Stand der Technik. Das Ziel ist maximale Leistungsfähigkeit, die durch Skalierung erreicht wird: Trainings, die Hunderte von Millionen Dollar kosten, Rechenzentren, die nur wenige Akteure weltweit aufbringen können, sowie Sicherheitsforschungsteams, die auf eine langfristige Wette auf die AGI ausgelegt sind. Das Geschäftsmodell folgt dieser Logik. Man sammelt Milliarden ein, nimmt jahrelange Verluste in Kauf und zielt zunächst auf den US-Markt ab, wo Kapital, Nachfrage und Energieinfrastruktur vereint sind. Sofortige Rentabilität ist nicht das Kriterium. Die Spitzenposition an der Grenze ist es.

Mistral entwickelt effiziente Modelle. Das Ziel ist nicht der absolute Kapazitätsrekord, sondern das beste Verhältnis zwischen Leistung, Kosten und Einsatzfähigkeit. Die Architektur verdeutlicht dies: Modelle mit Expert-Mix, bei denen bei jeder Abfrage nur ein Bruchteil der Parameter aktiviert wird, senken die Kosten für die Inferenz, ohne die Qualität zu beeinträchtigen. Die offenen Gewichte eines Teils der Produktpalette ermöglichen eine lokale Inferenz auf der Infrastruktur des Kunden, ohne dass eine Remote-API aufgerufen werden muss. Auch das Geschäftsmodell folgt diesem Ansatz: eine Unternehmens-API, Vor-Ort-Bereitstellungen, Verträge, bei denen Kostenkontrolle und der Ort der Berechnung ebenso wichtig sind wie der Platz in einer Rangliste.

Zwei Infrastrukturen, zwei Strategien. Die eine setzt unbegrenzten Zugang zu Rechenleistung voraus und einen Markt, der die Flucht nach vorn finanziert. Die andere geht davon aus, dass man den tatsächlichen Bedarf mit kleineren, besser positionierten Modellen decken kann, deren Betrieb kostengünstiger ist.

Warum der Vergleich eine Falle ist

Die Namen klingen ähnlich. Es sind KI-Unternehmen, sie veröffentlichen Modelle, sie präsentieren Ergebnisse auf denselben Testbänken. Daher rührt der Reflex, sie auf einer einzigen Skala aneinanderzureihen und den Abstand als Rückstand zu interpretieren. Dieser Reflex ist jedoch irreführend, da er Mistral ein Ziel unterstellt, das nicht das seine ist.

Zu sagen, Mistral „falle“ hinter OpenAI zurück, setzt voraus, dass beide dasselbe Ziel verfolgen. Doch das Streben nach der Leistungsgrenze und das Streben nach Effizienz lassen sich nicht mit demselben Maßstab messen. Ein Modell, das auf einem Unternehmensserver mit bekannten Inferenzkosten und unter europäischem Recht läuft, verliert kein Rennen, nur weil es weniger leistungsfähig ist als das aktuell führende Modell. Es bedient eine andere Nachfrage. Die Rangliste nach Bruttokapazität ist nur eine Rangliste unter vielen, nicht das universelle Maß aller Dinge.

Die Märkte unterscheiden sich ebenso stark wie die Modelle. OpenAI und Anthropic richten sich in erster Linie an einen US-amerikanischen Markt, der für Spitzenkapazität bezahlt und die Abhängigkeit von einer entfernten API in Kauf nimmt. Mistral richtet sich an europäische Organisationen, für die der Ort der Berechnung, das anwendbare Recht und die Kosten für die Inferenz von vorrangiger Bedeutung sind. Die beiden zu vergleichen, wäre so, als würde man einem Regionalzug vorwerfen, dass er nicht mit einem Fernzug mithalten kann. Beide befördern Menschen. Sie legen nur nicht dieselbe Strecke zurück.

Was sich für die Souveränität ändert

Die richtige Frage zur Souveränität lautet nicht: „Wer hat das leistungsstärkste Modell?“, sondern: „Welches KI-Niveau benötige ich für meinen Anwendungszweck und zu welchen Bedingungen?“ Die Antwort verschiebt die gesamte Argumentation.

Die Kosten für die Inferenz sind der erste Punkt. Ein State-of-the-Art-Modell, das pro API-Aufruf abgerechnet wird, verwandelt jede Nutzung in wiederkehrende Kosten, die an die Preise eines ausländischen Anbieters gekoppelt sind. Ein effizientes Modell, das auf der eigenen Infrastruktur bereitgestellt wird, wandelt diese Ausgaben in kontrollierbare Betriebskosten um. Bei einer massenhaften Nutzung wiegt die Differenz bei den Rechnungen schwerer als ein paar Prozentpunkte an Kapazität.

Die Abhängigkeit vom Modell ist der zweite Punkt. Den Aufruf einer Edge-API bedeutet, den eigenen Datenfluss und die Kontinuität des eigenen Dienstes einem Betreiber anzuvertrauen, über den man keine Kontrolle hat, und zwar unter einer Berechtigung, die nicht die eigene ist. Ein Modell mit offenen Gewichten im eigenen Haus zu betreiben bedeutet, die Berechnung innerhalb des eigenen Perimeters zu behalten. Die Frage knüpft an die Cloud an: Entscheidend ist nicht, wo sich die Daten befinden, sondern wer darauf zugreifen darf und unter welchen Rechten.

Die Portabilität ist der dritte Punkt. Modelle, die man herunterladen, hosten und ändern kann, lassen sich gegenseitig ersetzen, ohne dass alles neu geschrieben werden muss. Eine Abhängigkeit von einer proprietären API sperrt einen im Ökosystem des Anbieters ein. Die Reversibilität lässt sich erst bei einem tatsächlichen Ausstieg überprüfen und spielt sowohl auf der Modellebene als auch auf der Hosting-Ebene eine Rolle.

Es bleibt zu klären, welche Ebene für welchen Anwendungszweck entscheidend ist. Ein Rechtsassistent, der vertrauliche Akten bearbeitet, hat andere Anforderungen als ein Rechercheur, der das Internet durchsucht. Der eine will die Berechnung unter kontrollierten rechtlichen Rahmenbedingungen, auch wenn dafür Spitzenkapazität geopfert werden muss. Der andere will die bestmögliche Leistung und nimmt eine entfernte API in Kauf. Die richtige Einordnung des Anwendungszwecks ist die Voraussetzung für die Wahl der richtigen Ebene.

Was Europa aufbauen kann

Effizienz – Europa weiß, wie man sie schafft. Mistral beweist es: Man kann wettbewerbsfähige Modelle mit Mitteln produzieren, die mit denen der amerikanischen Akteure nicht zu vergleichen sind, vorausgesetzt, man zielt eher auf das Preis-Leistungs-Verhältnis als auf den absoluten Rekord ab. Dies ist ein Bereich, in dem der Kapitalrückstand die Tür nicht verschließt, denn der Vorteil wird nicht allein durch die Rechenleistung errungen.

Das „Frontier“-Modell kann Europa noch nicht aufbauen, und der Grund dafür ist struktureller Natur, keine Frage des Talents. Das „Frontier“-Modell erfordert Zugang zu Rechenleistung, Risikokapital und eine Binnennachfrage, die auf dieser Seite des Atlantiks nicht in gleichem Maße vorhanden sind. Es ist dieselbe Ungleichheit der Ausgangsbedingungen, die einen aus Haushaltszwängen entstandenen Hosting-Anbieter von einer aus einem Großprojekt hervorgegangenen industriellen Einrichtung unterscheidet. Man baut nicht dasselbe mit denselben Händen, wenn das Terrain nicht dasselbe ist.

Die Schlussfolgerung ist kein Eingeständnis der Niederlage, sondern eine Einordnung. Ein Kontinent, der noch nicht über die industriellen Mittel des „Frontier“-Modells verfügt, führt nicht dieselbe Debatte über Souveränität wie ein Kontinent, der diese Mittel besitzt. Doch die Souveränität im Bereich der KI lässt sich nicht darauf reduzieren, das leistungsstärkste Modell zu besitzen. Sie zeigt sich in erster Linie in der Fähigkeit, mit einsetzbaren Modellen, deren Kosten und rechtliche Rahmenbedingungen unter Kontrolle sind, den tatsächlichen Anwendungszwecken gerecht zu werden. In diesem Bereich bedeutet das Streben nach Effizienz nicht, sich mit einer Nebenrolle abzufinden. Es bedeutet, die Frage zu beantworten, die sich wirklich stellt.

Quellen

Mistral AI, Dokumentation der Modelle und der Expert-Mix-Architektur, mistral.ai
OpenAI und Anthropic, Mitteilungen zu den Leistungsgrenzen und zur Sicherheitsforschung
Stanford HAI, AI Index Report, zu Trainingskosten und Rechenkapazität
Europäische Kommission, Arbeiten zur Recheninfrastruktur und zur KI-Strategie
Deloitte Insights, Perspektiven zum Cloud-Computing