Sprachmodelle

Sprachmodelle, im Fachjargon Large Language Models (LLM), reichen von offen verfügbaren, selbst betreibbaren Modellen bis zu geschlossenen Frontier-Modellen hinter einer fremden API. Diese Seite ordnet das Feld nach der Entscheidung, die jede Organisation treffen muss, und macht die Abwägung sichtbar, statt ein bestes Modell zu küren.

Modelllandschaft als Grundlage für fundierte Entscheidungen

Ein Sprachmodell ist ein auf grossen Textmengen trainiertes Modell, das aus einer Eingabe den wahrscheinlichsten Anschlusstext erzeugt. Auf dieser Mechanik beruhen Chat-Oberflächen, Code-Assistenten und die Generierung in einer GenAI- und RAG-Architektur. Die praktisch wichtigere Unterscheidung ist nicht, welches Modell heute an der Spitze einer Rangliste steht, sondern unter welchen Bedingungen es betrieben wird. Genau hier verläuft die Trennlinie, die diese Seite ordnet: zwischen Modellen, die ins eigene Haus kommen, und Modellen, die nur über die Schnittstelle eines Anbieters erreichbar sind.

Das Feld ist gross und bewegt sich schnell. Diese Seite kürt deshalb kein bestes Modell, sondern beschreibt die zwei Lager, die Dimensionen, an denen sich eine Wahl entscheidet, und den Vermittler, der beide Wege verbindet. Die einzelnen Modelle sind je auf einer eigenen Seite im Katalog beschrieben und an Ort und Stelle verlinkt.

Zwei Lager: offene Gewichte gegen geschlossene Frontier-Modelle

Das Feld teilt sich entlang einer einzigen, folgenreichen Eigenschaft: ob die trainierten Gewichte eines Modells frei verfügbar sind oder nicht. Die Gewichte sind die beim Training gelernten Zahlenwerte, die das Verhalten eines Modells bestimmen; wer sie hat, kann das Modell selbst betreiben.

Ein Open-Weights-Modell stellt seine trainierten Gewichte zum Herunterladen bereit. Damit lässt es sich auf eigener Hardware ausführen, ohne dass eine Anfrage je das eigene Netz verlässt. Die offene Verfügbarkeit ist nicht zwingend eine vollständig offene Lizenz; beides ist pro Modell zu prüfen. In dieses Lager gehören die Llama-Modelle von Meta, die zum Herunterladen angeboten werden, und die offenen Modelle des europäischen Anbieters Mistral, von denen mehrere unter der Apache-2.0-Lizenz ohne Nutzungsbeschränkung stehen. Offene Gewichte sind die Voraussetzung für eine souveräne KI, bei der das Modell zu den Daten kommt statt umgekehrt.

Ein proprietäres Modell wird ausschliesslich über die API oder Anwendung seines Anbieters betrieben; die Gewichte bleiben unter Verschluss. Wer es nutzt, sendet jede Eingabe an die Infrastruktur des Anbieters. In dieses Lager gehören die GPT-Modelle von OpenAI, Claude von Anthropic und Gemini von Google. Diese geschlossenen Frontier-Modelle führen bei den schwersten Aufgaben weiterhin das Feld an, etwa bei langem Schlussfolgern oder vielsprachigem Code. Die Trennlinie ist nicht ganz scharf: Einzelne Anbieter geschlossener Frontier-Modelle veröffentlichen daneben auch kleinere Modelle mit offenen Gewichten. Massgeblich für die Entscheidung bleibt, ob das konkret gewählte Modell offen oder geschlossen betrieben wird.

flowchart TD
    Q["Anwendungsfall und Daten"]
    Q --> OPEN["Offene Gewichte<br/>selbst betreibbar"]
    Q --> PROP["Proprietär<br/>nur über Anbieter-API"]
    OPEN --> L["Llama, Meta"]
    OPEN --> MI["Mistral, offene Modelle"]
    PROP --> GPT["GPT, OpenAI"]
    PROP --> CL["Claude, Anthropic"]
    PROP --> GE["Gemini, Google"]
    PROP --> GW["Gateway<br/>OpenRouter"]
    GW --> GPT
    GW --> CL
    GW --> GE

Das Diagramm zeigt die Gabelung: Vom Anwendungsfall führt der eine Pfad zu offenen Modellen unter eigener Kontrolle, der andere zu proprietären Modellen hinter einer fremden API, die wahlweise direkt oder gebündelt über ein Gateway erreichbar sind.

Fünf Dimensionen, an denen sich die Wahl entscheidet

Die Wahl zwischen den Lagern fällt nicht abstrakt, sondern entlang von Dimensionen, die je nach Anwendungsfall unterschiedlich schwer wiegen.

Datenhoheit und Kontrolle. Ein selbst betriebenes offenes Modell hält jede Eingabe im eigenen Haus; nichts verlässt das Netz. Eine externe API sendet jede Anfrage zum Anbieter, dessen Geschäftsbedingungen regeln, wie lange Daten gespeichert bleiben und ob sie ins Training einfliessen. Für schützenswerte Daten ist das der entscheidende Unterschied; die organisatorische Steuerung dazu leistet die KI-Governance.
Kostenmodell. Ein selbst betriebenes Modell verursacht feste Kosten für Hardware und Betrieb, unabhängig vom Volumen. Eine API rechnet pro verbrauchtem Token ab, also variabel mit der Nutzung. Bei kleinem Volumen ist die API günstiger, bei hohem kann eigene Hardware die fixen Kosten wieder hereinholen.
Leistung und Fähigkeit. Die stärksten geschlossenen Modelle führen bei den anspruchsvollsten Aufgaben. Offene Modelle haben den Abstand deutlich verkleinert und sind für viele strukturierte, werkzeuggetriebene Aufgaben gut genug. Die Frage ist nicht, welches Modell das beste ist, sondern ob das gewählte für den konkreten Fall ausreicht.
Offenheit und Lizenz. Offene Gewichte erlauben Anpassung, lokales Feinjustieren und Betrieb ohne Abhängigkeit vom Anbieter. Der genaue Spielraum steht in der jeweiligen Lizenz, die pro Modell zu prüfen ist; offen verfügbar und vollständig frei lizenziert sind nicht dasselbe.
Betriebsaufwand. Eine fremde API ist ohne eigenen Betrieb sofort nutzbar. Ein selbst betriebenes Modell will Hardware, Aktualisierung, Überwachung und Absicherung, also eine eigene Betriebsdisziplin. Wer sie unterschätzt, verlagert das Risiko vom Datenschutz auf die Verfügbarkeit.

Gateways bündeln viele Anbieter hinter einer Schnittstelle

Zwischen der direkten Anbindung eines einzelnen Anbieters und dem Selbstbetrieb liegt ein dritter Weg: ein aggregierendes Gateway. Ein solcher Dienst nimmt eine Anfrage entgegen und leitet sie an das gewählte Modell eines vorgelagerten Anbieters weiter. OpenRouter ist das bekannteste Beispiel und macht nach eigener Darstellung mehrere hundert Modelle Dutzender Anbieter über eine gemeinsame, zum OpenAI-SDK kompatible Schnittstelle erreichbar.

Der Nutzen liegt in der Bündelung. Ein einziger Integrationspunkt ersetzt viele direkte Anbindungen, das Routing kann auf das günstigste passende Angebot lenken oder bei einem Ausfall auf einen anderen Anbieter ausweichen, und die Abrechnung läuft anbieterübergreifend über ein gemeinsames Guthaben. Damit sinkt die Abhängigkeit von einem einzelnen Anbieter. Die Grenze des Gateways ist dieselbe wie bei jeder externen API: Die Anfrage verlässt das eigene Haus und geht durch den Vermittler zum Anbieter. Datenhoheit gewinnt man so nicht, wohl aber Flexibilität und einen einzigen Kontrollpunkt für den Zugang zu vielen geschlossenen Modellen.

Kein bestes Modell, sondern ein bester Fit

Die ehrliche Schlussfolgerung des Felds ist, dass es kein durchweg bestes Modell gibt. Die richtige Wahl ergibt sich aus drei Grössen: der Sensibilität der Daten, dem Budget und der geforderten Fähigkeit.

Sind die Daten besonders schützenswert und soll nichts das Haus verlassen, führt der Weg zu einem offenen Modell unter eigener Kontrolle. Offene, selbst betriebene Modelle maximieren Kontrolle und Datenhoheit.
Zählt die höchste Fähigkeit bei unkritischen Daten und ist der Aufwand eigenen Betriebs nicht gewollt, ist ein geschlossenes Frontier-Modell über die API die pragmatischere Wahl. Externe Frontier-Modelle maximieren Fähigkeit.
Wer mehrere geschlossene Modelle flexibel nutzen will, ohne sich an einen Anbieter zu binden, erreicht sie gebündelt über ein Gateway.

In der Praxis ist die Wahl selten ein Entweder-oder für die ganze Organisation. Sensible Anwendungsfälle laufen auf einem offenen Modell im Haus, unkritische auf der stärksten verfügbaren API, und welche Daten auf welchem Modell verarbeitet werden dürfen, regelt die KI-Governance. Die Seite zur souveränen KI vertieft den selbst betriebenen Weg, die einzelnen Katalogseiten beschreiben jedes Modell im Detail.

Referenzen

Artificial Analysis Comparison of AI Models across Intelligence, Performance, Price. Unabhängiger Vergleich vieler Sprachmodelle offener und geschlossener Anbieter nach Qualität, Preis und Geschwindigkeit. (2026). artificialanalysis.ai/models
OpenRouter OpenRouter Quickstart. Dokumentation des aggregierenden Gateways, das über eine Schnittstelle viele Anbieter erreichbar macht. (2026). openrouter.ai/docs/quickstart
Meta The Llama 4 herd. Ankündigung der herunterladbaren Open-Weights-Modelle Llama 4 Scout und Maverick. (05.04.2025). ai.meta.com/blog/llama-4-multimodal-intelligence/
Mistral AI Mistral 7B. Veröffentlichung eines europäischen Open-Weights-Modells unter der Apache-2.0-Lizenz ohne Nutzungsbeschränkung. (27.09.2023). mistral.ai/news/announcing-mistral-7b

KI fragen

Diese Links öffnen externe KI-Dienste, die Unterhaltung und deren Inhalt werden dabei an den jeweiligen Anbieter übertragen.