Llama

Llama ist die offene Sprachmodell-Familie von Meta mit frei herunterladbaren Gewichten unter einer eigenen Community-Lizenz. Die Modelle lassen sich auf eigener Infrastruktur betreiben und eignen sich damit als datenresidentes, internes Sprachmodell. Llama ist nicht Open Source im strengen Sinn, sondern offen mit Auflagen.

Offene Gewichte als Fundament interner Sprachmodelle

Ein Modell hinter einer gehosteten Cloud-API ist bequem, bindet die Daten und den Rechtsweg aber an einen fremden Anbieter. Llama besetzt die Gegenposition: eine Familie grosser Sprachmodelle, deren Gewichte sich herunterladen und auf eigener Hardware ausführen lassen. Diese Seite ordnet ein, was Llama umfasst, wo die Lizenz-Grenze verläuft und worauf bei den Modellgrössen zu achten ist.

Anbieter und Herkunft

Llama wird von Meta entwickelt, dem US-Konzern hinter Facebook, Instagram und WhatsApp. Die erste Generation erschien Anfang 2023, seither folgte ein schneller Versionstakt. Anders als bei einem reinen API-Produkt veröffentlicht Meta die Modellgewichte zum Download, sodass der Betrieb ohne laufende Verbindung zu Meta möglich ist. Genau dieser Eigenbetrieb ist der Grund, weshalb Llama in souveränen Architekturen eine Rolle spielt, obwohl der Anbieter ein US-Konzern ist: Nach dem Download läuft das Modell auf der eigenen Infrastruktur, und die Anfragen verlassen die eigene Grenze nicht.

Die Modell-Familie und die Modellgrössen

Llama ist keine einzelne Datei, sondern eine über mehrere Generationen gewachsene Familie. Die Grösse eines Modells, gemessen in Parametern, bestimmt massgeblich seinen Hardware-Bedarf und seine Fähigkeiten.

Generationen. Auf Llama 1 und Llama 2 (beide 2023) folgten 2024 die Versionen Llama 3, 3.1, 3.2 und 3.3. Im April 2025 erschien Llama 4. Ältere Generationen gelten teils als abgelöst; massgeblich ist die jeweils aktuelle Reihe.
Modellgrössen. Die Reihe reicht von kompakten Modellen mit etwa einer Milliarde Parametern (Llama 3.2 mit 1B und 3B), die auf bescheidener Hardware laufen, über mittlere Grössen wie 8B und 70B bis zu sehr grossen Modellen wie Llama 3.1 mit 405 Milliarden Parametern. Kleinere Modelle sind genügsam und schnell, grössere können mehr, brauchen aber deutlich mehr Speicher und Rechenleistung.
Llama 4 und Mixture of Experts. Llama 4 nutzt eine Mixture-of-Experts-Architektur, bei der pro Anfrage nur ein Teil des Modells aktiv ist. Das Modell Scout kombiniert rund 17 Milliarden aktive mit 109 Milliarden Gesamtparametern, Maverick rund 17 Milliarden aktive mit 400 Milliarden Gesamtparametern. Die Generation ist multimodal, verarbeitet also Text und Bild.

Die konkrete Modellpalette ändert sich schnell. Welche Modelle aktuell verfügbar sind und welche Grösse zur eigenen Hardware passt, ist vor einem Einsatz direkt bei Meta zu prüfen.

Die Lizenz-Grenze und der Begriff Open Source

Bei Llama liegt der wichtigste Punkt nicht in der Technik, sondern in der Lizenz. Die Modelle stehen nicht unter einer anerkannten Open-Source-Lizenz, sondern unter einer eigenen Llama Community License, die Meta pro Generation herausgibt.

Offene Gewichte, eigene Lizenz. Die Lizenz erlaubt Download, Anpassung und kommerziellen Eigenbetrieb der Gewichte. Insofern ist Llama deutlich offener als ein reines API-Modell. Sie ist aber an Auflagen geknüpft und damit nicht uneingeschränkt frei.
Die wichtigsten Auflagen. Wer Llama weitergibt, muss die Lizenz und einen Herkunftshinweis mitliefern. Eine bekannte Klausel betrifft sehr grosse Anbieter: Organisationen mit mehr als 700 Millionen monatlich aktiven Nutzern brauchen eine gesonderte Lizenz von Meta. Hinzu kommt eine Acceptable Use Policy, die bestimmte Einsatzzwecke ausschliesst.
Nicht Open Source im strengen Sinn. Die Open Source Initiative, die über die offizielle Definition wacht, stuft die Llama-Lizenz nicht als Open Source ein, weil sie Einschränkungen beim Einsatzzweck und beim Nutzerkreis enthält, die die Definition ausschliesst. Der präzise Begriff für Llama ist daher Open Weights, also offene Gewichte mit Lizenzauflagen, nicht Open Source.

Diese Unterscheidung ist keine Wortklauberei. Sie entscheidet, ob ein Modell rechtlich bedenkenlos in jedem Kontext eingesetzt werden darf, und gehört vor jedem produktiven Einsatz geprüft.

Llama als internes Modell im souveränen Stack

Der Wert offener Gewichte liegt darin, dass das Modell die Plattform des Anbieters verlässt. Ein Llama-Modell lässt sich auf eigener Hardware oder in einer Schweizer Cloud mit einem lokalen Inferenz-Server ausführen, sodass keine Anfrage an einen externen Dienst geht. Damit wird Llama zum möglichen Baustein einer Architektur für souveräne KI, in der offene Gewichte und lokale Inferenz ein Sprachmodell ohne Datenabfluss ergeben. Gegenüber dem europäischen Anbieter Mistral ist der Unterschied vor allem die Lizenz: Mistral stellt einen Teil seiner Modelle unter die anerkannte Apache-2.0-Lizenz, während Llama bei der eigenen Community-Lizenz mit Auflagen bleibt. Beide teilen aber das entscheidende Merkmal, dass sich die Gewichte selbst betreiben lassen. Welche Modelle auf welchen Daten laufen dürfen, ist am Ende eine Frage der Governance, nicht der Modellauswahl allein.

Referenzen

Open Source Initiative Metas Llama license is still not Open Source. Begründung, weshalb die Llama-Lizenz die Open-Source-Definition nicht erfüllt. (18.02.2025). opensource.org/blog/metas-llama-license-is-still-not-open-source
Meta Llama 4 Community License Agreement. Die aktuelle Lizenz mit Weitergabe-Auflage, der 700-Millionen-Nutzer-Klausel und dem Verweis auf die Acceptable Use Policy. (2025). www.llama.com/llama4/license/
Meta Llama Modellübersicht und Download. Die offizielle Startseite der Modellfamilie mit Generationen und Grössen. (2026). www.llama.com/

KI fragen

Diese Links öffnen externe KI-Dienste, die Unterhaltung und deren Inhalt werden dabei an den jeweiligen Anbieter übertragen.