Open-Source-KI und der AI Act – Was gilt für freie Modelle?
Open-Source-KI ist nicht regulierungsfrei: Der AI Act gilt auch für Llama, Mistral und kostenlose Modelle.
70 Prozent aller KI-Projekte in europäischen KMUs setzen auf Open-Source-Modelle – und viele dieser Unternehmen gehen davon aus, dass damit auch die Compliance-Frage erledigt ist. Kostenlos, frei verwendbar, keine Lizenzgebühren – und keine Regulierung? Diese Annahme ist falsch. Manchmal ist sie sogar gefährlich.
Der AI Act macht keine grundsätzliche Ausnahme für freie Modelle. Wer Llama, Mistral, Falcon oder ähnliche Modelle in Produkten oder Prozessen einsetzt, muss trotzdem verstehen, was gilt – und was nicht. Die Unterschiede sind erheblich, die Grenzlinien sind fein.
Das Missverständnis: Open Source ist nicht gleich regulierungsfrei
Wenn Entwickler von “Open Source” sprechen, meinen sie meist: Quellcode ist öffentlich, Gewichte sind herunterladbar, die Nutzung ist kostenlos. Was sie oft nicht bedenken: Der AI Act fragt nicht danach, wer das Modell entwickelt oder verkauft hat. Er fragt danach, welche Rolle Sie in der Wertschöpfungskette einnehmen und welche Risiken von der KI-Anwendung ausgehen.
Drei Rollen kennt der AI Act:
- Anbieter (Provider): Wer ein KI-System oder GPAI-Modell entwickelt und auf den Markt bringt.
- Deployer: Wer ein bestehendes KI-System unter eigener Verantwortung in einer konkreten Anwendung einsetzt.
- Importeur / Distributor: Wer Systeme aus Drittländern einführt oder weitervertreibt.
Ein Unternehmen, das Llama 3 herunterlädt und damit einen automatisierten Kundenservice aufbaut, ist in aller Regel Deployer – und unterliegt als solcher eigenen Pflichten, unabhängig davon, ob Meta das Modell gratis zur Verfügung stellt.
Was der AI Act zum Open-Source-Thema tatsächlich regelt
Der AI Act enthält an einer zentralen Stelle eine explizite Erleichterung für Open-Source-Modelle: Artikel 53 Absatz 2 im Kapitel über sogenannte GPAI-Modelle (General Purpose AI Models).
GPAI-Modelle sind große Sprachmodelle und ähnliche Foundation Models, die für eine breite Palette von Aufgaben einsetzbar sind – also genau das, was die meisten Menschen meinen, wenn sie von “KI-Modellen” sprechen: GPT-4, Claude, Gemini, aber auch die Open-Source-Varianten Llama, Mistral oder Falcon.
Für Anbieter von GPAI-Modellen sieht der AI Act umfangreiche Pflichten vor, darunter technische Dokumentation, Informationspflichten gegenüber nachgelagerten Anbietern und Maßnahmen zur Urheberrechts-Compliance. Artikel 53 Absatz 2 befreit Anbieter, die GPAI-Modelle unter einer Open-Source-Lizenz veröffentlichen, von einem Teil dieser Pflichten – konkret von den Pflichten zur technischen Dokumentation gegenüber nachgelagerten Anbietern (Article 53 Absatz 1 Buchstabe b) und den Informationspflichten (Buchstabe c).
Was bleibt: Die Pflicht zur Veröffentlichung einer hinreichenden Zusammenfassung der Trainingsdaten (für Urheberrechtszwecke) sowie die allgemeinen Transparenzpflichten.
Was unter eine “Open-Source-Lizenz” fällt
Der AI Act gibt hier keine eigene Definition vor. Maßgeblich ist, ob Gewichte, Parameter und Architekturbeschreibung öffentlich zugänglich sind und die Nutzung ohne wesentliche Einschränkungen gestattet ist. Klassische Open-Source-Lizenzen wie Apache 2.0, MIT oder die Llama Community License fallen darunter – wobei letztere bei sehr hohen Nutzerzahlen kommerzielle Einschränkungen enthält, was die Qualifikation im Einzelfall beeinflussen kann.
Die Ausnahme der Ausnahme: Systemisches Risiko
Die Open-Source-Erleichterung hat einen bedeutsamen Vorbehalt. Modelle mit systemischem Risiko sind von der Ausnahme ausgenommen – sie müssen die vollen GPAI-Pflichten erfüllen, auch wenn ihre Gewichte öffentlich zugänglich sind.
Systemisches Risiko im Sinne des AI Act entsteht, wenn die Rechenleistung für das Training des Modells 10²⁵ Floating Point Operations (FLOPs) übersteigt – oder wenn die Europäische Kommission ein Modell aufgrund seiner Fähigkeiten oder Verbreitung gesondert als systemisch riskant einstuft (Artikel 51).
Zum Vergleich: GPT-4 wurde nach Schätzungen mit deutlich mehr als 10²⁵ FLOPs trainiert. Llama 2 (70B) liegt nach verfügbaren Angaben knapp darunter, Llama 3 (405B) dürfte die Schwelle überschreiten. Die genauen Zahlen sind nicht immer öffentlich – und das ist selbst ein Compliance-Problem für Open-Source-Projekte.
Für die Praxis bedeutet das: Wer ein GPAI-Modell mit systemischem Risiko open source veröffentlicht, erhält keine Erleichterungen. Wer ein solches Modell nutzt, sollte prüfen, ob der Anbieter die entsprechenden Pflichten erfüllt hat – andernfalls fehlt die Dokumentationsgrundlage für die eigene Compliance.
Was für Unternehmen gilt, die Open-Source-Modelle einsetzen
Hier liegt der Kern für die meisten KMUs. Als Deployer eines Open-Source-Modells sind Sie nicht Anbieter des Modells selbst – aber Sie sind Anbieter oder Deployer des KI-Systems, das Sie damit aufbauen.
Der AI Act unterscheidet:
- Das GPAI-Modell (das Fundament, z. B. Llama 3)
- Das KI-System (die konkrete Anwendung, die auf diesem Modell aufgebaut ist, z. B. Ihr interner Rechtsassistent)
Die Pflichten als Deployer umfassen unter anderem:
- Transparenzpflichten gegenüber Nutzerinnen und Nutzern (insbesondere bei direktem Nutzerkontakt, z. B. Chatbots) – siehe auch KI-Transparenzpflicht und Kennzeichnung
- Einhaltung der Nutzungsbedingungen des Modellanbieters
- Risikoprüfung, ob das von Ihnen gebaute System in eine Hochrisiko-Kategorie fällt
- Sicherstellung angemessener menschlicher Aufsicht
- Bei Hochrisiko-Systemen: vollständige Pflichten nach Kapitel III des AI Act
Das Betreiben eines Open-Source-Modells schützt Sie als Deployer nicht vor diesen Anforderungen.
Hochrisiko-KI: Open Source ist kein Schutzschild
Die vielleicht wichtigste Erkenntnis für Unternehmen: Ob ein System als Hochrisiko-KI eingestuft wird, hängt von seiner Funktion ab – nicht von der Lizenz des zugrundeliegenden Modells.
Annex III des AI Act listet Bereiche auf, in denen KI-Systeme als hochriskant gelten: Personalentscheidungen, Kreditvergabe, Bildungsbewertungen, kritische Infrastruktur, Strafverfolgung und andere. Wenn ein Unternehmen mit Llama 3 einen automatisierten Lebenslauf-Screener baut, ist dieser Screener ein Hochrisiko-KI-System – unabhängig davon, dass Llama 3 kostenlos und frei verfügbar ist.
Die Pflichten für Hochrisiko-Systeme (Artikel 9-15) sind erheblich:
- Risikomanagementsystem muss etabliert und dokumentiert sein
- Technische Dokumentation und Konformitätsbewertung
- Daten-Governance für Trainings- und Testdaten
- Transparenz gegenüber Behörden und Nutzern
- Registrierung in der EU-Datenbank (für bestimmte Systeme)
- CE-Kennzeichnung und EU-Konformitätserklärung
Keiner dieser Punkte wird durch eine Open-Source-Lizenz des Basismodells hinfällig.
Drei Szenarien aus der Praxis
Szenario 1: Internes Wissensmanagementsystem
Ein Mittelständler baut mit Mistral eine interne Suchmaschine über seine Produktdokumentationen. Die Antworten werden von Mitarbeitern geprüft und dienen der internen Arbeit.
Bewertung: Kein Hochrisiko-System, kein direkter Kundenkontakt. Als Deployer müssen Grundpflichten erfüllt werden (Nutzungsbedingungen, angemessene Aufsicht). Die AI-Literacy-Empfehlungen aus Artikel 4 gelten trotzdem.
Szenario 2: KI-generierte Kreditentscheidungshilfe
Eine Fintech baut mit einem Open-Source-LLM ein Tool, das Kreditanträge bewertet und Empfehlungen ausspricht.
Bewertung: Hochrisiko (Annex III, Bereich Zugang zu Finanzdienstleistungen). Alle Hochrisiko-Pflichten gelten – inklusive Konformitätsbewertung. Dass das Modell gratis ist, ändert daran nichts. Zusätzlich greift die DSGVO-Folgenabschätzung.
Szenario 3: Marketingagentur mit Open-Source-Textgenerator
Eine Agentur nutzt ein selbst gehostetes Llama-Modell, um Werbetexte für Kunden zu erstellen. Die Texte werden menschlich überprüft.
Bewertung: Kein Hochrisiko-System. Die Transparenzpflicht greift nicht automatisch (kein Chatbot-Interface gegenüber Endkunden). Relevant: die Kennzeichnungspflicht für KI-generierte Inhalte, die täuschend realistische Personen darstellen. Für die Agentur gelten die Haftungsregeln aus dem AI Act.
Praktische Checkliste: Open-Source-KI im Unternehmen
| Prüfpunkt | Relevant für |
|---|---|
| Ist das Modell ein GPAI-Modell mit systemischem Risiko (>10²⁵ FLOPs)? | Ggf. eingeschränkte Dokumentationslage |
| Welche Rolle nehmen Sie ein? (Anbieter / Deployer / Distributor) | Bestimmt Pflichtumfang |
| Fällt Ihre Anwendung unter Annex III? | Hochrisiko-Pflichten |
| Gibt es direkten Kontakt mit Endnutzerinnen und Endnutzern? | Transparenz- und Kennzeichnungspflichten |
| Sind Ihre Mitarbeitenden AI-literate im Sinne von Artikel 4? | KI-Kompetenz (Empfehlung) |
| Haben Sie ein KI-Inventar? | Grundvoraussetzung für jede Compliance |
Ein strukturiertes KI-Inventar ist der erste Schritt – wie Sie eines anlegen, erklärt die Anleitung zum KI-Inventar.
Warum Open-Source-Modelle Compliance manchmal komplizierter machen
Es gibt einen paradoxen Aspekt: Wer GPT-4 über die OpenAI-API nutzt, hat automatisch einen Vertragspartner, der für die Modell-seitige Compliance verantwortlich ist. Wer Llama 3 selbst hostet, ist auf sich gestellt.
Das bedeutet konkret: Dokumentation, Risikoprüfung und Verantwortung verbleiben vollständig im eigenen Unternehmen. Es gibt keinen Anbieter, den man bei fehlender technischer Dokumentation in die Pflicht nehmen könnte. Für Hochrisiko-Anwendungen kann das bedeuten, dass Teile der erforderlichen Konformitätsdokumentation schlicht nicht verfügbar sind – ein ernstes Problem.
Gleichzeitig bieten Open-Source-Modelle echte Compliance-Vorteile: mehr Kontrolle über Daten, keine Abhängigkeit von externen API-Endpunkten, bessere Auditierbarkeit des Modellverhaltens. Diese Vorteile müssen gegen den höheren internen Aufwand abgewogen werden.
Fazit
Open-Source-KI ist eine legitime und oft sinnvolle Wahl – aber kein regulatorischer Freifahrtschein. Der AI Act differenziert präzise:
Modellanbieter mit Open-Source-Lizenz profitieren von reduzierten GPAI-Pflichten – außer bei systemischem Risiko.
Deployer, also Unternehmen, die Open-Source-Modelle in eigenen Anwendungen einsetzen, unterliegen denselben Pflichten wie Deployer proprietärer Systeme: Hochrisiko ist Hochrisiko, Transparenz ist Transparenz, AI-Literacy ist AI-Literacy.
Die entscheidende Frage ist nicht “Welches Modell nutze ich?”, sondern “Was tue ich damit und welche Risiken entstehen daraus?”
Wo stehen Sie?
Viele KMUs setzen bereits Open-Source-Modelle ein – oft ohne zu wissen, ob ihre Anwendungen Hochrisiko-Kriterien erfüllen oder welche Transparenzpflichten gelten.
Der eu-konform.ai Risiko-Check analysiert Ihre KI-Systeme in wenigen Minuten: Risikoklasse, relevante Pflichten, nächste Schritte – unabhängig davon, ob Sie proprietäre oder Open-Source-Modelle einsetzen.
Ist Ihr KI-Einsatz konform?
Kostenloser Risiko-Check in 5 Minuten – ohne Registrierung.
Jetzt prüfen