Datenschutz & KI

Lokale LLMs für Anwälte und Ärzte: So klappt der DSGVO-konforme KI-Einsatz

Veröffentlicht: 03. Juli 2026•Autor: Sven Zimmermann

Große Sprachmodelle (LLMs) wie ChatGPT oder Claude bieten enorme Effizienzgewinne im Berufsalltag. Sie fassen lange Schriftsätze zusammen, formulieren Schreiben vor und unterstützen bei der Recherche. Doch für Berufsgeheimnisträger wie Rechtsanwälte, Notare, Steuerberater und Ärzte verbietet sich der Einsatz dieser cloudbasierten Dienste in der Praxis meist von selbst.

Der Grund ist einfach: Gemäß DSGVO und den berufsrechtlichen Verschwiegenheitspflichten (§ 203 StGB) dürfen personenbezogene Daten von Mandanten oder Patienten nicht ohne explizite Einwilligung an Server ausländischer Drittanbieter übertragen werden.

Die Lösung: Lokale Sprachmodelle (On-Premise)

Seit dem Durchbruch leistungsfähiger Open-Source-Modelle wie Llama 3 (Meta), Mistral (Mistral AI) oder Phi-3 (Microsoft) gibt es eine verlässliche Alternative: Der Betrieb der künstlichen Intelligenz direkt im eigenen Serverraum oder auf einer dedizierten, isolierten Instanz in einem deutschen Rechenzentrum.

Bei einer solchen On-Premise-Installation verlassen die Daten zu keinem Zeitpunkt Ihr Netzwerk. Die Anfrage des Mitarbeiters wird lokal auf Ihrer Hardware verarbeitet und das Ergebnis direkt zurückgeliefert.

Warum das für Kanzleien und Praxen in Köln unverzichtbar ist:

Absolute Datensouveränität: Es findet kein Datenabfluss ins Ausland statt. Keine US-Behörde hat Zugriff auf Ihre Mandatsakten oder Patientengeschichten.
Keine Nutzung als Trainingsdaten: Cloud-Betreiber behalten sich oft das Recht vor, Ihre Prompts (Eingaben) zum Training künftiger Modellgenerationen zu nutzen. Ein lokales Modell lernt nur das, was Sie ihm explizit vorgeben, und teilt dieses Wissen mit niemandem.
Volle Offline-Verfügbarkeit: Fällt das Internet aus, arbeitet Ihre lokale KI auf der Workstation im Büro einfach weiter.

Wie läuft die Umsetzung ab?

Die Integration lokaler KI-Modelle erfordert ein strukturiertes Vorgehen:

Hardware-Dimensionierung: Moderne Sprachmodelle benötigen Grafikspeicher (VRAM). Für mittlere Modelle (z.B. Llama 3 mit 8 Milliarden Parametern) reicht eine Grafikkarte mit 16 GB VRAM aus. Ich konzipiere die Hardware passgenau für Ihr geplantes Volumen.
Software-Setup: Über Plattformen wie Ollama in Kombination mit einer benutzerfreundlichen Oberfläche wie Open WebUI (die optisch an ChatGPT erinnert) wird die KI für Ihre Mitarbeiter zugänglich gemacht.
Sicherheits-Segmentierung: Der KI-Server wird in ein eigenes VLAN eingebunden, um die interne IT vor unbefugten Zugriffen zu schützen und sicherzustellen, dass nur berechtigte Personen sensible Dokumente zur Analyse hochladen.

Möchten Sie diese Lösung in Ihrer eigenen IT-Umgebung realisieren?

KI-Potenzialanalyse anfordern