Anubis und DSGVO: Wie KI-Schutz mit Datenschutz vereinbar bleibt

Die Balance zwischen Sicherheit und Datenschutz ist eines der großen Themen moderner IT-Infrastrukturen. Während Angriffe komplexer werden, wächst gleichzeitig der regulatorische Druck: DSGVO, ePrivacy, NIS2 und nationale Datenschutzgesetze verlangen Transparenz, Datenminimierung und Zweckbindung.

Doch wie lässt sich eine KI-basierte Firewall – die Millionen Requests analysiert und aus Traffic-Mustern lernt – rechtskonform betreiben? Die Antwort liefert Anubis, eine Web-AI-Firewall, die Datenschutz nicht als Hindernis, sondern als Gestaltungsprinzip versteht.

In diesem Artikel zeigen wir, wie Anubis seine Schutzmechanismen mit DSGVO-konformen Prozessen kombiniert – von der Log-Strategie bis zur erklärbaren KI.

1. Der zentrale Konflikt: Sicherheit vs. Privatsphäre

Klassische Firewalls und Intrusion-Detection-Systeme speichern typischerweise:

IP-Adressen
Header-Informationen
Zugriffszeiten
URL-Parameter
User-Agent-Daten

Diese Informationen sind potenziell personenbezogen, sobald sie Rückschlüsse auf eine identifizierbare Person zulassen – z. B. durch Kombination mit weiteren Merkmalen.

Bei KI-basierten Systemen wie Anubis stellt sich die Frage:

„Wie kann eine KI effektiv lernen, wenn sie gleichzeitig keine personenbezogenen Daten verarbeiten darf?“

Die Lösung liegt in technischer Entpersonalisierung und kontextbezogener Pseudonymisierung.

2. Keine personenbezogenen Daten im Training

Die KI von Anubis erkennt Bedrohungen nicht durch konkrete Nutzerprofile, sondern durch Verhaltensmuster und statistische Anomalien. Das Training erfolgt ausschließlich mit synthetischen oder anonymisierten Daten.

Beispiel: Daten, die Anubis analysiert

Kategorie	Beispiel	Personenbezug	Verarbeitung
IP-Adresse	`192.168.0.23`	potenziell personenbezogen	Hashing + Kürzung
User-Agent	`Mozilla/5.0 (Linux; Android 10)`	gering	Hashing + Normalisierung
Request-Frequenz	120 Requests / Sekunde	anonym	direkt nutzbar
Zeitintervall	0.21 Sekunden zwischen Klicks	anonym	direkt nutzbar
Request-Pfade	`/api/v1/login`	neutral	erlaubt

Anubis wandelt IPs und ähnliche Identifier vor der Verarbeitung in nicht rückführbare Hashwerte um. So entstehen „Signaturen“ des Traffics, die das Verhalten, nicht den Nutzer, beschreiben.

Beispielhafte Anonymisierung:

import hashlib

def anonymize_ip(ip_address):
    return hashlib.sha256(ip_address.encode()).hexdigest()[:10]

Damit ist der Input für das KI-Modell nicht personenbezogen, selbst wenn er aus realem Traffic stammt.

3. DSGVO-konforme Log-Strategie

Grundprinzip: „So viel wie nötig, so wenig wie möglich.“

Anubis verfolgt einen zweistufigen Logging-Ansatz:

Realtime Detection Logs (flüchtig)

Speicherung im RAM oder in Redis mit kurzer Lebenszeit (z. B. 1 Stunde)
Enthält minimale Metadaten für Live-Erkennung
Nach Ablauf: automatische Löschung

Aggregierte Security Reports (anonymisiert)

Enthält nur statistische Werte
Keine IPs oder Request-Header mehr
Dient der langfristigen Trendanalyse

Beispielhafte Konfiguration in config.yaml:

logging:
  level: info
  realtime_buffer_ttl: 3600   # Sekunden
  anonymize_ip: true
  store_user_agents: false
  aggregate_reports: true
  retention_days: 14

So bleibt der Zweck der Verarbeitung eindeutig definiert („Sicherheitsanalyse“) – und überschüssige personenbezogene Daten werden frühzeitig gelöscht.

4. Speicherort & Verantwortlichkeit

Anubis ist vollständig on-premise oder in eigenen Cloud-Umgebungen betreibbar. Das bedeutet: Keine Datenübermittlung an Dritte, kein externer Trainingsdienst, kein Vendor Lock-in.

Datenschutzrechtliche Vorteile:

Der Betreiber bleibt Datenverantwortlicher im Sinne von Art. 4 Nr. 7 DSGVO
Kein Datentransfer in Drittländer (USA, Asien etc.)
Keine Auftragsverarbeitungsverträge mit Cloud-Diensten nötig
Volle Kontrolle über Speicher, Logs und Modelle

In Kombination mit lokalen Speicherorten (z. B. Redis + PostgreSQL innerhalb des eigenen Netzes) erfüllt Anubis zentrale Anforderungen von Privacy by Design (Art. 25 DSGVO).

5. Explainable AI – Transparente Entscheidungen statt Black Box

Ein großes Problem vieler KI-Systeme: Entscheidungen sind schwer nachvollziehbar.

Anubis setzt deshalb auf Explainable AI (XAI), um Entscheidungen in Echtzeit zu dokumentieren und nachvollziehbar zu machen.

Beispiel:

{
  "timestamp": "2025-10-24T14:32:07Z",
  "source_ip": "hash:8adf129c99",
  "decision": "block",
  "confidence": 0.94,
  "explanation": {
    "features": {
      "click_interval": "0.08s (abnormal)",
      "user_agent_entropy": "low (bot-like)",
      "header_diversity": "static pattern",
      "request_spike": "10x avg baseline"
    },
    "model_weights": {
      "behavioral_score": 0.7,
      "rate_anomaly": 0.2,
      "geo_correlation": 0.1
    }
  }
}

So wird jede Entscheidung auditfähig:

Warum wurde blockiert?
Welche Parameter waren ausschlaggebend?
Wie sicher war das Modell in seiner Einschätzung?

Diese Transparenz ermöglicht Datenschutzbeauftragten, Entscheidungen zu prüfen – ohne Zugriff auf personenbezogene Daten.

6. Minimierung durch Edge-Preprocessing

Ein weiterer Datenschutzvorteil: Anubis kann als Edge-Komponente agieren – d. h. direkt am Eingangs-Traffic, bevor die eigentliche Anwendung die Daten erhält.

Das bedeutet:

Verdächtige oder anonyme Requests werden vor der Verarbeitung abgefangen
Keine personenbezogenen Daten gelangen in nachgelagerte Systeme
Logs sind technisch bereits minimiert, bevor sie gespeichert werden

In Kombination mit Reverse-Proxys wie Nginx oder Traefik kann Anubis somit den gesamten Datenverarbeitungsprozess datenschutzfreundlich gestalten.

7. Data Protection Impact Assessment (DPIA)

Für viele Organisationen mit sicherheitsrelevanter Infrastruktur ist eine Datenschutz-Folgenabschätzung Pflicht.

Anubis unterstützt dies durch:

klar dokumentierte Datenflüsse
exportierbare Modell-Metriken (z. B. Falsch-Positiv-Rate)
ein optionales Compliance-Dashboard, das Verstöße gegen die DSGVO-Logik meldet

Beispielhafte Audit-Ausgabe:

{
  "audit_check": "GDPR_Compliance_2025",
  "passed": true,
  "details": {
    "anonymization_active": true,
    "external_transfers": false,
    "retention_days": 14,
    "xai_logging": true
  }
}

Damit lässt sich eine vollständige Datenschutzprüfung dokumentieren – inklusive technischer Schutzmaßnahmen nach Art. 32 DSGVO.

8. Wirtschaftlicher Nutzen durch DSGVO-Design

Datenschutzkonforme Systeme bringen mehr als Rechtssicherheit – sie sind betriebswirtschaftlich effizienter.

Bereich	Vorteil
Revisionssicherheit	weniger Risiko bei Audits und Datenschutzprüfungen
Reputation	Vertrauen bei Kunden und Aufsichtsbehörden
Reduzierter Aufwand	kein aufwendiges Maskieren oder nachträgliches Löschen
Synergie mit IT-Sicherheit	Prävention von Datenabfluss und Compliance-Verstößen

9. Fazit: Datenschutz ist kein Widerspruch zu KI-Sicherheit

Anubis zeigt, dass Datenschutz und KI-gestützte Sicherheit keine Gegensätze sind. Im Gegenteil: Ein System, das Daten intelligent minimiert, kann sicherer, effizienter und sogar präziser arbeiten.

Die Kombination aus:

anonymisierten Datenstrukturen
DSGVO-konformen Logs
transparenter Entscheidungslogik
und lokaler Kontrolle

macht Anubis zu einer neuen Generation von Security-Systemen, die Rechtssicherheit und technologische Innovation vereinen.