- Veröffentlicht am
- • How2-Tipps
Changedetection.io + KI: Automatische Datenpipelines mit Qdrant & RAG
- Autor
-
-
- Benutzer
- tmueller
- Beiträge dieses Autors
- Beiträge dieses Autors
-
Kombination mit KI & Datenpipelines (RAG, Qdrant etc.)
Bis hierhin hast du gelernt, wie changedetection.io Änderungen erkennt und automatisiert weitergibt. Jetzt gehen wir einen entscheidenden Schritt weiter:
👉 Wir machen daraus ein intelligentes System.
Denn erst durch die Kombination mit KI entsteht der echte Mehrwert: Nicht nur erkennen, dass sich etwas geändert hat – sondern die Information verstehen, speichern und nutzbar machen.
Vom Monitoring zur Wissensplattform
Stell dir vor:
- eine Website wird aktualisiert
- dein System erkennt das automatisch
- Inhalte werden extrahiert
- in Vektoren umgewandelt
- durchsuchbar gemacht
- und stehen sofort deiner KI zur Verfügung
👉 Genau das ist moderne Datenverarbeitung.
Der zentrale Workflow
Die Architektur sieht im Kern so aus:
Changedetection.io
↓ (Trigger)
Crawler / Parser
↓
Embedding (Text → Vektor)
↓
:contentReference[oaicite:1]{index=1}
↓
LLM / Chatbot / Suche
Schritt 1: Trigger (Changedetection)
Sobald sich eine Seite ändert:
👉 Webhook wird ausgelöst 👉 dein System startet automatisch den Prozess
Schritt 2: Crawl & Verarbeitung
Dein Crawler (z. B. dein Bot-System):
- lädt die Seite neu
- extrahiert relevante Inhalte
- bereinigt Text (Noise entfernen)
- speichert strukturierte Daten
Schritt 3: Embeddings erzeugen
Jetzt wird der Text „KI-ready“ gemacht:
👉 Text → Vektor (Embedding)
Beispiel:
- „Bürgerbüro Öffnungszeiten geändert“ → wird mathematisch repräsentiert
Schritt 4: Speicherung in Qdrant
Qdrant ist eine Vektordatenbank, die genau dafür gebaut ist:
- schnelle semantische Suche
- Filter nach Metadaten
- hochperformant
- perfekt für RAG-Systeme
Schritt 5: Nutzung durch LLM-Systeme
Jetzt kommt deine KI ins Spiel:
- Chatbots greifen auf aktuelle Daten zu
- Fragen werden semantisch beantwortet
- Inhalte werden intelligent verknüpft
👉 Beispiel:
Frage: „Wann hat das Bürgerbüro geöffnet?“
Antwort: 👉 basiert auf aktuellsten Daten, nicht alten Trainingsdaten
Automatische Wissensaktualisierung
Der größte Vorteil dieser Architektur:
👉 Dein Wissen ist immer aktuell – automatisch
Klassisches Problem
- Daten werden einmal importiert
- danach nie aktualisiert
- KI arbeitet mit veralteten Informationen
Deine Lösung
- Änderung erkannt
- Daten neu verarbeitet
- Embeddings aktualisiert
- sofort verfügbar
👉 Zero Maintenance Knowledge Base
Praxisbeispiele
Kommunale Plattform
- Änderungen auf städtischen Seiten
- automatische Aktualisierung im Chatbot
- Bürger bekommen immer aktuelle Infos
E-Commerce Monitoring
- Preisänderung erkannt
- Daten aktualisiert
- KI analysiert Trends
Dokumentenmanagement
- neue PDF veröffentlicht
- automatisch verarbeitet
- sofort durchsuchbar
SEO & Content Monitoring
- Inhalte ändern sich
- Ranking-relevante Anpassungen erkannt
- KI analysiert Auswirkungen
Warum das so mächtig ist
Du kombinierst:
- Monitoring
- Automatisierung
- Datenverarbeitung
- KI
👉 zu einem durchgängigen System
Best Practices
✔ nur relevante Inhalte verarbeiten (Selektoren!) ✔ Dubletten vermeiden (Hashing) ✔ Metadaten sauber speichern (URL, Datum etc.) ✔ Jobs asynchron ausführen ✔ Versionierung berücksichtigen
Mit dieser Kombination hebst du Changedetection.io auf ein völlig neues Level:
👉 vom einfachen Monitoring-Tool 👉 zur zentralen Datenquelle deiner KI-Plattform
Du erreichst:
✔ immer aktuelle Daten ✔ intelligente Suche ✔ automatisierte Verarbeitung ✔ skalierbare Architektur
👉 Und genau das ist der Kern moderner KI-Systeme: Daten + Automatisierung + Kontext = echte Intelligenz