Was ist ein Datenkatalog? Einfache Einführung in Microsoft Purview für Einsteiger
Zusammenfassung
Ein Datenkatalog in Microsoft Purview zentralisiert Metadaten deiner Datenassets und macht sie durch automatisierte Scans und natürliche Sprachsuche leicht auffindbar – ideal für Data Governance in Fabric-Umgebungen.
Du vermeidest Silos und Zeitverluste beim Datenfinden, während Business Glossary und Datenprodukte Transparenz schaffen.
- Scans von Quellen wie OneLake füllen den Katalog mit Schema, Lineage und Klassifizierungen.
- Glossary-Terms verknüpfen Geschäftsterminologie mit Assets für einfache Suche.
- Insights-Dashboards überwachen Nutzung und Qualität.
- Best Practice: Starte klein mit Top-Quellen und 10 Terms.
Du lernst, wie du mit Microsoft Purview einen Datenkatalog aufbaust, um Daten findbar zu machen und deine Governance zu vereinfachen.
Ein Datenkatalog ist ein zentrales Verzeichnis, das Metadaten zu allen Datenassets in deinem Unternehmen erfasst, wie Tabellen, Dateien oder Datenbanken, und diese durch automatisierte Scans aus verschiedenen Quellen sammelt. Microsoft Purview Unified Catalog stellt diesen Datenkatalog bereit, ergänzt durch einen Business Glossary für geschäftliche Begriffe, grenzt sich jedoch von reinen Daten-Speichern ab, da er keine Rohdaten lagert, sondern nur Metadaten für Daten finden und Governance nutzt – nicht für direkte Datenverarbeitung geeignet.
Einleitung
Als Verantwortlicher für Data Governance siehst du täglich, wie Teams stundenlang nach relevanten Daten suchen, ohne sie zu finden. Der Datenkatalog in Microsoft Purview löst das, indem er Metadaten zentralisiert und durch Suche mit natürlicher Sprache zugänglich macht – so dass Analysten schnell auf vertrauenswürdige Daten zugreifen können.
In Zeiten von KI und Fabric wird die Komplexität deines Datenbestands explodieren. Ohne guten Datenkatalog verlieren Business-User die Übersicht, und Governance-Ziele wie Compliance oder Qualität bleiben auf dem Papier. Hier bringt Microsoft Purview Struktur, damit du Risiken minimierst und den Wert deiner Daten maximierst.
Wir zeigen dir, wie du das praktisch umsetzt, mit Fokus auf den Nutzen für deine Teams: einfaches Daten finden und sicheres Teilen.
Grundlagen des Datenkatalogs in Microsoft Purview
Der Kern ist die Data Map: Sie scannt Quellen wie OneLake, SQL-Server oder Snowflake automatisch und füllt den Datenkatalog mit Metadaten – Schema, Klassifizierungen und Lineage. Du konfigurierst Scans in drei Stufen: Basis-Metadaten, Schema-Details oder mit KI-Klassifizierung für sensible Daten.
Metadaten sind der Schlüssel: Sie beschreiben, wo Daten herkommen, wie sie transformiert wurden und wer Zugriff hat. Für dich als Governance-Experten bedeutet das: Einheitliche Sicht auf den gesamten Data Estate, ohne manuelle Pflege.
Typische Herausforderungen ohne Datenkatalog
Deine Controlling-Leitung wartet wochenlang auf Daten aus dem Data Lake, weil niemand weiß, wo die aktuellen Umsatzzahlen sind. Business-User bauen Reports auf veralteten Kopien, was zu Fehlentscheidungen führt. Ohne Datenkatalog fehlt Transparenz über Datenqualität und -Herkunft.
In Fabric-Umgebungen multiplizieren sich Silos: Jeder Lakehouse hat eigene Tabellen, und Metadaten bleiben isoliert. Das Resultat: Hohe Kosten für Duplikate und Governance-Lücken bei Compliance.
Lösungsansätze: Vom Scan zum Business Glossary
Starte mit Quellen-Registrierung in Purview: Verbinde OneLake, und Scans füllen den Katalog. Erstelle einen Business Glossary mit Begriffen wie „Kunde“ oder „Umsatz“, verknüpft mit Assets – so suchen User geschäftlich und finden technische Details.
Governance Domains gruppieren Assets thematisch, z. B. „Finanzen“. Datenprodukte bündeln Tabellen, Reports und Lineage zu einem Paket: Ein Analyst fordert „Umsatz pro Region“ an, bekommt alles mit einem Klick – inklusive Qualitäts-Score und Zugriffsregeln.
Praktisches Beispiel aus unseren Projekten
In einem Projekt für einen Handelskonzern sahen wir, wie das Finanzteam ohne Katalog stundenlang nach Quartalsdaten suchte. Nach Einrichtung des Datenkatalogs in Microsoft Purview: Ein Suchbegriff wie „Umsatz Q4“ zeigt via natürlicher Sprache das Datenprodukt mit Lineage aus OneLake, klassifiziert und genehmigt. Das Team baute in Power BI direkt auf Gold-Daten auf – Zeitersparnis von Tagen auf Minuten.
Der Nutzen: Nicht-IT-Affine greifen sauber kuratierte Daten an, ohne IT-Hilfe, und du siehst via Insights-Dashboards, welche Assets genutzt werden.
Best Practices für den Einstieg
Beginne klein: Scan deine Top-5-Quellen, definiere 10 Glossary-Terms und richte eine Governance Domain ein. Nutze AI-Suche für Daten finden und weise Stewards zu, die Assets kuratieren. Überwache mit Health Scores die Qualität.
Integriere mit Fabric: OneLake-Metadaten fließen automatisch ein, sodass Power BI-Reports im Katalog erscheinen – User entdecken Dashboards neben Rohdaten.
Wann externe Unterstützung sinnvoll wird
Selbst bei kleinen Setups wird es komplex, wenn Scans fehlschlagen, Glossaries wachsen oder Lineage über Systeme hinweg fehlt. Ohne Expertise landen Assets unklassifiziert, Suchen bleiben ergebnislos, und Governance-Politiken wirken nicht – das führt zu Shadow-IT und Compliance-Risiken.
Wir unterstützen dich mit Workshops zur Katalog-Einrichtung, Proof-of-Concepts für deinen Data Estate oder laufender Betreuung. Kontaktiere uns, und wir machen deinen Datenkatalog zum Erfolgsfaktor – ob für den Einstieg oder Skalierung.
Fazit
Ein Datenkatalog in Microsoft Purview macht Daten auffindbar, verständlich und gouverniert. Starte mit Scans und Glossary, baue Datenprodukte auf – so nutzen deine Teams den vollen Wert von Fabric und OneLake.






