Power BI Duplikate entfernen: Power Query Schritte, Alternativen & Checkliste
Zusammenfassung
Duplikate sind einer der häufigsten Gründe für falsche Summen, doppelt gezählte Buchungen und Misstrauen in Power-BI-Reports. Entscheidend ist: Erst klären, was „doppelt“ bedeutet (Key), dann passend entfernen oder bewusst beibehalten.
- Duplikate entstehen meist durch Appends/Merges, Excel-Exporte oder fehlende eindeutige Schlüssel.
- In Power Query entfernst du Duplikate gezielt nach einer oder mehreren Spalten.
- Wenn „doppelt“ fachlich gewollt ist, sind Gruppieren/Aggregieren oder DAX (z. B. SUMX) die bessere Option.
- Mit einer kurzen Checkliste und Validierung nach dem Import verhinderst du stille KPI-Fehler.
Das spart Nacharbeit in Excel und bringt verlässliche Zahlen in Power BI und Excel.
Du willst power bi duplikate entfernen, ohne KPIs zu zerstören? So findest, bereinigst und validierst du Duplikate in Power Query.
Definition
Duplikate in Power Query sind Zeilen, die bezogen auf eine gewählte Spalte oder eine Spaltenkombination identische Werte haben. Duplikate entfernen bedeutet, diese Mehrfachzeilen zu reduzieren, sodass pro Schlüssel nur eine Zeile übrig bleibt.
Das ist nicht dasselbe wie „mehrere Buchungszeilen pro Rechnung“ oder „mehrere Positionen pro Auftrag“: Das kann fachlich korrekt sein und darf nicht blind dedupliziert werden.
Einleitung
Wenn du „power bi duplikate entfernen“ googelst, steckst du meist in einem typischen Problem: Summen sind zu hoch, Counts sind unplausibel, und irgendwer vergleicht alles wieder mit Excel. Die gute Nachricht: Duplikate lassen sich in Power Query sauber lösen – wenn du vorher klärst, nach welchem Schlüssel überhaupt „doppelt“ zählt.
Was sind Duplikate in Power Query – und wann entstehen sie?
Duplikate entstehen fast immer durch einen Prozessschritt, nicht „einfach so“. Typische Auslöser im Power Query Editor sind:
Append (Abfragen anfügen): Zwei Monatsdateien überlappen, oder dieselbe Excel-Datei wurde zweimal eingelesen.
Merge (Abfragen zusammenführen): Eine 1:n-Beziehung wird wie 1:1 gemerged, dadurch vervielfacht sich die Faktentabelle.
Fehlender oder instabiler Schlüssel: Es gibt keine eindeutige ID (z. B. Belegnummer + Positionsnr.), oder Datentypen/Leerzeichen machen „gleich“ zu „nicht gleich“.
Der Nutzen, das sauber zu trennen: Du verhinderst stille KPI-Fehler, die in Meetings richtig teuer werden (Zeit, Vertrauen, Entscheidungen).
Schritt-für-Schritt: Duplikate entfernen in Power Query
So entfernst du Duplikate kontrolliert, ohne versehentlich zu viel zu löschen:
1) Schlüssel festlegen
Wähle die Spalten, die eine Zeile eindeutig machen (z. B. Belegnummer + Positionsnummer oder Kunde + Datum + Betrag). Ohne diesen Schritt ist Deduplizieren ein Ratespiel.
2) Spalten markieren
Markiere die Schlüsselspalten. Für mehrere Spalten: erste Spalte klicken, dann mit Strg weitere Spaltenüberschriften anklicken.
3) Duplikate entfernen
Im Menüband:
Start > Zeilen reduzieren > Duplikate entfernen
. Power Query behält die erste gefundene Zeile und entfernt die übrigen Duplikate bezogen auf deinen Schlüssel.4) Ergebnis prüfen
Kontrolliere Zeilenanzahl und Stichproben. Wenn du später nachvollziehen willst, was passiert ist: Im Bereich „Angewendete Schritte“ siehst du den Schritt „Duplikate entfernen“.
Schritt-für-Schritt: Duplikate beibehalten statt entfernen
Oft willst du nicht löschen, sondern „pro Schlüssel genau eine Zeile ableiten“ – mit fachlich korrekter Logik (z. B. letzte Buchung gewinnt, höchste Version gewinnt).
Variante A: Gruppen nach (Group By)
Start > Gruppieren nach: Schlüsselspalten auswählen.
Aggregation wählen: z. B. Max (Datum), Summe (Betrag) oder Anzahl Zeilen.
Ergebnis ist eine eindeutige Tabelle, ohne dass du Informationen „blind“ wegwirfst.
Variante B: Duplikate markieren statt löschen
Baue eine Prüflogik (z. B. Gruppieren und Count) und filtere nur die auffälligen Keys. Das ist ideal, wenn du erst verstehen willst, warum Duplikate entstehen.
Alternative Methoden: Gruppieren, Aggregieren und SUMX
Power Query ist für Datenbereinigung super. Manchmal sind Duplikate aber eher ein Modell- oder Berechnungsthema:
Gruppieren/Aggregieren in Power Query: gut, wenn du bereits in der Abfrage eine eindeutige „Gold“-Tabelle erzeugen willst, die alle nutzen können.
DAX mit SUMX: sinnvoll, wenn die Detailzeilen bleiben müssen, du aber eine Kennzahl dedupliziert rechnen willst (z. B. Umsatz pro Beleg einmal zählen, obwohl mehrere Zeilen existieren).
DAX DISTINCTCOUNT: hilfreich, wenn du eindeutige Einheiten zählen willst (z. B. eindeutige Belege), ohne Zeilen zu löschen.
Wichtig für den Nutzen: Du bekommst korrekte KPIs, ohne deine Detailanalyse zu verlieren.
Praxisbeispiel mit Vorher-Nachher-Daten
Ausgangslage: Eine Excel-Liste mit Zahlungsbewegungen wurde monatlich exportiert und anschließend „angehängt“. Durch einen Überlappungsbereich waren Buchungen doppelt.
Vorher (Ausschnitt):
Beleg: 4711 | Datum: 31.01. | Betrag: 1.000
Beleg: 4711 | Datum: 31.01. | Betrag: 1.000
Nachher in Power Query: Schlüsselspalte „Beleg“ markieren > Duplikate entfernen. Ergebnis: Der Beleg 4711 ist nur noch einmal vorhanden, die Summe stimmt wieder, und der Report muss nicht mehr manuell in Excel „korrigiert“ werden.
Häufige Fehlerquellen und schnelle Lösungen
Falscher Schlüssel: Du deduplizierst nach „Kunde“ statt nach „Beleg + Position“. Lösung: Schlüssel fachlich definieren, nicht technisch raten.
Unsichtbare Unterschiede: Leerzeichen, Groß-/Kleinschreibung, Datentypen (Datum vs. Datum/Uhrzeit). Lösung: Bereinigen (Trim/Clean), Typen fest setzen, dann deduplizieren.
Merge vervielfacht Zeilen: 1:n-Join erzeugt Duplikate in der Faktentabelle. Lösung: Dimension vorher eindeutigen Key geben oder Merge-Logik anpassen.
Best Practices für saubere Daten und Performance
Dedupliziere so früh wie möglich: Je früher du Duplikate entfernst oder gruppierst, desto weniger Last trägst du ins Datenmodell.
Dokumentiere den Schlüssel: Ein kurzer Kommentar im Team („Key = Beleg + Position“) verhindert spätere KPI-Diskussionen.
Validiere mit Kontrollkennzahlen: z. B. Zeilenanzahl, Summe Betrag, DISTINCTCOUNT(Beleg) vor vs. nach der Bereinigung.
Checkliste: vor dem Bereinigen und Validierung nach dem Import
Vor dem Bereinigen
Ist klar, welche Spalten zusammen eindeutig sind?
Gibt es Overlaps durch mehrere Dateien/Zeiträume?
Sind Datentypen, Leerzeichen und Schreibweisen vereinheitlicht?
Nach dem Import
Stimmen Summe/Count gegen die Quelle (oder eine belastbare Referenz)?
Ist nachvollziehbar, welche Zeile bei „Duplikate entfernen“ erhalten blieb?
Bleiben KPIs bei Refresh stabil (kein „heute anders als gestern“)?
Wann externe Unterstützung sinnvoll wird
Externe Hilfe lohnt sich, wenn du nicht nur ein paar doppelte Zeilen hast, sondern das Problem strukturell ist: mehrere Quellen, wiederkehrende Excel-Konsolidierung, unklare Schlüssel oder widersprüchliche KPIs im Management-Reporting. Dann geht es weniger um den Klick auf „Duplikate entfernen“, sondern um saubere Datenlogik, damit Power BI zuverlässig automatisiert aktualisiert und ihr nicht jeden Monat wieder dieselben Diskussionen führt.







