Anrede und Anschrift
Dubletten
Verschmelzung
Abgleiche
Screenshow
Ergebnisse
Feinsteuerung
Anreicherung
Integration
Projekte und Referenzen
Hintergrund
Support
Download

In Adressbeständen von mehr als wenigen hundert Adressen sind Dubletten trotz ihrer negativen Auswirkungen faktisch unvermeidlich (zur Dublettenentstehung vgl. hier). q.address DublettenCheck identifiziert und verschmilzt doppelte Datensätze.

Gleich, ob die zu verarbeitenden Adressen in einer oder mehreren Adressdateien oder Datenbanktabellen vorliegen, q.address DublettenCheck beherrscht alle denkbaren Anforderungen:

  • Dublettenbereinigung nur innerhalb der Eingabedatei (Intradubletten).
  • Dublettenbereinigung nur zwischen verschiedenen Eingabedateien (Interdubletten). Dubletten in einer Eingabedatei bleiben unberücksichtigt, es werden nur Dubletten bearbeitet, die zugleich in unterschiedlichen Eingabedateien vorkommen.
  • Dublettenbereinigung sowohl innerhalb als auch zwischen den Eingabedateien (Inter- und Intradubletten).

q.address DublettenCheck berücksichtigt dabei Ihre besonderen Anforderungen (klicken Sie bei Interesse auf den jeweiligen Absatz):

  • Fehlertoleranz und Gewichtung der Ähnlichkeitskriterien können Sie entweder entsprechend Ihrer besonderen Anforderungen selbst einstellen oder Sie wählen die optimierten Standardeinstellungen.
  • q.address DublettenCheck sichert durch zweckmäßige und auf Ihre Anforderungen zugeschnittene Ergebnisse eine schnelle und praktische Weiterverarbeitung.

Die Dublettenerkennung kann daneben in verschiedenen weiteren Anwendungen genutzt werden. Klicken Sie hier.

Verschmelzung statt Informationsverlust

Wenn eine Dublettengruppe gefunden wird, enthält sie in ihrer Gesamtheit fast immer mehr Informationen als jede einzelne Dublettenadresse allein. Ärgerlich, wenn Sie nun gezwungen wären, eine bestimmte Adresse zu selektieren und alle übrigen Adressen zu verwerfen. Alle Informationen, die in diesen Adressen gespeichert wären, gingen zusammen mit diesen Adressen für immer verloren.

Nicht so bei q.address DublettenCheck. Sie können q.address anweisen, alle Informationen aus allen Dublettenadressen einzusammeln und in die neue Adresse zu übernehmen. Wir nennen das Verschmelzung.

Wie funktioniert die Verschmelzung?

Dr. H. Müller
81247 München , Grandlstr. 27
Müller Dr. Helmut Müller
81247 München, Grandlstr. 27 81247 München, Grandlstr. 27
Telefon: 089 88 66 33 Telefon: 089 88 66 33
Helmut Müller
81247 München, Grandlstr. 27

Gegeben sei folgende Gruppe von
insgesamt drei Dublettenadressen.

Das Ergebnis.

An diesem Beispiel sieht man sehr schön, wie jede der drei Adressen Informationen für die neu generierte "verschmolzene" Adresse beigetragen hat: Die erste mit dem Titel (Dr.), die zweite mit der Telefonnummer und die dritte mit dem Vornamen.

Bei der Verschmelzung von q.address DublettenCheck bestimmen Sie, wie die Verschmelzung vorzunehmen ist. Dabei können Sie die Verschmelzungsvorschriften für jedes Datenfeld einzeln festlegen. q.address bietet dazu eine Reihe vorbereiteter Verschmelzungsfunktionen an:

  • Bester: q.address ermittelt den "besten" Feldinhalt ("Hans" ist im Falle eines Vornamens z. B. besser als "Hasn" (Buchstabendreher!) oder "H.").
  • Längster: Es wird der längste Feldinhalt übernommen.
  • Größter: Es wird der größte Feldinhalt übernommen.
  • Konkateniere: Die Feldinhalte werden konkateniert, d. h. zusammengefügt (ggf. getrennt durch ein vorgegebenes Trennzeichen).
  • Kumuliere: Die Feldinhalte werden kumuliert, d. h. zusammengezählt.
  • Jüngster: Es wird der Feldinhalt aus dem jüngsten Datensatz übernommen.
  • Dateiprio: Es wird der Feldinhalt aus dem Datensatz entnommen, der der Datei mit der höchsten Priorität entstammt.

Diese Aufstellung ist nicht vollständig, außerdem können einzelne Regeln (z. B. Dateiprio und Jüngster) beliebig kombiniert werden.

Hier geht es zurück zur Übersicht oder weiter zum Abgleich.