Electronic Commerce Info Net - ECIN - bietet aktuelles Know-how für das E-Business und Expertise für den elektronischen Geschäftsverkehr: Shopsysteme, Marketing, Marktbarometer, Zahlungssysteme, Steuern&EC, Recht, EDI&EC und mehr. Kompetent und kostenlos.
ECIN - Electronic Commerce Info NetAktuellKnow-HowSolutions: Quickfinder eBusinessCommunityWorkshops
Erweiterte Suche
KontaktNewsletter AbosWerben Sie im Electronic Commerce Info Net

ECIN RSS Feed
ECIN Newsletter Abos

Newsletter

Abo ändern | löschen


 

ECIN Home | Know-how | Strategie

Diesen Beitrag stellt zur Verfügung
Omikron Data Quality GmbH

Einmal hält besser

14.02.2008 | Artikel drucken | Artikel empfehlen

Im zweiten Teil unserer Serie zum Thema Datenmanagement erfahren Sie mehr über doppelte Daten. Selbst in gut gepflegten Adressdatenbanken sind vier bis sechs Prozent Dubletten enthalten, wenn sie nicht systematisch - zum Beispiel mit Hilfe einer speziellen Software - bekämpft werden. Nun klingen so ein paar Prozent nicht gerade gravierend. Aber fünf Prozent Dubletten von 100.000 Werbebriefen sind immerhin 5.000 Stück - das ist ein ganz schön großer Haufen Briefe. Und es sind eine Menge Kosten, die unnütz verursacht werden.

Anzeige

Dubletten schaden nicht nur wegen der doppelten Werbekosten:
-Dubletten machen jegliche Personalisierung zunichte. Ein Kunde, der einen Brief doppelt erhält, weiß sofort: Massenwerbung!

-Dubletten verfälschen Analysen des Database Marketing. Wettbewerbs-Analysen, CLV (Customer Lifetime Value) und Cross-Selling-Analysen werden signifikant verfälscht. Denn Dubletten verteilen sich nicht gleichmäßig über die Datenbank, sondern tauchen insbesondere dort auf, wo die Analyse ansetzt: bei den Mehrfachkäufern.

Gegenmaßnahmen

Um die Dublettenquote in Ihrer Datenbank möglichst gering zu halten, gibt es zwei Ansätze: Sie können die Datenbank entweder von Zeit zu Zeit bereinigen, oder Sie können versuchen, Dubletten von vornherein zu vermeiden. Für beides gibt es heute Software-Hilfsmittel. Im Folgenden erfahren Sie mehr darüber.

Grundsätzliche Anforderungen an Dublettensoftware
Dubletten entstehen immer durch Abweichungen in der Schreibweise von Adressen. Dabei gibt es verschiedene Arten von Abweichungen. Folgende sind für Privatadressen typisch:
- Tippfehler: Alexander wird zu Alexnader

- Schreibfehler: Chryschanowski wird zu Krischanoffsky

- verschiedene Namensschreibweisen: Meier/Mayer, Sylvia/Silvia, Mathias/Mattias

- Freudsche Hörfehler: Sponheimstr. wird zu Sponhainstr.

- Weitergehende Freudsche Fehler: Friedrich-Silcher-Weg wird zu Friedrich-Schiller-Weg, weil das Gehirn schon bei "Friedrich" auf "Schiller" schaltet.

Bei Firmenadressen treten andere Abweichungen in den Vordergrund:
- Vertauschungen: Müller Möbel / Möbel-Müller
- Zusätze: Müller Möbel / Müller Design-Möbel GmbH
- Wortteil-Verschiebungen: Müller Direkt- und Dialogmarketing / Müller Direktmarketing
- Abkürzungen: Westf. Inst. f. Agrarökonomie / Agrarökonomisches Institut Westfalen

Sie sehen: welche Ähnlichkeiten gefunden werden müssen, unterscheidet sich nach Firmen- und Privatadressen. Ihre Software muss also auf Ihren Typ Adressen passen.

Overkill und Underkill

Im Einzelvergleich ist (bisher) kein Verfahren so gut wie der Mensch. Teilweise findet Software Dubletten, die nicht wirklich welche sind. Diese zuviel gefundenen Dubletten nennt man Overkill. Umgekehrt findet kein Verfahren alle Dubletten. Zuwenig gefundene Dubletten bezeichnet man analog als Underkill. Je besser Ihr Verfahren, desto geringer die Summe aus Over- und Underkill. Geringer Over- und Underkill wird auch als hohe Trennschärfe bezeichnet.

Ähnlichkeits-Verfahren zur Dublettenprüfung

Im Folgenden erhalten Sie ein Überblick über die wichtigsten Verfahren, damit Sie angebotene Software einschätzen können.

Das einfachste Verfahren: Matchcode
Statt die gesamte Adresse Buchstabe für Buchstabe zu vergleichen, werden nur markante Punkte miteinander verglichen, z.B. PLZ, Hausnummer, der 1 und 3. Buchstabe des Nachnamens und der 1. Buchstabe des Vornamens. Solange alle diese Dinge übereinstimmen, wird die Adresse als Dublette gefunden, auch wenn in den anderen Buchstaben Abweichungen sind.
Solche Verfahren benötigen kaum Rechenzeit, da dieser "Matchcode" einfach gebildet wird und in einem so genannten Index für jede Adresse abgelegt werden kann - er muss also nicht jedes Mal für alle Adressen neu errechnet werden. Der Pferdefuß ist die schlechte Trennschärfe: Maier/Meier wird zwar gefunden, aber schon bei Meyer weicht der dritte, der relevante Buchstabe ab - der Matchcode versagt. Bei Maier/Maihofer wird hingegen fälschlich eine Dublette gemeldet. Fazit: Das Verfahren ist veraltet. Nehmen Sie ein Programm mit besserem Verfahren.

Phonetik
Hier werden unterschiedliche Schreibweisen vereinheitlicht, indem ähnlich klingende Buchstaben in denselben Code verwandelt werden. P und B werden z.B. zur "1", K und C und G zur "2". Ob es nun Becker oder Begger heißt - egal, alles gleich. Wie beim Matchcode kann hier der Phonetik-Code in einem Index gespeichert werden, was das Verfahren beschleunigt. Es gibt eine Vielzahl solcher Phonetik-Verfahren, wobei die einfachen nur einzelne Buchstaben, die besseren auch Buchstabengruppen ("Sch") betrachten. Das einfachste ist das Russell-Soundex-Verfahren, häufig nur Soundex genannt. Es ist weit verbreitet, liefert aber sehr viel Overkill: So wird z.B. "Mehl" und "Maier" gleichgesetzt. Von einer heutigen Profi-Phonetik können Sie erwarten, dass sie auch mit deutschen Umlauten klarkommt und selbst kompliziertere Abweichungen wie "Kristof"/"Christoph" oder "Klusoh"/"Cluseault" findet - bei geringem Overkill. Aber Achtung: Auch die beste Phonetik findet nur phonetische Fehler. Tippfehler oder Abkürzungen lassen sich damit nicht aufspüren. Deshalb sind phonetische Verfahren allein zumindest für Firmenadressen völlig unzureichend.

Unscharfe Ähnlichkeitsverfahren
Da Computer immer leistungsfähiger und billiger geworden sind, ist es heute nicht mehr nötig, ein indizierbares Verfahren zu verwenden. Die Matchcode-Verfahren wurden daher von so genannten "unscharfen" Verfahren abgelöst. Ein unscharfes Verfahren trifft keine Ja/Nein-Entscheidungen, sondern bestimmt den Grad der Ähnlichkeit. Durch Abwägen verschiedener Elemente der Adresse können so wesentlich höhere Trennschärfen erzielt werden: Sind beispielsweise Firmenname und Ansprechpartner sehr ähnlich, so kann trotz gänzlich anderer Straße (Umzug!) die Firma als Dublette zugeordnet werden. Bei annähernd identischer Straße und Hausnummer können andererseits stärkere Abweichungen im Firmennamen zugelassen werden. Diese Abwägung wäre mit Matchcode-Verfahren nicht möglich. Heutige professionelle Adressverfahren sind optimiert für Adresseinsatz. So findet z.B. das FACT®-Verfahren alle oben aufgeführten Beispiele und kommt damit dem menschlichen Ähnlichkeitsempfinden verdächtig nahe.

Ähnlichkeit ist nicht alles

Ein gutes Ähnlichkeitsverfahren ist Voraussetzung für eine gute Dublettensoftware. Aber das Verfahren allein genügt nicht. Für eine Software, die ganze Dateien auf Dubletten prüft, spielt die Bedienung eine große Rolle: Was nützt die beste Software, wenn Sie sie nie anwenden? Neben einer eingängigen Benutzeroberfläche zählt hier das Dateiformat: Die Software sollte möglichst ohne Zwischenschaltung einer Konvertierung jenes Dateiformat verarbeiten können, das Sie verwenden. Jede Zwischenkonvertierung kostet Zeit und birgt Fehlerrisiken - achten Sie darauf.

Wann sollte man Dublettenprüfung durchführen?

Hierfür gibt es vier mögliche Zeitpunkte:
- Gleich bei der Eingabe
- Beim Einspielen separat erfasster (oder gekaufter) Adressen, also beim Hinzufügen eines neuen Adressbestandes zu Ihrer Kundendatei
- Innerhalb der Kundendatei
- Direkt vor dem Mailing
Die optimale Antwort heißt: Alle vier - denn zu jedem Zeitpunkt gibt es vernünftige Gründe, obwohl Sie zu den anderen Zeitpunkten auch prüfen. Ob sich der Mehrfach-Aufwand für Sie lohnt, hängt natürlich von Ihrer Adressmenge ab und vom Negativ-Effekt, der durch jede Dublette verursacht wird.

Prüfung gleich bei der Eingabe
Wenn in Ihre Kundenverwaltungssoftware eine Prüfung integriert ist, die direkt nach Eingabe einer Adresse wirksam prüft, ob diese Adresse in ähnlicher Form bereits in Ihrem Datenbestand enthalten ist, dann vermeiden Sie viel Arbeit:
- Einerseits ist in vielen Unternehmen das Anlegen eines neuen Kunden mit Aufwand verbunden: Kreditwürdigkeitsprüfung, Heraussuchen der zuständigen Regionalvertretung, … Diesen Aufwand machen Sie unnötigerweise doppelt, wenn Sie nicht merken, dass der Kunde schon existiert.

- Vor allem aber: Ist erst einmal ein neuer Kundenstammsatz angelegt, sammelt er automatisch Vorgänge: Rechnungen, Kontakte, Ansprechpartner, Zahlungsinfos usw. Alle diese Daten von einem Datensatz zum anderen zu bewegen, kann je nach Umfang über 10 € an Arbeitszeit für jede einzelne Dublette verursachen.
Die Prüfung bei der Eingabe ist die wirksamste, denn
- hier sitzt ein Mensch davor: Sie können also die Prüfung etwas sensibler einstellen, so dass sie im Zweifel lieber eine Dublette zuviel als eine zuwenig anzeigt; und der Erfassungsmitarbeiter kann "keine Dublette" anklicken. Dadurch finden Sie sicherer alle Dubletten.

- Der Mitarbeiter hat jetzt die beste Gelegenheit, einer aufgezeigten Dublette auf den Grund zu gehen:

- Hat er den Kunden am Telefon, kann er zurückfragen, beispielsweise "ich habe hier einen Hans Müller, aber an einer anderen Adresse - haben Sie früher in der Mühlgasse gewohnt?".

- Hat er eine Antwortkarte vor sich, kann er noch mal nachschauen, ob sich kleine Unterschiede zwischen vorhandener und neu eingegebener Adresse nicht vielleicht doch als Identität herausstellen: Manchmal sieht z.B. ein handschriftliches "u" ähnlich wie ein "n" aus usw.

- Dabei können übrigens auch Fehler in der bereits vorhandenen Adresse durch das Telefonat oder die neue Antwortpostkarte korrigiert werden.

Prüfung beim Hinzufügen eines neuen Adressbestandes zu Ihrer Kundendatei
An dieser Stelle ist zumindest eines noch klar: welche Ihre bestehenden Adressen sind und welche Ihre neuen. Wenn Sie fremde Adressen hinzufügen, die Sie günstig von einem Adressverlag gekauft oder von einer CD geladen haben, dann ist die Folge-Verarbeitung ganz einfach: Wenn ein Dublettenverdacht zwischen einer bestehenden und einer neuen Adresse besteht, lassen Sie die neue einfach weg. Falls Sie dabei unnötigerweise ein paar Adressen zuviel gelöscht haben, ist das auch nicht schlimm.
Ganz anders sieht es aus, wenn die einzuspielenden Adressen z.B. Messekontakte sind: Jeder dieser Kontakte hat Sie wahrscheinlich mehrere 100 Euro gekostet, und die Messebesucher erwarten jetzt Infomaterial, einen Außendienstkontakt etc.
Hier müssen Sie alle Zweifelsfälle klären. Alles was sicher keine Dublette ist, kann eingespielt werden. Die Vielleicht-Dubletten spielen Sie besser nicht einfach ein, sondern übergeben Sie lieber denjenigen Vertriebsmitarbeitern zur manuellen Eingabe, die mit diesen Kunden später zu tun haben - bzw. die im Falle einer Dublette diesen Kunden schon kennen.

Prüfung innerhalb der Kundendatei
Warum muss man die Daten nochmals in sich prüfen, wenn schon bei der Eingabe und beim Einspielen eine Dublettenkontrolle stattgefunden hat? Das erscheint in der Tat zunächst merkwürdig, hat sich aber als sinnvoll herausgestellt. Die Gründe:
- Mitarbeiter drücken manchmal nachlässig "keine Dublette", wenn bei der Prüfung während der Eingabe häufig Adressen als Dubletten ausgewiesen werden, die tatsächlich gar keine Dubletten sind.

- Beim Einspielen zusätzlicher Adressbestände wurden Fehler in der Dublettenprüfung gemacht - oder dieser Schritt wurde bei manchen Zusatzadressen völlig vergessen.
Wenn Sie bei einer solchen Prüfung feststellen, dass tatsächlich keine oder nur eine vernachlässigbare Menge Dubletten vorhanden sind: Herzlichen Glückwunsch! Bisher habe ich erst einmal erlebt, dass die Dublettenquote über 2 Jahre lang unter 0,2% gehalten wurde. Sind entsprechende Eingabeprüfungen vorhanden, dann ergeben sich meiner Erfahrung nach meist noch Dublettenquoten zwischen 0,5 und 1% - das sind immerhin viel weniger als die normalen 4-6%. Empfehlung: Machen Sie ca. 2 Monate nach Einführung einer Eingabeprüfung einen Test. Sollten sich schon wieder viele Dubletten eingeschlichen haben, dann prüfen Sie, ob die Software richtig eingestellt ist und ob die Mitarbeiter richtig geschult wurden - und holen Sie das eine oder andere ggf. nach. Wenn sich jedoch herausstellt, dass sich bei Ihnen tatsächlich sehr selten Dubletten einschleichen, dann verlängern Sie den Zeitraum zwischen den Prüfungen.

Prüfung in der Mailing-Datei
Hiermit hat es eine andere Bewandtnis als mit den zuvor genannten drei Prüfungen: Dubletten sind unerwünschte doppelte Adressen; doch in der Stammdatei müssen manche Adressen doppelt vorhanden sein, die beim Mailing aber nur einmal angeschrieben werden sollen. Insbesondere handelt es sich um verschiedene Firmen mit demselben Ansprechpartner:
- 3 Linden Hotel-Betriebs-GmbH & Co., Herrn Martin Feldner
- 3 Linden Hotel-Holding GmbH, Martin Feldner
- 3 Linden Restaurant-Betriebs-GmbH, z. Hd. Martin Feldner
Klar, dass Sie die drei Unternehmen bei der Rechnungsstellung nicht vertauschen dürfen. Aber braucht Herr Feldner tatsächlich drei Kataloge?

Bei Fragen zu diesem Thema wenden Sie sich bitte an:
Carsten Kraus, Tel. (07231) 125970

Artikel drucken | Artikel empfehlen

Zum gleichen Thema:
ECIN Solutions - Strategie Von Kundenbeziehungen und Datenschutzrecht
ECIN Solutions - Strategie Kostenfaktor IT-Storage
ECIN Solutions - Strategie Kundendaten richtig pflegen
ECIN Solutions - Strategie Sicherheit im richtigen (Rechts-)Rahmen
ECIN Solutions - Strategie Web Analytics: der Google Ansatz


Mehr Infos zum Thema 'Datenmanagement'

 

Sponsored Links:

Ihr eigener Shop im Internet. Professionelle High-End Lösung.
Mit dem beliebig skalierbaren COSMOSHOP bietet die Zaunz Publishing GmbH kostengünstige Einstiegslösungen bis zu individuellen High-End Lösungen. Jetzt 30 Tage gratis TESTEN!

luna-park GmbH ist die Online-Marketing Agentur für
Suchmaschinenoptimierung und Web Controlling seit 1998. Zusätzlich bieten die Experten aus Köln Suchmaschinen-Marketing und Online-Vermarktung aus einer Hand an.

Markt-studie.de: das Portal rund um Marktforschung mit über 5.000 Marktstudien.

Werbeagentur-in.de – Die Datenbank deutscher Werbung Finden Sie in über 4.300 Agentur-Profilen komfortabel die passende Pr-, Event,
Internet- oder Werbeagentur für zukünftige Projekte und Kampagnen.

Absatzwirtschaft.de: Die Online-Ausgabe des Fachmagazins rund um´s Marketing

apomio - Preisvergleich für Medikamente und Online-Apotheken

Gimahhot - die neue Ecommerce-Plattform - weltweit einzigartiges Konzept

trivago Hotelpreisvergleich: Sparen Sie Zeit und Geld bei der Online-Buchung.

 

 

 

ECIN Shop: Workshops, Reports und mehr

ECIN Reports Reports Alle ... leer

Shoplösungen im Vergleich
57 Lösungen, 415 Seiten Pdf, Preis: 99,- € zzgl. MwSt. mehr ...

Katalog-Management-Systeme
27 Lösungen, 250 Seiten Pdf,  Neuer Preis: 49,- € zzgl. MwSt. mehr ...

News

Gesetzwidriges Werkzeug? Gesetzwidriges Werkzeug?

eCommerce: Optimismus trotz Konjunkturproblemen eCommerce: Optimismus trotz Konjunkturproblemen

Mittelständler ganz groß Mittelständler ganz groß

Virtuelle Werbung weltweit vorn Virtuelle Werbung weltweit vorn

ECIN eBusiness Blog

Artikel lesen Social Networking hat sich durchgesetzt

Artikel lesen Internetbrands im Höhenflug

Know-how

Im Dialog mit der nächsten Generation Im Dialog mit der nächsten Generation

Abstrafungen meiden, hohes Ranking sichern Abstrafungen meiden, hohes Ranking sichern

Partnerangebot

Dienstleistungen zum Thema "Einmal hält besser" finden Sie in den Kategorien:
ECIN Solutions - StrategieStrategie

Bitte beachten Sie den Eintrag unseres Premium-Partners

ECIN SolutionsCHRONOPAY B.V.

Relevante Bücher finden Sie im ECIN Bücherbord unter Strategie.

Unser Buchtipp zum Thema "Einmal hält besser":


Carsten Kraus
Adress- und Kundendatenbanken für das Direktmarketing. Aufbau, Pflege, Nutzung
Bestellen: bei Amazon

 

 

© FTK Dortmund |2008 | Impressum

KontaktNewsletter AbosWerben Sie im Electronic Commerce Info Net