Anschriftenprüfung mit Datenanreicherung

Anschriftenprüfung mit Datenanreicherung - urbanstudio webdesign berlin
iStockPhoto

Für ein Projekt bekamen wir die Vorgabe alle durch Benutzer eingegebene Adressdaten auf Plausibilität und Existenz zu überprüfen, ggf. alternative Vorschläge zu unterbreiten und auch die Daten anzureichern, wenn zum Beispiel die Postleitzahl fehlte, aber auch Ortsteile und Bundesland sowie Geodaten zu der Anschrift zu ermitteln.

Hierzu starteten wir eine Suche nach entsprechenden Datenbanken oder Diensten im Internet. Datenbanken sind häufig leider wenn sie verfügbar sind schon wieder veraltet, weshalb die Entscheidung Grundsätzlich auf einen Webservice fiel.

Hierzu haben wir folgende Webservices getestet:

  1. Postdirect (SOAP-Webservice)
  2. Addressdoctor (SOAP-Webservice, Interactive)
  3. Google-Maps-API
  4. Bing-Maps-API

Der Webservice der Deutschen Post, Postdirect, ist recht einfach zu implementieren, jedoch nur zur Anschriftenprüfung, und dies nur bei geringen Fehleingaben brauchbar. Der Service liefert bei nicht korrekten Schreibweise eine korrigierte Anschrift zurück. Allerdings darf die Abweichung wie bereits erwähnt nicht allzu groß sein.

Der Addressdoctor-Webservicce liefert im Gegensatz zur Post nicht einfach nur ein korrigiertes Ergebnis, sondern schlägt ggf. mehrere (in unseren Tests bis zu 20 verschiedene) Alternativen vor. Bei der Abfrage stellten wir jedoch doch fest, das die Abweichung zur tatsächlich gesuchten Anschrift ähnlich wie beim Postdirect-Service nicht allzu groß sein darf, da sonst Ergebnisse erscheinen, die falsch sind. Bei einer Fehleingabe wird hier bevorzug die Postleitzahl für eine Umkreissuche für mögliche Alternativen benutzt.

Die Google-Maps-API war die vielversprechenste Lösung. Hier konnte man wirklich oft wirre Anschriften eingeben, Google hat entweder gut korrigiert oder entsprechende Alternativen aufgezeigt. Mit der Angabe einer falschen Postleitzahl und eines Korrekten (auch falschgeschriebenen Ortes) hat Google in den meisten Fällen die korrekte, gesuchte Anschrift gefunden, oder eine passable Alternative angeboten. In manchen Fällen waren die Alternativen jedoch etwas weiter weg.

Bing liefert teils wirklich Haarsträubende Resultate. Die vorgeschlagenen Alternativen waren oft einfach eine Anschlussstelle auf der Autobahn, wie Bing zu dem Ergebis kam, ist uns nicht einleuchtend. In einigen Fällen liefert Bing jedoch hervorragende Ergebnisse. jedoch darf die Abweichung der Eingabe nicht zu Groß sein. Bing nutzt scheinbar wie auch Addressdoctor eine Postleitzahl-Umkreissuche für die alternativen Adressen.

Alle Services liefern zu den (richtigen) Ergebnissen auch nützliche Daten wie Ortsteile, Bundesland und ggf. Regierungsbezirk und weitere.

Die Geokodierung der Anschriften ist mit allen Services möglich. getestet haben wir dies mit allen ausgenommen Addressdoctor. Alle Ergebnisse haben wir uns jeweils auf einer Karte anzeigen lassen. Die in den meisten Fällen genausten GeoDaten lieferte die Google Schnittstelle. Getestet haben wir hier nur Anschriften, bei denen wir den Punkt auf der Karte auch ohne GeoDaten hätten einwandfrei bestimmen können.

Bei allen Diensten sollte man sich natürlich mit den Nutzungsbedingungen vertraut machen. wobei Postdirect und Addressdoctor gar kostenpflichtig sind. Google und Bing bieten hier auch kostenfreie Lösungen an. Ein wichtiger Hinweis. Die Nutzung der Google-API ist eingeschränkt auf maximal 2500 Anfragen am Tag. Außerdem darf der Service nur genutzt werden, wenn die GeoDaten für die Anzeige in einer Karte bestimmt sind.

Unser Fazit

Alles in allem hat jeder einzelne dieser Services seinen Vorteil. Eine Vermischung dieser Services wäre die wohl beste Lösung, allerding kann dies recht kostspielig und aufwendig sein. Daher haben wir uns für unser Projekt für die Nutzung der Google-Maps-Api entschieden. Der Service erfüllt die Grundvoraussetzungen und durch eine Ähnlichkeitssuche mit in unserer Datenbank bereits vorhandener Adressen können wir eine gute Adressqualität gewährleisten.