|
La méthodologie est basée sur la reconnaissance d'une adresse
donnée par comparaison à la liste des rues existant dans
une ville, commune, etc...Saviez-vous qu'en moyenne moins de 50% des adresses
sont correctement orthographiées, aux abbréviations usuelles
près. CatCo a mis au point un algorithme particulièrement
performant de reconnaissance des adresses, même à partir
d'ortographes très dégradées (Voir exemples plus
bas). Testé et éprouvé sur des millions d'adresses,
l'outil permet d'atteindre des taux moyens d'adresses reconnues très
élevés et en moyenne de plus de 95% sur la France métropolitaine,
avec des taux approchant le 100% dans les grandes villes.
Le référentiel, c'est à dire la liste des
rues utilisées, est basé sur les 2 standards du marché
que sont Navteq et Teleatlas, incorporés aux outils commerciaux
utilisés dans le processus de géocodage, et amélioré
par des bases de données developpées par Catco en particulier
pour les résidences , les zones commerciales, les immeubles, etc...Les
services en ligne de Yahoo et Google -YahooMap et GoogleMap- sont également
utilisés.
La précision du résultat va de quelques mètres
en ville lorsque l'adresse fournit le numéro dans la rue à
quelques centaines de mètres pour les adresses du type hameau,
route de campagne ou zone industrielle. Les rues non reconnues sont affectées
à la position de la mairie de la commune du risque.
Fichiers résultats:
Les résultats sont fournis sous forme de fichiers texte ou Access
(MS Office). Les champs de sortie standard sont les suivants:
Identificateur de la police
Adresse originale: N°, rue, ville, code postal, code Insee de la commune
Adresse reconnue
Position X,Y
Score
Systèmes et projections:
Les résultats peuvent être fournis dans un ou plusieurs des
systèmes et projections suivants, adaptés à la France
métropolitaine:
Latitude/Longitude sur l'ellipsoide WGS84 (standard du système
RGF)
X,Y dans l'une des projections suivantes: Lambert I,II,II,IV ou étendu,
Lambert 93
Exemples de reconnaissance d'adresses dégradées:
Outre l'orthographe, les sources de dégradation les plus communes
sont dues à l'ajout de termes venant "polluer" l'adresse
: batiment, escalier, etage, etc...et la rendant quasiment introuvable
par les outils standard. Cette situation est très fréquente
lors d'extractions automatisées d'adresses en masse dans les fichiers
des assurés De très nombreux autres cas d'erreurs existent
cependant. Ci dessous un échantillon:
Adresse originale |
Adresse reconnue |
AVENUE NORMANDIE NIEMEN APT DE LA TOUR N°64
_ 6E ETAGE
|
Rue Normandie Niemen
|
RUE MERMOZ APP 12 4 ET |
Rue Jean Mermoz
|
RUE PLANZOL REZ DE CHAUSSEE |
Rue du Maréchal des Logis Planzol
|
RUE DE ROCH ALZ |
Lieu-Dit Crec'H Roc'H Alzy |
RUE DES FROND TIREUR RDC PORTE G |
Rue des Francs-Tireurs |
|