Nom, Prénom, Nom de Famille au secours

Fonmaz

XLDnaute Junior
Je ne suis pas nouveau sur le Forum, mais c'est ma première question.
J'ai une liste de 150 000 lignes avec des Noms est des prénoms, et je dois les identifier pour les compiler dans une base. Problème, il y a pour 1 personne plusieurs entrées. Ex : Jeanine Botheau; Jeanine, Marie, Isabelle Botheau, ou encore Jeanine Botheau Lacan, ou Jeanine, Marie, Isabelle Botheau Lacan, sont en fait Jeanine Botheau (Et je passe les traits d'union, ou autres joyeusetés comme la tilde et quelques accents qui selon la saisie figurent parfois et parfois pas). Je voudrais une formule qui permette de reconnaitre les différentes écritures d'un nom et l'identifier comme Jeanine Botheau (Pour l'exemple du dessus) et lui donner un numéro. Je maîtrise un peu excel, mais pas le VBA.
Merci de me dire si c'est un rêve inaccessible ou si vous pouvez m'aider.
 

Tibo

XLDnaute Barbatruc
Re : Nom, Prénom, Nom de Famille au secours

Bonjour,

Peux-tu nous fournir un petit bout de fichier exemple (que tu auras au préalable anonymisé) et avec 40 ou 50 lignes maxi présentant les différents cas de figutes possibles.

Cela dit, sur 150.000 lignes, par formule ça risque d'être plutôt lourd.

@+
 

Fonmaz

XLDnaute Junior
Re : Nom, Prénom, Nom de Famille au secours

Merci déjà de s'intéresser à mon cas; Ci-Joint un bout de fichier. Les Trucs qui coincent sont en rouge. C'est à partir de ces lignes qu'il me faudrait de plusieurs noms, n'en avoir plus qu'un. Mais comment les Identifier ?

Merci
 

Pièces jointes

  • Fichier noms Forum.xls
    48 KB · Affichages: 236
  • Fichier noms Forum.xls
    48 KB · Affichages: 247
  • Fichier noms Forum.xls
    48 KB · Affichages: 244

hoerwind

XLDnaute Barbatruc
Re : Nom, Prénom, Nom de Famille au secours

Bonjour et bienvenu sur le forum, salut Tibo,

Comme on ne peut se fier sur les prénoms et noms de famille (divergences dans l'orthographe), il faut se rabattre sur les nationnalités et dates de naissance et de décès (je suppose que c'est la signification de la deuxième date).

En H1 : =SOMMEPROD((D$2: D2=D2)*(E$2:E2=E2)*(C$2:C2=C2))
formule à copier vers la bas.

Trier cette colonne sur les 1.
Il faut vérifier si c'est exact (je ne l'ai pas fait).
J'ai bien remarqué que les lignes 143 et 144 sont en police rouge (doublon), alors qu'elles ne le sont pas, puisque dates de naissance différentes.
 

Fonmaz

XLDnaute Junior
Re : Nom, Prénom, Nom de Famille au secours

La formule fonctionne, et merci pour ce coup de main. Mais je n'aurais pas toujours les dates, l'âge ou les deux. Existe-t-il un moyen a partir de plusieurs écriture de noms, qui représentent la même personne d'ordonner à excel d'inscrire dans la cellule une seule écriture Ex : a1 = Paul Renoir ; a2 = Paul Renoir Mazières ; a3 = Paul Henri Renoir Mazières équivalent en b1,b2,b3à Paul Renoir ?

Merci de vos idées et réponses
 

hoerwind

XLDnaute Barbatruc
Re : Nom, Prénom, Nom de Famille au secours

Bonjour,

Il n'est pas possible de différencier (ou plutôt le contraire) les trois exemples que tu cites.

Tout comme les fautes d'orthographes, par exemple Dupond, Dupont, du Ponc, ...

Ce que tu pourrais faire c'est marquer (mise en forme conditionnelle) les lignes où une des données est manquante, et vérifier visuellement si c'est un doublon ou non.
 

Statistiques des forums

Discussions
312 632
Messages
2 090 337
Membres
104 507
dernier inscrit
mag7748