L
lionel
Guest
Bonjour à vous,
Je travaille actuellement sur un fichier Excel (Excel 2002 - windows xp) qui me pose souci … Mes recherches de solution sur le net m’ont amené vers votre site qui m’a donné plein d’astuces et d’infos mais pas celles qui concerne le fichier en question.
Peut-être pourrez-vous m’aider ?
J’ai une base de données de 7 colonnes (colonne A : « nom », colonne B : « adresse », colonne C : « CodePostal » …) et 4000 lignes (réduite à 14 dans le fichier joint pour exemple).
Même si j’ai enlevé les doublons via la fonction données/filtre/filtre élaboré avec extraction sans doublon, cela n’enlève que les lignes complètement identiques.
Or, je considère comme doublon une ligne dont les champs « nom », « adresse » et « code postal » sont identiques à une autre ligne ayant les mêmes champs « nom », « adresse » et « code postal »
Je corse un peu la difficulté en partant du principe que si le nom est identique mais que l’adresse diffère peu (même nom de rue mais numéro de rue différent), c’est également un doublon. L’inverse est également vrai : si l’adresse est identique mais que le nom diffère peu (exemple : A1 : nom = « société x entrepôt » et A2 : nom = « société X magasin »)
Dans le fichier joint, la feuille "base" est ma base de données, la feuille "cible" est le résultat auquel je souhaite arriver.
Merci d’avance d’avoir au moins pris la peine de me lire en espérant ne pas avoir été trop flou dans mes explications.
Cordialement,
Lionel
Je travaille actuellement sur un fichier Excel (Excel 2002 - windows xp) qui me pose souci … Mes recherches de solution sur le net m’ont amené vers votre site qui m’a donné plein d’astuces et d’infos mais pas celles qui concerne le fichier en question.
Peut-être pourrez-vous m’aider ?
J’ai une base de données de 7 colonnes (colonne A : « nom », colonne B : « adresse », colonne C : « CodePostal » …) et 4000 lignes (réduite à 14 dans le fichier joint pour exemple).
Même si j’ai enlevé les doublons via la fonction données/filtre/filtre élaboré avec extraction sans doublon, cela n’enlève que les lignes complètement identiques.
Or, je considère comme doublon une ligne dont les champs « nom », « adresse » et « code postal » sont identiques à une autre ligne ayant les mêmes champs « nom », « adresse » et « code postal »
Je corse un peu la difficulté en partant du principe que si le nom est identique mais que l’adresse diffère peu (même nom de rue mais numéro de rue différent), c’est également un doublon. L’inverse est également vrai : si l’adresse est identique mais que le nom diffère peu (exemple : A1 : nom = « société x entrepôt » et A2 : nom = « société X magasin »)
Dans le fichier joint, la feuille "base" est ma base de données, la feuille "cible" est le résultat auquel je souhaite arriver.
Merci d’avance d’avoir au moins pris la peine de me lire en espérant ne pas avoir été trop flou dans mes explications.
Cordialement,
Lionel