excel_is_amazing
XLDnaute Nouveau
Bonjour les experts,
J'ai été impressionné par le nombre et la qualité des réponses. Du coup, je me lance.
Le soucis est le suivant, j'ai un fichier avec 240 000 lignes et un vingtaines de colonnes.
Dans ce fichier, j'ai une clef primaire, l'adresse email. Mon soucis est le suivant :
je peux avoir une ligne avec juste l'email, l'email avec 3/4 champs remplis et une dernière avec l'email plus beaucoup de champs remplis.
Ce que je cherche à faire c'est éliminer les doublons tout en gardant la ligne la plus renseignée (celle contenant le plus de d'infos). Par exemple :
M / Gates / bill / / / PDG / non / FR / bill.gates@microsoft.com
M / Gates / bill / Microsoft / edition logiciel / PDG / non / FR / bill.gates@microsoft.com
/ / / / / / non / FR / bill.gates@microsoft.com
Je cherche à garder la seconde ligne (la plus renseignée).
Je peux avoir un, deux, trois ou plus de doublon sur la clef Email.
Je vous ai joint un exemple.
l'idée, c'est donc de toujours garder une seule ligne, celle avec le plus de renseignement.
J'ai été impressionné par le nombre et la qualité des réponses. Du coup, je me lance.
Le soucis est le suivant, j'ai un fichier avec 240 000 lignes et un vingtaines de colonnes.
Dans ce fichier, j'ai une clef primaire, l'adresse email. Mon soucis est le suivant :
je peux avoir une ligne avec juste l'email, l'email avec 3/4 champs remplis et une dernière avec l'email plus beaucoup de champs remplis.
Ce que je cherche à faire c'est éliminer les doublons tout en gardant la ligne la plus renseignée (celle contenant le plus de d'infos). Par exemple :
M / Gates / bill / / / PDG / non / FR / bill.gates@microsoft.com
M / Gates / bill / Microsoft / edition logiciel / PDG / non / FR / bill.gates@microsoft.com
/ / / / / / non / FR / bill.gates@microsoft.com
Je cherche à garder la seconde ligne (la plus renseignée).
Je peux avoir un, deux, trois ou plus de doublon sur la clef Email.
Je vous ai joint un exemple.
l'idée, c'est donc de toujours garder une seule ligne, celle avec le plus de renseignement.