Quels sont les termes les plus tapés?

magnusyou

XLDnaute Junior
Bonjour à tous,

J'aimerai un coup de pouce de votre part sur un fichier (très lourd) qui contient des libellés de petites annonces.

J'aimerai connaitre quels sont les termes d'au minimum 2 mots les plus utilisés dans l'ensemble de ces libellés. La particularité est que dans un même libellé nous pouvons avoir les mêmes mots mais à des endroits différents:


ex de libellés :

peugeot 106
peugeot XS 106
106 5 portes peugeot


J'aimerai obtenir cela comme résultat dans un tableau à coté:

peugeot 106 --> trouvé 3 fois


L'idée serait de trouver quels sont les mots clés des libellés les plus utilisés dans un tableau récap.

Je vous expose en pj un peu plus le problème pour bien comprendre.

J'espère que ce cas est solvable et me permettra d'avancer.

N'hésitez pas si ce n'est pas très clair,

Bien à vous,

magnusyou :)
 

Pièces jointes

  • Termes identiques.xlsx
    22.7 KB · Affichages: 67
Dernière édition:

suistrop

XLDnaute Impliqué
Re : Quels sont les termes les plus tapés?

Bonjour suistrop,

merci beaucoup pour ta réponse, en fait je ne comprends pas bien le fichier que tu m'as envoyé..

Dans ton exemple dois-je comprendre que le mot "xsara coupe hdi" (ligne 3) est présent 3 fois dans l'ensemble de la colonne A?

Bonjour,
Lance la macro croisement.
Colonne B vont apparaitre tous les mots présents dans la colonnes A
Colonnes C vont apparaitre tous les couples de mots à partir des mots présent dans la colonne B
Colonnes D vont apparaitre le nombre de fois ou le couple présent dans la colonne C se trouve dans la colonne A.

==> La macro est longue a tourner, pour faire les tests je te conseille de te limiter a 20-30 lignes dans la colonnes A.
 

magnusyou

XLDnaute Junior
Re : Quels sont les termes les plus tapés?

Je viens de faire le test c'est vraiment pas mal :)

La limite est que pour 100 lignes d'étude j'en ai 30K dans la colonne générées..

Penses-tu qu'il est possible de ne pas traiter les lettres + espace ou les mots en dessous de 3 ou 4 caractères?

magnusyou,
 

suistrop

XLDnaute Impliqué
Re : Quels sont les termes les plus tapés?

Je viens de faire le test c'est vraiment pas mal :)

La limite est que pour 100 lignes d'étude j'en ai 30K dans la colonne générées..

Penses-tu qu'il est possible de ne pas traiter les lettres + espace ou les mots en dessous de 3 ou 4 caractères?

magnusyou,

C'est possible de ne prendre en compte que les terme qui te convienne.
Pour se faire tu peu découper ma macro en 2.
Macro 1 : Début de la macro existante pour alimenter la colonne B qui contient tous les mots.
Macro 2 : Fin de la macro qui prend ce qui se trouve dans la colonne B pour faire les couples et calculer le nombre de fois que ca apparrait

Sinon tu peux modifier la macro pour ne prendre en compte dans le dictionnaire que les mots qui contiennent un certains nombre de lettres via un test.

Donc une fois que tu as fait ca, tu lances la macro 1, tu modifies la colonne B pour conserver uniquement les termes que tu veux voir en couple et tu lances la macro 2.

Cordialement,
 
Dernière édition:

Membres actuellement en ligne

Statistiques des forums

Discussions
312 348
Messages
2 087 508
Membres
103 568
dernier inscrit
NoS