Compter le nombre de citations identiques dans 2 feuilles différentes

philleg

XLDnaute Nouveau
Bonjour à tous,

J'aimerais savoir si quelqu'un connait une macro qui permette de compter le nombre de mot identique dans deux feuilles différentes d'Excel.

Je m'explique: j'ai encodé les citations successives de différentes éditions d'un même bouquin et j'aimerais connaître le nombre de citations identiques entre par exemple la 1° et 4° édition. (Je mets les auteurs de la première édition dans la feuille 1 et les auteurs de la quatrième édition dans la feuille 2). Il ne faut pas comparer ligne par ligne. Pour corser le tout, certains noms ne sont pas tapé de la même façon mais ils sont identiques par exemple on peut avoir encodé Petit et Peti

Si cette macro me permettait de mettre dans une 3° feuille le résultat avec le nom suivit dans une autre colonne du nombre de fois qu'on retrouve cet auteur ce serait parfait.

Jusqu'à présent, je ne trouve rien de très concluant sur internet.

D’avance, je vous remercie
Philippe
 

ConsultantJP

XLDnaute Occasionnel
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Bonjour,

Tu aurais pu jouer avec nb.si (feuille1) + nb.si(feuille2) mais pour le coup ça ne marchera pas car les citations ne sont pas identiques.

Il faut trouver un code(ou plutot macro) qui comptera le nombre si un % d'excatitude.

Genre : Si y a 90% de similitude on le considere comme identique.

Effectivement avec un fichier cela sera plus simple !!
 

Catrice

XLDnaute Barbatruc
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Re,

Tres bonne idée de ConsultantJP

Tu peux utiliser le NB.SI avec "*" :

=NB.SI($A$1:$A$6;C1&"*")

Voir le fichier joint
 

Pièces jointes

  • Classeur1.xls
    13.5 KB · Affichages: 147
  • Classeur1.xls
    13.5 KB · Affichages: 159
  • Classeur1.xls
    13.5 KB · Affichages: 145

philleg

XLDnaute Nouveau
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

merci pour les premières réponses.
Je vous ai mis en annexe un fichier. En effet, cela sera plus simple à visualiser.
Si la macro est stricte est ne va pas prendre en compte Jensen M.C. , W. Meckling car dans la 2° feuille, il n'y a pas d'espace. Les données sont beaucoup plus nombreuses dans mon fichier original.
 

Pièces jointes

  • example.xls
    21.5 KB · Affichages: 143
  • example.xls
    21.5 KB · Affichages: 130
  • example.xls
    21.5 KB · Affichages: 128

philleg

XLDnaute Nouveau
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

il faut chercher "Jensen M.C. , W. Meckling" ou "Marshall J." (chaque fois le nom en entier de la 1° colonne) et le compter pour un s'il réapparait dans la deuxième feuille. Si par exemple on retrouve 2 fois ce nom dans la 2° feuille, la macro devrait compter un pour cet auteur et pas deux. S'il y est deux fois dans la 1° et 2° feuille, dans ce cas, c'est bien 2.
 

Catrice

XLDnaute Barbatruc
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Re,

Voir l'exemple dans le fichier joint qui gere les espaces en plus
 

Pièces jointes

  • example.xls
    29 KB · Affichages: 138
  • example.xls
    29 KB · Affichages: 128
  • example.xls
    29 KB · Affichages: 129
Dernière édition:

philleg

XLDnaute Nouveau
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Catrice, je te remercie beaucoup pour cette formule qui marche très bien et qui résous un de mes problèmes: les espaces

Malheureusement, il y en a d'autres.

1. Comment distinguer les mots mal orthographiés
2. Idem pour les points. Si dans ma BD, j'ai écris Donnay P. et Donnay P , il ne le compte pas car il n'y a pas de point

Enfin un autre problème sera de savoir distinguer un auteur cité 3 fois mais qui en réalité ne revient qu'une fois car on citait son nom pour 2 autres de ses articles (la 2° colonne permettant cette distinction). Manuellement, c’est possible mais ça me prendra énormément de temps.
 

Catrice

XLDnaute Barbatruc
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Bonsoir,

C'était bien là l'objet de ma précédente question ...

1. Comment distinguer les mots mal orthographiés
Là c'est un peu mission impossible ;) à quels criteres penses tu ?
Pour Donnay, faut il tester Donay et d'autres erreurs eventuelles.
Rien que de dire à une macro de tester les doubles consonnes, c'est tout un programme (c'est le cas de la dire ;))
Puis les Williamson vs William et Donaldson vs Donald on trucs dans ce genre.

2. Idem pour les points. Si dans ma BD, j'ai écris Donnay P. et Donnay P , il ne le compte pas car il n'y a pas de point
Et s'il y a des homonymes Donnay Paul et Donnay Pierre ?
Mais à la limite gérer le point c'est facile. Il faudra sans doute gérer le "-" ou autre caracteres ...

Enfin un autre problème sera de savoir distinguer un auteur cité 3 fois mais qui en réalité ne revient qu'une fois car on citait son nom pour 2 autres de ses articles (la 2° colonne permettant cette distinction).
Si on arrive à les compter, comment doit on les dédoublonner ?...
Pas bien compris l'histoire de la 2eme colonne...

Il y a une chose qu'on peut faire, c'est enlever tous les caracteres de controle.
Càd => Jensen M.C., W. Meckling devient Jensen MCWMeckling et on compare les chaines.
Mais valable si on n'a pas ...
Jensen M.C., W. Meckling
et
Jensen M.C., William Meckling
... à comparer ;)
 
Dernière édition:

philleg

XLDnaute Nouveau
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

1. Pour les mots mal orthographiés, je pensais à tous les cas de figures car j'ai encodé manuellement chacune des données et j'ai peut être tapé une fois donnay ou donay. Pour bien faire, il faudrait une macro qui repère 90 pourcent d'un mot et peut être utiliser ta méthode qui est d'enlever les caractères de contrôle et peut être même les initiales car parfois pour un même auteurs ils indiquent son 1° prénom mais aussi son 2° example de Jensen M.C. VS W. Meckling.

S'il n'y a pas de solution, je vais manuellement essayer de voir les fautes de frappes.
Ce que tu m'as proposé avec les espaces m'aide déjà beaucoup dans cet exercice.

2. Les homonymes seront repérés par la 2° et 3° colonne. (cf le fichier que j'ai envoyé comme exemple, date et diffuseur)

3. j'aimerais, à côté des auteurs identiques, connaître le nombre d'articles scientifiques qui sont identiques. En fait, c'est un critère supplémentaire qui s'ajoute. Les 3 colonnes doivent être plus ou moins identique sur les 2 feuilles (nombre de fois que le bouquin cite le même article scientifique et par conséquent l'auteur).

J'ai trouvé une macro de Roger2327 très intéressante pour cela. Cf https://www.excel-downloads.com/threads/macro-doublons-et-valeurs-uniques.115371/
mais encore une fois, si on fait des fautes de frappe ou si le livre n'écrit plus les citations comme dans l'édition précédente c'est "loupé" par le programme.


Merci et à bientôt.
 

Catrice

XLDnaute Barbatruc
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Bonjour,

J'ai vu les macro de dédoublonnage dont tu parles.
J'utilise soit les filtres soit Find.
Mais le probleme, c'est que toi ce n'est pas une macro de dédoublonage de cellule qu'il te faut mais une macro qui test les syntaxes.
Là ça se complique sérieusement car il faut demander au code d'etre "intelligent" ...
Il faut par exemple distinguer Donnay et Donay.
Mais s'il existe vraiment un Donay ?....
 

philleg

XLDnaute Nouveau
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Bonjour,

Oui voilà, c'est exactement ça. Il me faut dans un premier temps trouver une macro qui est capable de tester les syntaxes et de les repérer pour ensuite y réaliser des analyses plus fine. La fonction que tu m’avais montrée m’aide déjà beaucoup car je sais rectifier manuellement les fautes d’espaces.

Donnay était un exemple, je ne pense pas qu'il se trouve dans mes données.
 

Catrice

XLDnaute Barbatruc
Re : Compter le nombre de citations identiques dans 2 feuilles différentes

Re,

Donnay était un exemple pour moi aussi ;)
Plus généralement comment tester les doubles consonnes ?
Comment comment les tester s'il y a plus d'un mot avec double consonne dans une cellule ?
Ca fait 4 cas de figures ...:confused:

Ci-joint une macro qui gére les point, espaces et autres.
Bref, elle teste toutes les cellules de chaque cellule, enleve tous les caracteres et compare les chaines "nues".
Mais ne repere pas les lettre manquantes ou autres.
Ce code ne gere pas les accentués (le texte est en anglais on dirait) mais c'est implementable.
 

Pièces jointes

  • exemple1.xls
    44.5 KB · Affichages: 115
  • exemple1.xls
    44.5 KB · Affichages: 122
  • exemple1.xls
    44.5 KB · Affichages: 117

Discussions similaires

Statistiques des forums

Discussions
312 248
Messages
2 086 594
Membres
103 250
dernier inscrit
keks974