Comparaison de liste de nombres sur Excel par rapport a un PDF

Drazuhl

XLDnaute Nouveau
Bonjour,

Je travaille dans l'export et afin de m'assurer qu'il n'y a pas d'elements toxiques dans les produits que nous sous traitons, nous demandons a nos fournisseurs de nous envoyer la liste de tous les elements qui sont utilises pour chaque produit.

Cette Bill of Material contient le nom de chacun des elements et son CAS number (son numero de code international). Cette liste m'est fournie dans un document Excel.

Pour le moment lorsque je recois cette liste (qui peut contenir plusieurs centaines de CAS number), je dois la comparer "a la main" avec deux autres fichiers: La liste des materiaux dits SVHC (substance of very high concern) que j'ai sur Excel (mais avec parfois plusieurs CAS number dans une seule case...) et une autre liste, bien plus longue de materiaux dont certains sont des CMR (Cancerigene, Mutagene ou mauvais pour la Reproduction) et qui est sur PDF...

Pour le moment, je copie dans un premier temps la colonne des CAS number que je dois verifier, je la colle dans une nouvelle colonne et je la trie de A a Z afin de pouvoir eliminer les doublons (parceque le meme element peut etre utilise dans plusieurs parties du produit). Cela m'evite deja de devoir verifier plusieurs fois le meme element...

Mais a partir de la, la seule solution que j'ai trouve consiste a prendre chaque element, Ctrl C, Alt Tab dans le document Excel des SVHC, Ctrl F, Ctrl V et Enter. Si je ne trouve rien, j'Alt Tab a nouveau pour atteindre le document PDF et je Ctrl F a nouveau...

Sachant qu'il faut repeter presque une centaine de fois l'operation, c'est tres fastidieux...

Pour rajouter des joyeusetes, dans le fichier PDF des CMR, certains elements y existent, mais ne sont pas des CMR, simplement des produits irritants, ou inflammable,... qui ne sont pas interdits. Et certains elements sont presents 2 fois...

Est-ce que quelqu'un saurait m'expliquer comment je pourrais ameliorer mon process? Est-ce que je pourrais faire une formule qui me surlignerais automatiquement d'une certaine couleur tous les elements donc le CAS number apparait dans l'un ou l'autre des fichiers?

Ou faire un Ctrl F multiple (qui me trouverait tous les elements de la colonne d'un coup)?

Si au moins je pouvais sauter tous les elements pour lesquels je suis sur qu'ils n'apparaissent dans aucun des deux fichiers, je gagnerais beaucoup de temps. En general toute cette recherche aboutit a l'absence de produits interdits (et tant mieux!), je trouve tout au plus des traces de produits irritants ou polluants (dans des quantites infimes et legales).

C'est sans doute un peu flou et si vous avez des questions, n'hesitez pas.

Merci d'avance,

Matthieu
 

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

J'ai cherche sur google ce que tu entends par CMR data, mais je ne trouve pas, Google me conseil de chercher CRM data a la place mais ca ne m'aide pas trop...

C'est quelque chose que je dois faire depuis Excel ou depuis le PDF?
 

st007

XLDnaute Barbatruc
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Bonjour,
L'idée serait de copier les données du pdf (une autre liste, bien plus longue de materiaux dont certains sont des CMR (Cancerigene, Mutagene ou mauvais pour la Reproduction et qui est sur PDF...)

Les coller dans le fichier nouvelle colonne ou nouvel onglet(Cette Bill of Material contient le nom de chacun des elements et son CAS number (son numero de code international). Cette liste m'est fournie dans un document Excel.)

puis une macro trouvable sur ce site te fera (la seule solution que j'ai trouve consiste a prendre chaque element, Ctrl C, Alt Tab dans le document Excel des SVHC, Ctrl F, Ctrl V et Enter. Si je ne trouve rien, j'Alt Tab a nouveau pour atteindre le document PDF et je Ctrl F a nouveau...)
 

CISCO

XLDnaute Barbatruc
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Bonsoir

Je me suis fait un petit tableau dans Word, que j'ai sauvé en pdf. Je l'ai copié, puis collé dans Excel.

Après, deux petites mises en forme conditionnelles, avec NB.SI( ) >0 et hop...

Dis nous si cela va dans la bonne direction, ce qui va, ne va pas...

@ plus
 

Pièces jointes

  • Drazuhl.xlsx
    10.5 KB · Affichages: 85
  • essais CMR.pdf
    82 KB · Affichages: 92

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Hello,

Merci pour les reponses.

Ca va effectivement bien dans le bon sens. C'est exactement ce dont j'ai besoin. Si j'en arrive a ce stade, il restera sans doute un ou deux details pour ameliorer le tout, mais ca serait deja super.

Mon probleme maintenant c'est de reussir a exporter mon tableau...

Si vous voulez jeter un coup d'oeuil au PDF, il est ici:

http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2008:353:0001:1355:FR:PDF

A partir de la page 340 le tableau commence...

La quatrieme colonne est celle des Cas number qui m'interessent. Et dans la 5eme il y a les infos qui m'interessent (si c'est ecrit Flam. Gas 1, Press. Gas, Acute Tox. 2 etc... ca ne m'interesse pas mais si c'est ecrit Carc. 1B, Muta. 1A ou Repro. 1A par exemple, ca veut dire que le produit est un CMR).

Est ce que vous savez me dire comment exporter ce tableau dans Excel?

Et tant qu'a faire je vous mets en PJ le fichier excel (REACH) d'ou je retire ma deuxieme liste a verifier (les SVHC). La pour le coup c'est plus simple, mais si je fait simplement un copier coller de la colonne ou il y a les Cas Number, comme il y a des cases avec plus d'un chiffre, est ce que votre formule NB.SI( ) >0 va marcher?

Je vous mets meme un exemple de BOM (le fichier que je dois verifier) pour que vous ayez toutes les infos en main.

Merci beaucoup,

Matthieu
 

Pièces jointes

  • REACH 01.xlsx
    39.6 KB · Affichages: 128
  • Example BOM.xls
    52 KB · Affichages: 128

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

C'est pas mal du tout ca! Comment as tu exporte les donnees? J'ai essaye avec l'import de texte mais c'etais eclate de partout et ca melangeais les colonnes.

Si je peux obtenir ce type de fichier mais avec toutes les donnees (de la premiere a la derniere ligne du tableau), ensuite en appliquant ta formule (qu'il faut encore que je comprenne, dans ton fichier je ne vois pas ou tu l'a mis, mais maintenant que je sais que ca existe je vais essayer de trouver sur le forum comment faire), eh bien je pense que ca sera parfait!

Une question, dans le fichier exporte, il y a quelques cases ou il y a un chiffre apres le CAS Number, et meme parfois il y a 2 CAS number dans une seule case, par exemple:

10102-44-0 [1]
10544-72-6 [2]

Est ce que si dans ma liste a verifier il y a par exemple ce numero 10102-44-0, et que dans la liste de l'excel il y a ces 2 numero + le [1] [2], ca le reconnaitra quand meme ou non?

Merci
 

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Bon, j'ai fait quelques recherches et essais et j'ai un peu avance.

Deja j'ai compris qu'il ne fallait pas chercher de formule dans les cellules, c'est du formatage conditionel, j'ai compris ou ca se trouve. J'ai meme trouve l'equivalent anglais de NB.SI (countif).

Le fichier que st007 a exporte n'est pas entierement clean, il se comporte un peu bizarement. Par exemple si j'essaye de copier juste les colonnes H et J (qui m'interessent) dans un autre fichier, ca deconne completement au niveau du formatage. Et si je travail dans son fichier (en important ma liste de nombres a verifier) il faut que je trafique ma formule pour qu'elle marche. En gros je ne peux pas selectionner juste la colonne H, il faut que je selectionne tout le tableau importe (de A a V).

Ce qui est bizarre aussi c'est que les formules de Cisco commence a la deuxieme ligne en general (A2 dans cet exemple):

=COUNTIF($C$2:$D$9,$A2)>0

Mais si moi j'essaye de faire un tableau ideantique et que je copie la structure de cette formule, mes cases colorees sont decallees d'une celule. Alors que si j'ecris l'equivalent mais au lieu de $A2 j'ecris $A1, ca marche...

Bref ca ne pose pas de probleme mais c'est etrange.

Je vous attache le fichier que j'ai tripatouille, a priori ca fonctionne!

Il me reste donc 2 choses a regler:

-Comment exporter l'integralite du PDF en excel? st007 si tu pouvais m'expliquer ca serait top.

-Comment regler le probleme des CAS number du pdf qui s'importent avec un [1] ou [2]. J'ai fait le test dans le fichier ci-joint, ca ne fonctionne pas si ces chiffres sont la... Alors bon a priori il doit y avoir qu'une centaine de nombres concernes, au pire je les enlevent une fois a la main (avec un Ctrl-f all, ca ne prendra pas trop trop de temps).
Il y a aussi le probleme sur la liste REACH (pour chercher les SVHC). Sur cette liste, il y a regulierement plusieurs nombres par cellule.
Encore une fois, a moins que vous n'ayez une solution magique, je peux les separer a la main, ca ne concerne pas enormement de lignes.

Par contre si jamais il y a une difference du genre un espace avant ou apres le nombre, est ce que la formule le reconnaitra quand meme?
Le but c'est d'automatiser et d'accelerer le process, mais si a cause d'un espace je laisse passer des choses ca va poser probleme...

En tout cas ca me permettra de gagner pas mal de temps je n'aurai besoin de checker que les cellules colorees.

Si vous avez une idee lumineuse pour pouvoir accellerer ce process (utiliser la fonction Filtre par couleur dans le tableau cause probleme a cause des cellules merges) je suis preneur, mais sinon ca sera deja bien comme ca :)


Merci pour votre aide en tout cas.
 

Pièces jointes

  • Test Formule.xlsx
    281.3 KB · Affichages: 65
  • Test Formule.xlsx
    281.3 KB · Affichages: 76
  • Test Formule.xlsx
    281.3 KB · Affichages: 76

CISCO

XLDnaute Barbatruc
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Bonjour

J'ai aussi vu qu'on ne pouvait pas importer une seule colonne facilement du fichier pdf vers le fichier Excel. J'ai été forcé de copier "tout" le tableau pdf. Malheureusement, je n'ai pas trouvé le "collage spécial" le mieux adapté à la situation, qui permettrait de reconstituer facilement toutes les colonnes, pour ensuite supprimer celles qui sont inutiles. Quel séparateur faut-il utiliser (espace, retour à la ligne...) ? De plus, comme certaines fois il y a plusieurs nombres dans une seule cellule, cela pose problème. Idem si il y a des espaces en trop comme tu le remarques. Je ne vois pas non plus comment on pourrait faire avec une macro, car là aussi, il faut trouver le séparateur pertinent.

Pour ce qui est du décalage par rapport à A1 ou A2, ce n'est vraiment pas très important. Lorsqu'on aura un peu plus avancé sur le sujet, on arrangera tout ça. Le plus important, c'est cette histoire de colonne à importer ou à reconstituer le plus facilement possible dans Excel.

Pour le moment, je ne peux pas t'aider davantage.

@ plus
 

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Est ce que vous pourriez me dire comment vous reussissez a au moins obtenir un tableau du type de celui de st007?

Parceque quand j'importe ca eclate vraiment le tableau partout. Au moins celui de Cisco, meme si on ne peux pas separer les colonnes, je peux l'utiliser pour colorer les cellules. Ensuite meme je peux les retrouver a la main, ca me fait deja bien gagner du temps.
 

st007

XLDnaute Barbatruc
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Bonjour,

j'ai exporter du pdf vers excel depuis adobe pro XI, visuellement, çà retranscrit la mise en page, mais beaucoup de cellules sont fusionnées et comportent des retours à la ligne

Pour les fusions horizontales, on copie colle les colonnes par 2 (ab;cd;ef;gh;ij;etc...)

pour traiter les 1000 pages du pdf, va falloir un ordi de compétition sans parler du poids du fichier excel
mon fichier excel ne reprend que les 100 premières pages et j'ai déjà près de 2000 lignes
 
Dernière édition:

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Hello,

Depuis Adobe Acrobat Reader ou depuis la version payante?

Si c'est depuis Acrobate Reader je veux bien une explication. Si c'est depuis la version payante, est ce que tu pourrais m'envoyer le fichier exporte complet? A cause de la limite de taille de fichier tu n'as pas pu mettre toute la liste sur le forum, mais ca me serait bien utile :)

Merci!
 

st007

XLDnaute Barbatruc
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

C'est depuis adobe acrobat Pro XI, normalement payante mais ...
j'ai lancé l'export sur les 1000 pages, mais hier çà plantait, je persévère.

de ce fichier pdf, tu gardes quelles colonnes précisément ?
 

Drazuhl

XLDnaute Nouveau
Re : Comparaison de liste de nombres sur Excel par rapport a un PDF

Ce qui m'interesse c'est la colonne: Numero CAS et celle juste a coste: Code(s) des classes et catégories de danger

Donc par rapport au fichier que tu as exporter hier c'etait les colonnes H et J.

J'imagine que pour exporter 1000 pages ca doit prendre du temps :/
 

Discussions similaires

Statistiques des forums

Discussions
312 196
Messages
2 086 085
Membres
103 116
dernier inscrit
kutobi87