Autres importer des donnees pdf via excel

maguie

XLDnaute Junior
Bonjour,
Je souhaiterais importer des données pdf (sélection dans un fichier) et les mettre sous forme ordonnées dans un tableau Excel.
Exemple : facture format pdf avec numéro client, adresse, montant ttc , montant ht, tva via un classeur excel.
Je dispose d' Acrobat Reader DC. Il existe des macro qui peuvent par l'intermédiaire référence bibliothéque manipuler les logiciels externes.
Une personne pourrait elle me mettre sur une piste,
Par avance merci
 

kiki29

XLDnaute Barbatruc
Re, j'ai retrouvé ceci, à voir et adapter si besoin à ton contexte.

Acrobat : Copie Texte d'un fichier Pdf dans une feuille Excel

XPDF (gratuit ) Voir ici : Version 3.04 des outils XPDF
Ces fichiers ont été masqués par le Belge ou ses mignons de couchette le 20 mars 2020

A décompresser via 7Zip
32 bits : xpdfbin-win-3.04-(1)
64 bits : xpdfbin-win-3.04-(2)

Ces applis m'ont permis de traiter 6700 fichiers pdf ( 1.7 Go au total, dans 3 présentations différentes ) d'une base Kompass pour en extraire autour de 638 000 entreprises avec uniquement les infos utiles. Cette procédure étant loin d'être une sinécure et reste à la charge de l'utilisateur.

A moins qu'il ne faille de l'OCR ? Ce qui est possible car le format PDF est un format composite.

Remarque 1 : Sauvegarde en Texte avec Acrobat et Acrobat Reader
Remarque 2 : pour Reader 10 + : concernant menu Edition/Préférences catégories

Je conseille XPDF ( 32 ou 64 bits ) nettement plus véloce qu'Acrobat ou son Reader

Étant définitivement fâché avec le Belge et ses mignons de couchette de Developpez.com, j'ai supprimé l'ensemble des téléchargements ( 110 au bas mot ), d'où les liens internes de téléchargement caduques. Ces téléchargements sont toujours disponibles sur mon PC, si quelqu'un en fait la demande.
 

Pièces jointes

  • xpdfbin-win-3.04(x).png
    xpdfbin-win-3.04(x).png
    25.5 KB · Affichages: 99
Dernière édition:

kiki29

XLDnaute Barbatruc
Salut, pour XPDF en version 3.04 voir ici. L'exe pdftotext doit être placé à la racine de l'appli XLS.
Par commodité je l'ai rebaptisé pdftotext32.exe qui se retrouve dans la ligne sCheminAppli = ThisWorkbook.Path & "\" & "pdftotext32.exe" de l'appli XLS. Ils ont été compressés via 7zip

XPDF en version 3.04
Ces fichiers ont été masqués par le Belge ou ses mignons de couchette le 20 mars 2020.

A décompresser via 7Zip
32 bits : xpdfbin-win-3.04-(1)
64 bits : xpdfbin-win-3.04-(2)

Il te restera à intégrer à la procédure générale Pdf2Txt une procédure pour ne conserver que les données jugées utiles, cela n'est pas toujours une sinécure. Cela reste ( et de très loin ) la plus véloce / Acrobat et Acrobat Reader.
 

Pièces jointes

  • Pdf2Txt_05_Fichiers.jpg
    Pdf2Txt_05_Fichiers.jpg
    221.8 KB · Affichages: 149
  • Pdf2Txt_05_Fichiers.zip
    39.4 KB · Affichages: 64
Dernière édition:

kiki29

XLDnaute Barbatruc
Re, une version light XPDF via le presse-papier.
Il te restera à intégrer à la procédure générale Pdf2Txt une procédure pour ne conserver que les données jugées utiles, cela n'est pas toujours une sinécure, et une autre pour la sauvegarde de la feuille Extraction dans un fichier texte ou autre.

A décompresser via 7Zip
32 bits : xpdfbin-win-3.04-(1)
64 bits : xpdfbin-win-3.04-(2)
 

Pièces jointes

  • Pdf2Txt_Clipboard_05.jpg
    Pdf2Txt_Clipboard_05.jpg
    349.8 KB · Affichages: 126
  • Pdf2Txt_Clipboard_05.zip
    35 KB · Affichages: 43
Dernière édition:

kiki29

XLDnaute Barbatruc
Re, une autre via Acrobat Reader, la plus lente et de loin car via des SendKeys, avec des ajustements de timer à faire suivant les fichiers à traiter .....
Il te restera à intégrer à la procédure générale Pdf2Txt une procédure pour ne conserver que les données jugées utiles, cela n'est pas toujours une sinécure.

VB:
Private Sub Pdf2Txt()
.....
Const Tempo As Long = 750
.....
End Sub
 

Pièces jointes

  • Pdf2Xls_02.jpg
    Pdf2Xls_02.jpg
    256.2 KB · Affichages: 176
  • Pdf2Xls_02.zip
    54.5 KB · Affichages: 66
Dernière édition:

Discussions similaires

Réponses
11
Affichages
3 K

Statistiques des forums

Discussions
311 733
Messages
2 082 019
Membres
101 872
dernier inscrit
Colin T