Extraire données html vers une base de données Excel

besdu06

XLDnaute Nouveau
Bonjour !

J'ai plusieurs documents ayant la meme structure (car issus d'un même site). Je voudrais extraire certaines données vers une base de données Excel. La difficulté c'est que j'ai 1000 fichiers html!! Je dois trouver le moyen d'extraire ces informations de tous ces fichiers automatiquement avec par exemple une macro VBA. Voici les informations que je voudrais extraire:

-nom de l'entreprise
-date création
-forme juridique
-capital social
-siret
-etablissement secondaire ( ou siège social)
-adresse
-RCS
-Etablissement(s) (nombre)
-Fonction
-nom
-date de naissance
-lieu de naissance

En pièce jointe (web.zip) vous pourrez m'aider à traiter le premier échantillon.^^

Ensuite j'ai exactement le meme travail à faire avec une autre structure de fichier html issus d'un autre site internet. Il faudrai que j'arrive à importer les données suivantes dans un fichier excel:

-siret
-adresse
-région
-forme juridique
-capital
-date de création
-activité
-effectif
-etablissement(s)
-type
-total du bilan
-ca net
-résultat net

En pièce jointe se trouve un échantillon de ces fichiers (web2.zip).

J'ai vraiment besoin d'aide, ce projet gais l'objet de ma soutenance en stage qui arrive prochainement...
Je vous remercie d'avance.
Bes.
 

Pièces jointes

  • web.zip
    102.7 KB · Affichages: 130
  • web2.zip
    147.1 KB · Affichages: 69
  • web.zip
    102.7 KB · Affichages: 91
  • web2.zip
    147.1 KB · Affichages: 70
  • web.zip
    102.7 KB · Affichages: 94
  • web2.zip
    147.1 KB · Affichages: 78

MJ13

XLDnaute Barbatruc
Re : Extraire données html vers une base de données Excel

Bonjour Besdu06

Voici un exemple de ce que tu peux commencer à faire. J'ai pris 3 colonnes. Il faudra trouver les paramètres pour les autres.

Tu peux utiliser le Dir_Dossier5.xls pour générer la liste des fichiers.

Bon courage :).
 

Pièces jointes

  • Recuperation_Donnees_HTML.xls
    90.5 KB · Affichages: 307

besdu06

XLDnaute Nouveau
Re : Extraire données html vers une base de données Excel

En voyant comme ca sa parait vraiment simple!!!

Mais quand j'ai essayé de voir les trois macros que tu as fait, j'ai du mal à savoir ou je pourrait ajouter les autres paramètres pour les remplir...pourrai tu (si c'est trop long à faire^^) m'indiquer comment faire please?

Pour le cas du dossier web2.zip, pourrai je utiliser la même macro ou faut il en créer une?

En ce qui concerne Dir_Dossier5.xls j'ai essayé mais ça ne marche pas avec ces nouvelles pages html, je sais po pourquoi...

Je vais encore abuser de ton savoir faire mais sa m'aiderai bcp si tu pouvais me faire les deux types de documents ;), si je m'y attaque je crois que je vais passer un weekend horrible! Alors que toi en deux deux tu pourrai me le faire...;)

Voilà tout
Merci d'avance ^^

Bes
 

MJ13

XLDnaute Barbatruc
Re : Extraire données html vers une base de données Excel

Re

Mais quand j'ai essayé de voir les trois macros que tu as fait, j'ai du mal à savoir ou je pourrait ajouter les autres paramètres pour les remplir...pourrai tu (si c'est trop long à faire^^) m'indiquer comment faire please?

Il faut regarder la page Récup, tout est indiqué dedans (voir les commentaires en colonne1).

En ce qui concerne Dir_Dossier5.xls j'ai essayé mais ça ne marche pas avec ces nouvelles pages html, je sais po pourquoi...

Sans doute les mystères de l'informatique. Sinon, copie déjà quelques liens de ton C:\ pour faire le test (il faut toujours commencer petit :eek:).
 

MJ13

XLDnaute Barbatruc
Re : Extraire données html vers une base de données Excel

Re

Bon, c'est vrai que ce n'était pas très clair :confused:.

Voici la version pour le Web1, pour le Web2, je te laisse chercher un peu (plus trop le temps :eek:).
 

Pièces jointes

  • Recuperation_Donnees_HTMLWeb1.xls
    91.5 KB · Affichages: 352

besdu06

XLDnaute Nouveau
Re : Extraire données html vers une base de données Excel

Bonjour MJ13 ^^

Effectivement avec les échantillons du fichier web1 et pour le reste des fichiers, cela fonctionne très bien :)

Comme tu me l'a conseillé j'ai essayé de faire le meme travail pour web2.
Avant de modifier quoi que ce soit, j'ai d'abord lancer la macro.
Et j'ai eu le soulignement jaune sur ces instructions là:


With ActiveSheet.QueryTables.Add(Connection:= _
"URL;file:///" & nomLien(p) & "", Destination:= _
Range("$A$1"))

Par contre je ne sais pas comment modifier cette instruction :confused:

Merci de ton aide ^^
Bes
 

Discussions similaires

Statistiques des forums

Discussions
312 381
Messages
2 087 830
Membres
103 667
dernier inscrit
datengo