Récupération de données sur différents site web

SkyCorp

XLDnaute Junior
Bonjour à tous,

Je cherche à me constituer une base de données sur Excel, voire Access, listant toutes les sociétés et me donnant des informations les concernant, la recherche s'effectuant suivant 2 critères : le code APE (ou NAF, c'est pareil) et le département.
Problème : bien que j'ai déjà passé pas mal de temps à apprendre à utiliser VBA, je n'ai pas beaucoup d'opportunités pour m'entrainer, ce qui fait que je suis encore novice et je bloque sur comment faire.
Je sais qu'il faut étudier l'architecture du site internet, mais ça s'arrête là et j'espère que vous pourrez me venir en aide assez rapidement.

Voici les sites qui me permettent de réaliser cette recherche :
  • alsaeco.com : Listing des sociétés + quelques infos. Avec les variables num_departement et codeAPE, on peut accéder directement au listing des sociétés par ce lien : "http://www.alsaeco.com/entreprises/recherche.html?aeadirectoryParam[raison]=&aeadirectoryParam[siret]=&aeadirectoryParam[siren]=&aeadirectoryParam[commune]=&aeadirectoryParam[departement]=" & num_departement & "&aeadirectoryParam[dirigeant]=&aeadirectoryParam[ape]=" & codeAPE & "&aeadirectoryParam[submit]=Rechercher"
    Par contre, il n'y a que 10 sociétés par page, il faut donc naviguer au fur et à mesure, et il faut ouvrir à chaque fois une nouvelle page pour avoir les infos de chaque société
  • societe.com : comme ci-dessus. La page avec le listing des sociétés est accessible depuis ce lien : "http://www.societe.com/cgi-bin/liste?nom=&dirig=&pre=&ape=" & codeAPE & "&dep=" & num_departement
  • verif.com : comme ci-dessus. A noter, je peux sélectionner les mêmes critères mais l'adresse du listing des sociétés ne reprend pas les 2 variables ci-dessus (codeAPE et num_departement)
  • infogreffe.fr : pas de listing, il faut préciser ici le nom de la société ou son numéro SIREN dans la barre de recherche
  • pagespro.com : idem que pour le site infogreffe
  • pagesjaunes.fr ou encore pagesjaunespro : pagesjaunespro permet d'accéder à un listing de sociétés en fonction des 2 critères et pagesjaunes.fr permet d'avoir plusieurs fiches pour la "même" société, avec des infos différentes (ex : les horaires apparaissent sur certaines fiches mais pas sur toutes)
  • bilansgratuits.fr : permet d'avoir des infos en fonction du numéro SIREN
  • lentreprise.lexpress.fr/palmares-entreprises/ : permet d'avoir des infos en fonction du nom de la société

J'avais commencé à faire ça manuellement avec le 1er site, en collant sur Excel la page pour une société puis en y recherchant l'info par des formules. Ca marche bien mais c'est vraiment très long à faire.
J'espère que vous pourrez me venir en aide, car c'est un projet vraiment important pour moi.

Merci d'avance
 

JCGL

XLDnaute Barbatruc
Re : Récupération de données sur différents site web

Bonjour à tous,

A la lecture de la mise en garde ci-dessous, je ne conseille pas l'élaboration d'un code d'extraction des données.
La responsabilité d'XLD serait mise en cause.

A+ à tous

Conditions générales d’utilisation du site Internet :

  • Clause de non garantie quant au contenu informationnel :
Les informations fournies sur le site ALSAECO le sont à titre informatif. La CCIR ALSACE ne saurait garantir l'exactitude, la complétude, l'actualité des informations diffusées sur le site.
  • Clause d'irresponsabilité quant à l'utilisation du site:
La CCIR ALSACE met tout en œuvre pour offrir aux utilisateurs des informations et/ou outils disponibles et vérifiés, mais ne saurait être tenue pour responsable des erreurs ou omissions, d'une absence de disponibilité des informations et des services ou de tout autre problème technique lié au réseau Internet. En conséquence, l'utilisateur reconnaît utiliser le site Internet sous sa responsabilité exclusive.
  • Propriété Intellectuelle:
Toutes les informations ou documents contenus sur le présent site, ainsi que tous les éléments créés pour le site, sont soit la propriété de la CCIR ALSACE, soit font l'objet d'un droit d'utilisation, d'exploitation et de reproduction. Ces éléments sont soumis à la législation protégeant le droit d'auteur. Par conséquent, les utilisateurs sont autorisés uniquement à consulter les informations et aucun droit n'est conféré à quiconque au regard des droits de la propriété intellectuelle.Toute reproduction, représentation, modification, publication, transmission, dénaturation, totale ou partielle du site ou de son contenu, par quelque procédé que ce soit, et sur quelque support que ce soit est interdite.Toute exploitation, non expressément autorisée par la loi, du site ou de son contenu, ainsi que des informations qui y sont divulguées, engagerait la responsabilité de l'utilisateur et constituerait une contrefaçon sanctionnée par les articles L.335-2 et suivants du Code de la propriété intellectuelle. Vous pouvez joindre le directeur de publication afin d’obtenir une autorisation d’exploitation.
 

SkyCorp

XLDnaute Junior
Re : Récupération de données sur différents site web

Bonjour JCGL,

Je n'ai nullement l'intention d'utiliser les informations présentes sur ces sites en vue d'une publication ou d'une utilisation commerciale. Toutes les informations que je recueille sont des informations publiques, et je cherche simplement à m'éviter des copier-coller fastidieux.
Quel est le problème à une telle utilisation ?
 

Discussions similaires

Réponses
3
Affichages
183

Statistiques des forums

Discussions
312 105
Messages
2 085 350
Membres
102 870
dernier inscrit
Armisa