Microsoft 365 Croisement de 2 fichiers, identification d'occurrences et matching

FlorianD4c

XLDnaute Nouveau
Bonsoir a tous,

Me voici bloqué sur un besoin un peu particulier mais du moins complexe pour moi.

Je vous serai énormément reconnaissant de m' apporter votre aide...

Voici le contexte;

Aujourdhui j'ai 2 fichiers distincts

Un premier admettons avec 150 000 lignes d'URL web sous format classique exemple : "http//:www.michelin.com"

Un second de 130 000 lignes d'Url qui ont été validées par une machine (d ou le delta avec le comptage precedent (url non fonctionnelles en moins). A savoir que ces lignes ne sont pas dans le même ordre que le premier fichier (cela serait trop facile)

La machine me fourni en sortie sur les URL des modèles comme par exemple: "http://www.michelin.com "0" , "ok" , "permantenly moved" etc.

Connaîtriez vous une formule ou quelconque moyen me permettant de un de faire un lien d occurence entre le premier Url et le Second, et de deux de situer le deuxième URL sur la même ligne que le premier? Dans un fichier regroupant les 2 tables de manière organisée ?

Merci par avance
 

FlorianD4c

XLDnaute Nouveau
ex.PNG
ex2.PNG
 

chris

XLDnaute Barbatruc
Bonjour

On se calme ! On est des bénévoles, ni des robots ni une hotline !

Je pars, donc une solution vite faite, sans doute améliorable. Pas compris s'il fallait aussi extraire l'état...

Pas eu le temps de changer le chemin. J'expliquerai en fin de matinée
 

Pièces jointes

  • Fichier_1_Sites_Internet2.xlsx
    29.4 KB · Affichages: 8
Dernière édition:

FlorianD4c

XLDnaute Nouveau
Bonjour

On se calme ! On est des bénévoles, ni des robots ni une hotline !

Je pars donc une solution vite faite, sans doute améliorable. Pas compris s'il fallait aussi extraire l'état...

Pas eu le temps de changer le chemin. J'expliquerai en fin de matinée

Hello back @chris , j'ai consulté ton fichier test, qui correspond en tout point à mon besoin (colonne D vide lorsque aucune correspondance, et matching des lignes sur base des occurrences présentes). Je n'ai pas besoin de plus ! Peux-tu m'indiquer la marche à suivre ? Merci encore !
 

chris

XLDnaute Barbatruc
RE

Fichier modifié ci joint

J'ai ajouté 2 cellules nommées pour changer chemin et fichier et amélioré l'approche

Les données de l'onglet feuil1 sont mises sous forme de tableau, et le tableau nommé Data (plutôt que Tableau1)

Depuis une cellule de ce tableau, Données A partir d'un Tableau ce qui lance PowerQuery
La requête listée à droite porte le nom du tableau et à gauche on a deux commandes déjà faites : Source et Type modifié
On sélectionne la colonne Sites Internet et clic droit, Fractionner par délimiteur, choisir / et le plus à droite (ceci pour éliminer les / qui traîne parfois en fin d'URL). On corrige le nom de la 1ère colonne dans la barre de formule et on supprime l'autre colonne

On laisse Data en attente et
Accueil, Nouvelles source, Fichier, Excel, choisir le classeur et Feuil1 : ce qui crée la seconde requête
Si on veut utiliser chemin et fichier variables on utilise Accueil, Editeur Avancé et on remplace la ligne Source par
VB:
    FSource=Table.FirstValue(Excel.CurrentWorkbook(){[Name="Chemin"]}[Content]) &Table.FirstValue(Excel.CurrentWorkbook(){[Name="Fichier"]}[Content]), 
    Source = Excel.Workbook(File.Contents(FSource), null, true),
ensuite
Transformer, Utiliser la 1ère ligne comme en-tête
Ajouter une colonne, Colonne personnalisé : nommée SiteValidé, formule =Text.BeforeDelimiter([Sites Validés],"/,")
supprimer ancienne colonne
Ajouter une colonne, Colonne personnalisé : nommée SiteValidé2, formule =Text.AfterDelimiter([SiteValidé],"http://")

On revient à Data :
Accueil, fusionner les requêtes, choisir Feuil1 comme 2ème table, correspondance Sites internet avec SiteValidé2, jointure externe gauche
Clic sur double flèche près du titre de colonne Feuil1 : choisir SiteValidé

Sortir par Fermer et Charger dans, Tableau
 

Pièces jointes

  • Fichier_1_Sites_Internet3.xlsx
    31.1 KB · Affichages: 9

chris

XLDnaute Barbatruc
Re

Oui tu peux envoyer mais avec le classeur que j'ai donné tu peux supprimer les données du classeur (supprimer les ignes du tableau mais pas les titres), et copier coller celles de ton classeur.

Saisir le chemin et nom de fichier du second classeur et utiliser Données, Actualiser Tout.

Si ça coince, poste tes fichiers ou, si trop lourds, met sur cjoint ou équivalent avec un mot de pass que tu envoies en MP
 

Discussions similaires

Statistiques des forums

Discussions
311 729
Messages
2 081 970
Membres
101 852
dernier inscrit
dthi16088