R² pour régression linéaire forcée par zéro

Sheldor

XLDnaute Occasionnel
Supporter XLD
Bonjour,
désolé par avance si j'ai mal cherché mais je ne trouve pas comment faire pour avoir dans une cellule le R² d'une régression linéaire si je force la courbe par zéro.
sur le graph j'ai une valeur, dans mon calcul... une autre...
voir pj

grand merci d'avance

nico
 

Pièces jointes

  • regression.xls
    20 KB · Affichages: 98
  • regression.xls
    20 KB · Affichages: 115
  • regression.xls
    20 KB · Affichages: 97

Dranreb

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Bonjour.
Curieux. À force de tout sortir à coté dans des formules matricielles, avec des dollars, le problème a subitement disparu, il m'a suffit de revalider la formule en D15 pour qu'elle trouve le même résultat que dans le graphique.
 

Misange

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Bonjour

Je viens de faire quelques tests et je trouve effectivement comme toi nicopec. Je n'avais jamais fait attention à cela.

A vrai dire, je me demande si le coeff de corrélation a le moindre sens mathématique quand on impose que b=0.
Je vais peut être bien dire une bêtise, et Dranreb corrigera :
Ca revient à dire qu'on donne à un point (0,0) un poids plus important que celui de tous les autres.
Or dans le calcul du coeff de variation tous les points ont la même valeur
r²=cov(X,Y)/racine(Var(X)*Var(Y))
Et je n'arrive pas à voir comment excel calcule ni le R² renvoyé par la formule, ni celui renvoyé par le graphique !
et en tous cas quelles que soient les valeurs de x et de y utilisées les deux diffèrent.
 

Sheldor

XLDnaute Occasionnel
Supporter XLD
Re : R² pour régression linéaire forcée par zéro

Bonjour Misange,
merci pour ta réponse.

dans "mon" cas, j'ai une comparaison de deux méthodes qui me donnent des résultats x et y, je n'ai pas de raison "a priori" de penser qu'il y a un coefficient b (y=ax + b) donc je force par zéro (je suis ce qu'on m'a dit...)
si les deux méthodes donnent le même résultat mon a =1, ou s'en approche mais le R²....

effectivement je ne trouve pas non plus comment il fait son calcul, au pire je pourrais le faire moi même si j'avais la méthode...

à bientôt
 

Misange

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Bien vu, je mets de côté ce lien. Les développeurs de MS ont parfois des idées bien à eux sur certains points...
Pour info dans 2013 ce problème n'est pas corrigé et je doute qu'il le soit jamais. Ca n'intéresse que les scientifiques alors... ça ne rapporte pas assez !
 

MJ13

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Bonjour à tous


Merci à Nicopec :) pour ce problème très intéressant mais qui me pose des soucis si on veut faire des régressions :(. En effet, comment savoir si il faut prendre la valeur R² de formule ou celle du graphique?

J'ai repris ton exemple dans le fichier joint et j'ai pu calculer le R avec la formule trouvée sur le Net sans passer par 0. Mais comment peut-on le calculer en passant par 0?

Merci d'avance.
 

Pièces jointes

  • RegressionLinéaireCoefficientdeCorrélation.xls
    260.5 KB · Affichages: 70
Dernière édition:

Sheldor

XLDnaute Occasionnel
Supporter XLD
Re : R² pour régression linéaire forcée par zéro

bonjour MJ13
oui je pense qu'on peut vite se planter sans s'en apercevoir, si on ne tombe pas sur un R² négatif on aurait vite tendance à faire confiance au résultat...

j'ai commencé à faire des exports de mes données (j'ai des dizaines de R² à calculer) pour les analyser avec un logiciel de stat, dans l'aide j'ai des infos sur la méthode de calcul:

Some users are puzzled when they see a model without a constant having a higher multiple correlation than a model that includes a constant. How can a regression with fewer parameters predict "better" than another? It doesn’t. The total sum of squares must be redefined for a regression model with zero intercept. It is no longer centered about the mean of the dependent variable. Other definitions of sums of squares can lead to strange results, such as negative multiple correlations. If your constant is actually near 0, then including or excluding the constant makes little difference in the output. Kvålseth (1985) discusses the issues involved in summary statistics for zero-intercept regression models. The definition of R2 used in SYSTAT is Kvålseth’s formula 7. This was chosen because it retains its PRE (percentage reduction of error) interpretation and is guaranteed to be in the (0,1) interval.

je ne suis pas allé plus loin j'avoue...je ne trouve pas la formule sur le net pour le moment...
 

Misange

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Au delà de la méthode de calcul, je pense que le plus important c'est de s'interroger sur la raison de choisir une régression avec y=ax plutot que y=ax+b ...
Si vraiment la relation entre x et y rend logique que b=0, alors l'équation devrait trouver une valeur très proche de 0 (qu'on peut éventuellement négliger). Si ce n'est pas le cas, il faut s'interroger sur la façon dont les valeurs de Y ont été acquises aux faibles valeurs de X (sensibilité et fiabilité de la machine ou de l'individu ayant fait la mesure, reproductibilité dans les faibles valeurs, au contraire pb dans les fortes valeurs... les causes sont multiples).
Encore une fois on retombe sur le même débat : il ne faut pas juste appliquer une formule mais savoir pourquoi on a choisi celle-ci et pas une autre et quelle est la limite de l'interprétation des données obtenues.

Le coeff de régression de toutes façons n'est pas une valeur qui admet une interprétation binaire "bon" "pas bon". Suivant ce qu'on regarde, un r² de 0.6 peut être excellent et un de 0.986 parfaitement inacceptable.
 

MJ13

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Re, Bonjour misange

Au delà de la méthode de calcul, je pense que le plus important c'est de s'interroger sur la raison de choisir une régression avec y=ax plutot que y=ax+b ...

Euh, moi, je me pose quand même une question: si on a 2 résutats, je préférerai quand même avoir le même entre le graphique et le calcul. Je ne m'en étais jamais rendu compte mais c'est quand même un bug très génant . Cela veut dire qu'on ne peut plus faire confiance à Excel et d'être oligé de refaire tous les calculs à la main. Bonjour le temps perdu :(.

D'ailleurs, si tu pouvais me dire lequel il faut prendre, et comment le calculer, cela m'arrangerai un peu :).
 
Dernière édition:

Misange

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Le problème ne se pose QUE quand tu forces b=0
quand tu utilises l'équation normale tu as exactement les mêmes valeurs. A l'affichage, suivant le nb de chiffres après la virgule choisi dans le graphique tu peux avoir visuellement une différence et quand tu as besoin d'une vraie valeur il faut toujours la calculer avec la formule.
Maintenant pour le r² quand tu forces b=0, je ne sais pas répondre, je ne comprends pas comment sont calculées ces deux valeurs et mes compétences en maths pures sont trop loin derrière moi pour que j'aie envie de me plonger dans les liens cités par Nicopec !
 

Sheldor

XLDnaute Occasionnel
Supporter XLD
Re : R² pour régression linéaire forcée par zéro

en pj, ce que j'obtiens par le logiciel de stat en question pour l'exemple de données en colonne A et B
si je ne me suis pas planté la pente correspond à celle du graph, quant au R²... aucun rapport

de toute façon si excel arrive à des carrés négatifs ....
 

Pièces jointes

  • resultat_reg.xls
    20.5 KB · Affichages: 86

Dranreb

XLDnaute Barbatruc
Re : R² pour régression linéaire forcée par zéro

Bonjour.
J'ai rouvert le classeur d'origine, revalidé la formule : il m'a immédiatement sorti 0,75081761
Mais je ne sais plus si j'avais eu ça la première fois. J'avais commencé par :
VB:
=DROITEREG($B$7:$B$11;$A$7:$A$11;0;1)
validé en matriciel Ctrl+Maj+Entrée sur une plage de 3 lignes 2 colonnes. Qu'est-ce que ça donne chez vous ?
Moi j'obtiens:
13,57836990
1,40665424#N/A
0,7508176150,247296
 

Discussions similaires

Réponses
1
Affichages
591