Analyse de données

Les régressions multiples

5 min de lecture1 164 motsPublié le 18 octobre 2024

L'utilisation des régressions multiples dans les sciences de gestion permet d'analyser l'influence simultanée de plusieurs variables explicatives sur une variable dépendante. Cela est particulièrement pertinent lorsqu'on cherche à comprendre des phénomènes complexes, tels que les comportements organisationnels ou l'adoption de technologies. Dans ce contexte, la régression multiple permet de quantifier l'importance de chaque facteur et d’évaluer l'ajustement global du modèle à la réalité observée.

1. Utilisation des régressions multiples en sciences de gestion

En sciences de gestion, de nombreux modèles cherchent à expliquer des comportements comme la performance organisationnelle, la satisfaction des clients, ou l'adoption de technologies. Ces comportements sont souvent influencés par plusieurs variables, comme les ressources disponibles, la culture organisationnelle, ou encore la perception des utilisateurs. La régression multiple permet :

D’évaluer la contribution de plusieurs facteurs sur une variable d’intérêt. Par exemple, on peut évaluer l'impact de la formation des employés, de l'infrastructure technologique, et de la culture d'entreprise sur la performance organisationnelle.
De tester des hypothèses issues de modèles théoriques comme le modèle UTAUT, afin de comprendre quels sont les facteurs les plus significatifs dans un contexte donné.
D’analyser des interactions : on peut tester si l'effet d'une variable explicative dépend du niveau d'une autre variable. Par exemple, l'effet de l'effort attendu sur l'adoption d'une technologie peut varier en fonction de l'âge des utilisateurs.

2. Étapes pour appliquer une régression multiple

Définir la question de recherche : Identifier une variable dépendante que l'on souhaite expliquer et les variables explicatives qui sont susceptibles d'influencer cette variable. Dans le cadre du modèle UTAUT, la variable dépendante pourrait être l'intention d'utiliser une nouvelle technologie (Y), et les variables explicatives incluraient les déterminants principaux du modèle UTAUT (performance attendue, effort attendu, influence sociale, conditions facilitantes).
Collecte des données : À l’aide de questionnaires ou d’enquêtes, on recueille des données auprès d'un échantillon d'utilisateurs pour chaque variable du modèle. Chaque utilisateur fournirait des réponses sur les variables UTAUT (par exemple, sur une échelle de Likert de 1 à 7).
Formulation du modèle de régression multiple : Le modèle prend la forme d'une équation linéaire qui relie la variable dépendante (intention d'utiliser une technologie) à plusieurs variables explicatives.

4. Estimation des coefficients : Grâce à des logiciels comme SPSS, Excel, R ou Python, on utilise les moindres carrés ordinaires (MCO) pour estimer les coefficients β. Ces coefficients indiquent de combien l’intention d’utiliser change lorsque la variable explicative change d’une unité, toutes choses étant égales par ailleurs. 5. Interprétation des résultats : * Significativité des coefficients : Chaque coefficient est accompagné d’une p-valeur qui indique si l’effet de la variable explicative est statistiquement significatif. * Coefficient de détermination R2 : Il mesure la proportion de la variance de la variable dépendante expliquée par le modèle. Un R2 élevé signifie que le modèle explique bien la variable d’intérêt. 6. Validation du modèle : On peut tester la robustesse du modèle à l’aide d’indicateurs comme le test de colinéarité, les résidus standardisés, et l'analyse des interactions entre variables.

Lecture des résultats d'un modèle de régression multiple

Le modèle de régression suivant teste une adaptation de l'UTAUT au cas de l'intention de payer une chambre d'hôtel en cryptomonnaies.

Hypothèses	Estimations Standardisées	t	Sig.	Résultats
H1 : Utilité perçue -> Intention d'utiliser des cryptomonnaies	0,412	5,684	0,000	Validée
H2 : Facilité d'utilisation perçue -> Intention d'utiliser des cryptomonnaies	0,131	2,129	0,035	Validée
H3 : Risque perçu -> Intention d'utiliser des cryptomonnaies	-0,263	-3,79	0,000	Validée
H4 : Influence sociale -> Intention d'utiliser des cryptomonnaies	0,093	1,713	0,088	Non Validée
H5 : Attitude envers NT -> Intention d'utiliser des cryptomonnaies	0,088	1,9	0,059	Non Validée
Le test t associé à une régression multiple est une méthode statistique utilisée pour déterminer si chaque coefficient estimé (β) dans un modèle de régression multiple est significativement différent de zéro.
En d'autres termes, il permet de tester si une variable explicative a un effet statistiquement significatif sur la variable dépendante lorsqu'on contrôle pour les autres variables dans le modèle.

1. Objectif du test t dans une régression multiple

L'objectif principal du test t dans une régression multiple est de vérifier si chaque coefficient de régression associé à une variable explicative est statistiquement significatif, c’est-à-dire s’il y a une relation linéaire significative entre la variable explicative et la variable dépendante. Si le coefficient associé à une variable n'est pas significatif, cela signifie que la variable explicative n'a pas d'impact mesurable sur la variable dépendante (en tenant compte des autres variables explicatives).

2. Hypothèses du test t

Le test t dans une régression multiple teste l’hypothèse nulle (H0H_0H0) selon laquelle le coefficient de régression βj d'une variable explicative Xj est égal à zéro :

Hypothèse nulle (H0) : βj=0 (pas d’effet significatif de la variable Xj sur Y).
Hypothèse alternative (H1) : βj≠0 (il y a un effet significatif de la variable Xj sur Y).

Si le test t rejette l’hypothèse nulle, cela signifie que la variable explicative Xj a un effet significatif sur la variable dépendante Y.

3. Formule du test t dans une régression multiple

Le test t pour un coefficient βj est calculé à l’aide de la formule suivante :

4. Interprétation des résultats du test t

Une fois le statistique t calculé, on compare la valeur absolue du t observé à une valeur critique issue de la distribution t de Student, en fonction du niveau de confiance choisi (souvent 95 %), et du nombre de degrés de liberté (qui dépend du nombre d'observations et de variables explicatives). Ensuite, on vérifie la p-valeur associée à ce t observé.

Si la p-valeur est inférieure à un seuil de signification (généralement p<0,05), on rejette l’hypothèse nulle et on conclut que le coefficient βj est significativement différent de zéro.
Si la p-valeur est supérieure à 0,05, on n’a pas assez de preuves pour rejeter l’hypothèse nulle, ce qui signifie que la variable explicative Xj n’a pas d’effet significatif sur Y.

5. Exemple concret du test t dans un modèle de régression multiple

Supposons que nous avons un modèle de régression multiple avec l'intention d'utiliser des cryptomonnaies comme variable dépendante (Y) et trois variables explicatives : utilité perçue (X1), facilité d’utilisation perçue (X2), et risque perçu (X3). Le modèle prend la forme suivante : Y=β0+β1X1+β2X2+β3X3+ϵ Imaginons que les estimations des coefficients et des erreurs standards pour ces variables soient les suivantes : Ensuite, en utilisant une table t de Student ou un logiciel statistique, on compare ces valeurs de t à la distribution t pour un certain nombre de degrés de liberté (en fonction de la taille de l’échantillon). Si les p-valeurs associées aux tests sont inférieures à 0,05, cela indique que ces coefficients sont statistiquement significatifs. Le test t est un élément central dans l’interprétation des résultats d’une régression multiple. Il permet de déterminer si chaque variable explicative a un impact significatif sur la variable dépendante, en tenant compte des autres variables présentes dans le modèle. Un t élevé et une p-valeur faible (p < 0,05) indiquent un effet significatif, tandis qu’un t faible et une p-valeur élevée indiquent un effet non significatif.

Retour à Analyse de données Source originale