Comment utiliser des variables fictives dans la régression Excel
Le programme Excel populaire de Microsoft possède des capacités d'analyse de données qui incluent la réalisation d'une analyse de régression avec des variables fictives. Les variables fictives sont des variables catégorielles exprimées numériquement par 1 ou 0 pour indiquer la présence ou l'absence d'une qualité ou d'une caractéristique particulière. Excel ne nécessite aucune fonction spéciale lorsqu'un modèle de régression inclut une variable fictive parmi les variables indépendantes. Cependant, les modèles de régression avec des variables fictives dépendantes nécessitent des compléments supplémentaires, des programmes qui étendent les options et les fonctionnalités d'Excel.
Régression avec des variables fictives à l'aide d'Excel
Étape 1
Chargez l'outil d'analyse de données à partir des compléments Excel, inclus dans toutes les versions d'Excel. Vous devez le faire pour effectuer une régression ou tout autre type d'analyse de données. Cliquer sur "Outils" ouvre un menu déroulant. Sélectionnez "Add-ins" et dans le menu qui s'ouvre, cochez "Analysis ToolPak" et cliquez sur "OK". "Analyse des données" devrait apparaître dans votre menu Outils.
Étape 2
Entrez les données que vous utiliserez pour votre régression dans une feuille de calcul Excel, codant toutes les variables fictives avec la valeur 1 ou 0, selon que le sujet a la caractéristique en question. Le sexe est un exemple de variable fictive, puisque les sujets d'une étude ne peuvent être que des hommes ou des femmes. Une étude des résultats des examens d'entrée à l'université qui incluait le sexe des sujets, par exemple, pourrait coder les étudiantes avec un 1. L'utilisation de variables fictives parmi vos variables indépendantes ne nécessite aucune fonction spéciale dans Excel. N'oubliez pas que si une variable fictive n'a que deux catégories (telles que masculin ou féminin), une seule variable est nécessaire pour représenter les deux catégories.
Étape 3
Codez les variables catégorielles avec plus de deux catégories en tant que variables fictives multiples, en vous assurant que le nombre de variables est inférieur d'une unité au nombre de catégories (n-1, en termes statistiques). Par exemple, la catégorie ethnicité exprimée en cinq niveaux (blanc, noir, hispanique, asiatique, amérindien) nécessiterait quatre variables fictives distinctes. Par exemple, si vous étudiez les résultats des examens d'entrée à l'université, vous pouvez créer les variables fictives suivantes :noir, hispanique, asiatique et amérindien, en les codant chacune par 1 si l'étudiant en question correspond à cette catégorie ethnique.
Étape 4
Développez la capacité de régression d'Excel avec des variables fictives avec un complément qui permettra au programme d'effectuer des régressions avec des variables dépendantes fictives. L'un de ces programmes est XLStat, disponible à l'achat et au téléchargement auprès du fabricant, Addinsoft. Des programmes comme celui-ci vous permettent d'effectuer des régressions dans lesquelles la variable dépendante prend les valeurs 1 ou 0.
Avertissement
Une erreur courante chez les débutants est d'utiliser autant de variables fictives qu'il y a de catégories (comme, par exemple, deux variables fictives pour homme et femme). Une telle approche créerait une multicolinéarité, dans laquelle deux variables indépendantes sont fortement corrélées, rendant presque impossible la détermination de leurs effets séparés sur la variable dépendante. N'oubliez pas que le nombre de variables fictives doit toujours être inférieur d'une unité au nombre de catégories.