Comment créer une équation de régression dans Excel

Vous pouvez créer une équation de régression dans Excel qui vous aidera à prévoir les valeurs des clients. Pour créer une équation de régression à l'aide d'Excel, procédez comme suit:

  1. Insérez un graphique de nuage de points dans un espace ou une feuille vide d'un fichier Excel contenant vos données.

    Vous pouvez trouver le graphique scatterplot dans le ruban Insertion dans Excel 2007 et versions ultérieures.

  2. Sélectionnez les données de l'axe des x (horizontal) et de l'axe y et cliquez sur OK.

    Mettez ce que vous voulez prédire dans l'axe y (donc mes données de temps sont dans la colonne B). Les taps sont dans la colonne C.

    Vous avez maintenant un diagramme de dispersion.

  3. Cliquez avec le bouton droit sur l'un des points et sélectionnez "Ajouter une courbe de tendance" dans le menu.

    La boîte de dialogue Format de la courbe de tendance s'ouvre.

  4. Sélectionnez Options de tendance sur la gauche, si nécessaire, puis sélectionnez Afficher l'équation sur le graphique et afficher la valeur R-Squared sur le graphique.

    Vous avez maintenant un nuage de points avec une ligne de tendance, une équation et une valeur r-carré. L'équation de régression est Y = 4. 486x + 86. 57.

    La valeur r 2 de. 3143 vous dit que les robinets peuvent expliquer environ 31% de la variation dans le temps. Il vous indique dans quelle mesure la ligne la mieux adaptée correspond réellement aux données.

Aller au-delà de la fin des valeurs observées est risqué lorsqu'on utilise une équation de régression. Il n'y a aucune garantie que la ligne de régression continuera à être linéaire car elle s'étend avant et après les points de données.

Faites attention aux trois éléments suivants lors de la corrélation des données d'analyse client et de l'analyse de régression:

  • Limite de portée: Deux variables peuvent avoir une faible corrélation car vous ne mesurez que dans une plage étroite. Par exemple, la taille et le poids ont une forte corrélation positive, mais si vous ne mesurez que les joueurs de la National Basketball Association (NBA), la corrélation disparaîtra pour la plupart. Cela peut arriver, par exemple, si vous regardez une gamme étroite de clients - disons, ceux qui ont les revenus les plus élevés ou la plupart des transactions.

  • Troisièmes variables: Il arrive souvent qu'une autre variable que vous ne mesurez pas soit réellement la cause de la relation. Par exemple, les notes du secondaire sont corrélées avec les notes collégiales. Il peut sembler que de meilleures études au secondaire mènent à de meilleures notes au collège.

    Cependant, il arrive souvent qu'une troisième variable, le statut socioéconomique (SSE), soit une meilleure explication des notes du secondaire et du collège. Les étudiants des familles ayant un SSE plus élevé ont tendance à avoir des notes plus élevées à l'école secondaire et au collège que les étudiants issus de familles à faible SSE. Dans l'analyse de la clientèle, une amélioration de l'économie ou une croissance de l'entreprise peuvent être à l'origine de l'augmentation des ventes, et non de votre campagne marketing ou des changements de fonctionnalités.

  • Non-linéarité: La relation entre les variables doit être linéaire - c'est-à-dire suivre une ligne quelque peu. Si la relation se courbe vers le bas ou vers le haut, une corrélation et une équation de régression ne décriront pas correctement la relation.