Principal Affaires Périodes d'analyse, de formation et de validation des clients - nuls - Affaires 2019

Périodes d'analyse, de formation et de validation des clients - nuls - Affaires 2019

Une approche sophistiquée et souvent essentielle de l'analyse des séries chronologiques consiste à partitionner vos données clients en périodes de formation et de validation. Au cours de la période de formation, vous construisez une équation de régression sur la première section de données (environ les deux tiers à trois quarts de vos données).

Vous appliquez ensuite l'équation de régression à la partie postérieure de vos données dans la période de validation pour voir dans quelle mesure les données antérieures prédisent réellement les données ultérieures.

Avec les données sur les abonnés, vous pouvez utiliser les 20 premiers mois (de janvier 2012 à août 2013) comme période de formation et de septembre 2013 à février 2014 comme période de validation. Cette approche teste l'équation en utilisant les données que vous possédez déjà, qui sont aussi proches que possible pour tester la performance d'une prédiction lorsque de nouvelles données arrivent.

L'équation de régression pour les 20 premiers mois est:

Abonnés = 2033. 9e 0. 0269 x

Le r ² = 0. 9979, qui montre un bon ajustement pour la ligne exponentielle. Vous pouvez ensuite utiliser cette équation de régression pour voir à quel point elle prédit les six derniers mois de l'ensemble de données. Les six derniers mois sont compris entre 21 et 26. La figure montre les valeurs prévues et réelles d'août 2013 à février 2014, intitulées Validation (dans la colonne Période).

Pour évaluer la réalité de cette prédiction, deux colonnes supplémentaires ont été créées. Le premier est l'erreur brute du nombre réel à la prédiction. Par exemple, en septembre 2013, la prévision était courte de 5 abonnés. En février 2014, il manquait 28 unités. Cette sorte d'erreur brute peut elle-même être compréhensible si vous connaissez les données client avec lesquelles vous travaillez.

Lorsque vous communiquez le niveau d'erreur de vos valeurs prédites, il est souvent plus facile de parler en termes d'erreur en pourcentage.

L'erreur de pourcentage absolu moyen (MAPE) peut être un peu plus compréhensible pour les parties prenantes. Il est calculé en trouvant la valeur absolue de la différence entre les valeurs réelles et prévues, puis en divisant cette différence par la valeur réelle pour calculer l'erreur absolue en pourcentage. Ceci est ensuite moyenné pour chaque valeur.

La colonne APE indique l'erreur en pourcentage absolue. Par exemple, pour janvier 2013, l'équation de régression a prédit 2 885 abonnés; le nombre réel d'abonnés était de 2 844, ce qui signifie que l'équation a été surestimée par 41 abonnés.

L'application de la formule Excel pour l'erreur absolue en pourcentage (APE) génère une erreur de 1.4%:

= ABS (2885-2844) / 2885 =. 014 ou 1. 4%

Le MAPE pour la période de formation est. 589%. Le MAPE pour la période de validation est. 870%, ce qui est un peu plus élevé, mais les deux sont toujours inférieurs à 1%.

Enfin, les prévisions pour mars, avril et mai 2014 sont 4, 205, 4, 320 et 4, 437.

= EXP (0, 0269 * 27) * 2033. 9 = 4205

= EXP (0269 * 28) * 2033. 9 = 4320

= EXP (0269 * 29) * 2033. 9 = 4437

Il existe un certain nombre de techniques plus sophistiquées qui peuvent faire des modèles plus précis en prenant en compte la saisonnalité et l'autocorrélation, puis en lissant les données pour mieux interpréter les modèles. Les logiciels tels que JMP et Minitab intègrent ces fonctionnalités.

Prévoir l'avenir est toujours risqué, car vous présumez que le futur aura des tendances similaires à celles du passé. Dans la plupart des cas, cela est et peut être un excellent prédicteur du comportement des clients. Cependant, des événements inhabituels (clients indignés sur les médias sociaux, attaque terroriste ou récession) imprévisibles peuvent affecter considérablement l'exactitude de vos prédictions. Traitez les prédictions comme un guide, pas un absolu.