Comment les prévisions fonctionnent dans Tableau

Les prévisions de Tableau utilisent une technique appelée homogénéisation exponentielle. Les prévisions d’algorithmes tentent de rechercher un schéma régulier dans des mesures pouvant être poursuivies à l’avenir. Si vous êtes intéressé par la modélisation prédictive, également disponible sur Tableau, voir Fonctions de la modélisation prédictive dans Tableau

Afficher une vidéo: Pour consulter les concepts associés présentés dans Tableau, reportez-vous à la prévision (lien s’ouvre dans une nouvelle fenêtre), Une vidéo de formation gratuite pendant six minutes. Utilisez votre compte Tableau.com (lien s’ouvre dans une nouvelle fenêtre) pour vous connecter.

Normalement, une prévision est ajoutée à une date contenant un champ de date et, au moins une mesure. Cependant, s’il n’y a pas de date, Tableau peut créer une prévision pour une vue contenant une dimension avec des valeurs entières et, au moins une mesure.

Pour plus d’informations sur la création d’une prévision, voir Créer une prévision. Pour des informations détaillées sur la manière de faire des prévisions avec une dimension entière, voir la prévision lorsqu’il n’y a aucune date dans la vue.

Vue d’ensemble

Tous les algorithmes de prévision sont des processus simples de processus de génération de données ( DGP) du monde réel. Pour une qualité supérieure dans les prévisions, le modèle DGP simple doit correspondre au modèle décrivant le modèle. Les métriques de qualité évaluent le degré de coïncidence des modèles avec le DGP. Si la qualité est faible, la précision n’est pas importante, la précision d’une estimation inexacte étant évaluée.

Tableau sélectionne automatiquement les huit meilleurs modèles, étant le meilleur qui génère la prévision de la plus haute qualité. Les paramètres de lissage de chaque modèle sont optimisés avant que Tableau évalue la qualité des prévisions. La méthode d’optimisation est globale. Par conséquent, il est possible de sélectionner des paramètres de lissage optimaux localement qui ne sont pas les meilleurs du point de vue global. Cependant, les paramètres de valeur initiale seront sélectionnés en fonction des procédures recommandées, même si elles ne seront pas optimisées. Par conséquent, il est possible que les paramètres de la valeur initiale ne soient pas optimaux. Les huit modèles disponibles dans Tableau sont parmi ceux décrits à l’emplacement suivant sur le site Web Otexts: la taxonomie des méthodes de lissage exponentielles (lien s’ouvre dans une nouvelle fenêtre).

Quand il n’y a pas assez de données dans la visualisation, Tableau essaiera d’empêcher le niveau de détail temporairement élevé et ajoutera les prévisions de la granularité de la visualisation. Tableau propose des bandes de prévision pouvant être simulées ou calculées à partir d’une équation de forme fermée. Tous les modèles ayant un composant de multiplication ou avec des prévisions globales auront des bandes simulées, tandis que le reste des modèles utilisera les équations de formulaire fermée.

homogénéisation exponentielle et tendance

Les modèles de L’homogénéisation exponentielle prédit de manière itérative les valeurs futures d’une série de valeurs de temps régulières des moyennes pondérées des valeurs de la série passée. Le modèle le plus simple, une homogénéisation exponentielle simple, calcule le niveau suivant ou la valeur homogène d’une moyenne pondérée de la dernière valeur réelle et la valeur du dernier niveau. La méthode est exponentielle car la valeur de chaque niveau reçoit l’influence de chaque valeur réelle précédente à un degré qui diminue de manière exponentielle. Les valeurs les plus récentes ont une plus grande pondération.

Les modèles exponentiels homogènes avec tendance ou composants saisonniers sont efficaces lorsque la mesure qui sera prévue présente des tendances ou de la temporalité sur la période de temps sur laquelle les prévisions. La tendance est la tendance que les données doivent augmenter ou diminuer avec le temps. La temporalité est une variation de valeur répétitive et prévisible de la valeur, comme une fluctuation annuelle de température par rapport à la saison.

En général, plus vous avez des points de données dans vos séries chronologiques, meilleure sera la prévision obtenue. la prévision résultante. Il est particulièrement important d’avoir suffisamment de données si vous souhaitez modéliser la temporalité, car le modèle est plus compliqué et nécessite davantage de tests sous forme de données pour obtenir un niveau de précision raisonnable. De plus, si vous envisagez d’utiliser les données générées par deux DGP différentes, vous obtiendrez un pronostic de la qualité inférieure, car le modèle ne peut correspondre qu’un.

temporalité

Tableau normalement Testez un cycle saisonnier avec la longueur la plus typique de l’agrégation temporelle de la série chronologique pour laquelle la prévision a été estimée.C’est-à-dire que si vous ajoutez des mois, Tableau recherchera un cycle de 12 mois; Si vous ajoutez des quartiers, Tableau cherchera un cycle de quatre quarts; Et si vous ajoutez pendant des jours, Tableau cherchera une temporalité hebdomadaire. Par conséquent, s’il y a un cycle de six mois dans vos séries chronologiques mensuelles, Tableau est susceptible de rechercher un motif de 12 mois contenant deux sous-parties similaires. Cependant, s’il y a un cycle de sept mois dans votre série chronologique mensuelle, Tableau ne cherche probablement aucun cycle. Heureusement, les cycles de sept mois sont rares.

Tableau peut utiliser l’une des deux méthodes pour obtenir la longueur saisonnière. La méthode temporaire d’origine utilise la longueur saison naturelle de la granularité temporaire de la vue. Par granularité temporaire, l’unité temporelle la plus précise exprimée par la vue est comprise. Par exemple, si la vue contient une date verte, continue et tronquée par mois, ou des parties de l’année et de la date, bleue et discrète, la granularité temporaire de la vue sera du mois. La nouvelle méthode intemporelle, introduite dans Tableau 9.3, utilise la régression périodique pour vérifier les longueurs saisonnières entre 2 et 60 pour les longueurs de candidats.

Tableau sélectionne automatiquement la méthode la plus appropriée pour une vue donnée. Lorsque Tableau utilise une date pour commander les mesures d’une vue, si la granularité temporaire est trimestrielle, mensuelle, hebdomadaire, quotidienne ou heure, des longueurs saisonnières seront, presque certains, 4, 12, 13, 7 ou 24, respectivement. Ainsi, seule la longueur naturelle est utilisée pour la granularité temporaire dans le but de créer les cinq modèles saisonniers d’homogénéisation exponentielle compatibles avec Tableau. Les informations d’identité des cinq modèles saisonniers et les trois modèles non saisonniers sont comparés et plus bas est renvoyé (pour voir une explication de la métrique AIC, voir descriptions prévisionnelles).

Quand Tableau utilise une dimension des entiers Pour effectuer une prévision, la deuxième méthode est utilisée. Dans ce cas, il n’y a pas de granularité temporaire, de sorte que les longueurs saisonnières potentielles doivent être dérivées des données.

La deuxième méthode est également utilisée si la granularité temporaire est annuelle. La série annuelle a rarement une saisonnalité; Cependant, s’ils le sont, ils doivent également être dérivés des données.

La deuxième méthode est également utilisée dans les vues ayant une minularité temporaire de la minute ou de la seconde. Si ces séries ont une saisonnalité, des longueurs saisonnières seront probablement 60. Toutefois, si un processus réel normal est mesuré, il peut avoir une répétition régulière qui ne correspond pas à l’horloge. Donc, pour les minutes et les secondes, Tableau recherche également les données qui ne sont pas 60. Cela ne signifie pas que Tableau peut modéliser deux longueurs saisonnières différentes en même temps, mais dix modèles saisonniers sont estimés, cinq avec une longueur saisonnière de 60 et cinq autres avec la longueur saisonnière dérivée des données. Quel que soit le modèle saisonnier (du dix disponible) ou le modèle non saisonnier (des trois disponibles) qui a l’AIC le plus bas, il sera utilisé pour calculer les prévisions.

dans la série commandée par année , Minute ou seconde, on vérifie que le motif est assez clair en une seule longueur saisonnière des données. Dans la série commandée par des entiers, jusqu’à neuf longueurs saisonniers potentiels (un peu moins clair) pour les cinq modèles saisonniers sont estimés; De même, le modèle qui a l’AIC le plus bas est retourné. S’il n’y a pas de candidature de longueur saisonnière probable, seuls les modèles non saisonniers seront estimés.

Étant donné que toutes les sélections sont automatiques lorsque Tableau dérive des longueurs saisonnières potentielles à partir des données, le type de modèle par défaut « automatique », qui est Dans le menu Type de modèle de la boîte de dialogue Options de prévision, ne change pas. Si vous sélectionnez « Automatique sans temporalité », les performances seront améliorées, car toutes les recherches de longueurs saisonnières et toutes les estimations des modèles saisonniers sont supprimées.

Le tableau utilisé sur l’heuristique utilisé pour décider lorsque vous devez utiliser des dérivés de longueurs saisonniers. des données dépend de la répartition des erreurs de régression périodique de chaque candidat de la longueur saisonnière. Puisque l’assemblage de longueurs saisonnières par régression périodique génère généralement une ou deux longueurs de gagnant dans le cas où les données présentent la saisonnalité, le remboursement d’un seul candidat indique. Une saisonnalité possible. Dans ce cas, Tableau estime les modèles saisonniers qui ont ce candidat à la granularité de l’année, minute et seconde. Le retour d’une valeur de moins de dix candidats indique une saison possible.Dans ce cas, Tableau estime que les modèles saisonniers dont tous les candidats sont revenus pour des vues commandées entier. Le retour du nombre maximum de candidats indique que les erreurs de la plupart des longueurs sont similaires. Par conséquent, l’existence d’une saisonnalité est peu probable. Dans ce cas, Tableau estime que les modèles non saisonniers pour une série commandée par des modèles tout ou par année et saisonniers qui ont une longueur de saison naturelle pour le reste des points de vue a ordonné temporairement.

dans le type de modèle « automatique » des vues ordonnée par ensemble, années, minutes et secondes, les longueurs de candidats saisonniers sont toujours dérivés des données, si elles sont utilisées comme sinon. comme l’estimation des modèles nécessite beaucoup plus longue que la régression périodique, la impact sur la performance peut être modérée. Dans la zone de options de prévisions

types de modèle

, vous pouvez choisir le type de modèle que les utilisateurs de Tableau utiliseront pour les prévisions. la configuration automatique est généralement optimal pour la plupart des vues. Si vous choisissez personnalisée, vous pouvez spécifier les fonctions de tendance et de saison indépendamment, en choisissant aucun, additif ou multiplicatif:

Un additif est celui dans lequel les contribuables aux composants du modèle sont ajoutés, tandis qu’un modèle multiplicatif est celui dans lequel au moins certains contribuables de composants se multiplient. Modèles multiplicatifs peuvent améliorer la qualité du pronostic nettement des données dans ce que les tendances ou temporalités est affectée par le niveau (magnitude) des données.

Gardez à l’esprit que vous n’avez pas besoin de créer un modèle personnalisé pour générer une prévision multiplicative: la configuration automatique peut déterminer si une prévision multiplicative convient à vos données. Cependant, un modèle multiplicatif ne peut pas être calculé lorsque la mesure à la prévision a une ou plusieurs valeurs égales ou inférieures à zéro.

prévisions temporaires

lorsque vous faites une prévision avec un ce jour, il ne peut être une date de base dans la vue. Les pièces de date sont admises, mais toutes doivent se référer au même domaine sous-jacent. . Les dates peuvent être en lignes, des colonnes ou des marques (à l’exception de la lentille de la description de pop-up)

Tableau prend en charge trois types de dates, dont deux peuvent être utilisés dans les prévisions:

  • Les dates tronquées se réfèrent à un certain point dans l’ histoire avec une granularité temporaire spécifique (par exemple, Février 2017). Ils sont généralement continus et ont la couleur de fond vert dans la vue. Les dates tronquées sont valables pour les prévisions.

  • Les pièces de date font référence à un membre spécifique d’une mesure temporaire, telle que février. Chaque partie de date est représentée avec un champ différent, généralement discrète (avec la couleur de fond bleue). Les prévisions nécessitent au moins une partie de la date de l’année. Plus précisément, vous pouvez utiliser l’un des ensembles de pièces de date suivants pour effectuer des prévisions:

    • Année

    • Année + trimestres

    • Année + mois

    • Année + Quartier + mois

    • année + semaine

    • personnalisé: mois / année, mois / jour / année

    Il existe d’autres parties de la date, telles que le trimestre ou le trimestre + mois, qui ne sont pas valables pour effectuer des prévisions. Voir les champs convertis en discret ou continu Pour des informations plus détaillées sur les différents types de données.

  • Les dates exactes se réfèrent à un certain point dans l’histoire avec une granularité temporaire maximale Comme, Par exemple, le 1 er février 2012 à 14h30: 45.0. Les dates exactes ne sont pas valables pour effectuer des prévisions.

Une prévision peut également être effectuée sans dates. Consulte Pronóstico cuando no hay fechas en la vista.

Granularidad y acotación

Cuando crea un pronóstico, selecciona una dimensión de fecha que especifica una unidad de tiempo según la cual se medirán los valores de date. Dates de Tableau prennent en charge une gamme d’unités de temps dont l’ année, trimestre, mois et jour. L’unité que vous sélectionnez pour la valeur de date est connue comme la granularité de la date.

La date en tant que mesure est généralement pas aligné exactement avec l’unité de granularité. Vous pouvez définir la valeur de la date dans les trimestres, mais vos données réelles peuvent finir par un demi-trimestre, par exemple, à la fin du mois de novembre.Cela peut poser un problème car le modèle de prévision traite de la valeur de cette partie du trimestre en tant que quartier complet, qui aura normalement une valeur inférieure à un trimestre complet. Si le modèle de prévision est autorisé à considérer ces données, la prévision résultante ne sera pas exacte. La solution consiste à limiter les données, de sorte que les périodes suivantes susceptibles d’induire des erreurs dans les prévisions sont ignorées. Utilisez l’option Ultimate Ignorer dans la boîte de dialogue Options de prévision pour éliminer ou limiter ces périodes partielles. La valeur par défaut consiste à limiter une période.

obtenir plus de données

Tableau a besoin d’au moins cinq points de données dans la série TIME pour estimer une tendance et des points de données suffisants pour au moins Deux saisons ou une saison plus cinq périodes pour estimer la temporalité. Par exemple, au moins neuf points de données sont nécessaires pour estimer un modèle avec un cycle de saison de quatre quarts (4 + 5) et au moins 24 pour estimer un modèle avec un cycle saisonnier de douze mois (2 * 12).

Si vous activez la prévision pour une vue qui ne dispose pas de suffisamment de points de données pour générer une bonne prévision, Tableau peut parfois récupérer suffisamment de points de données pour produire une prévision valide lors de la consultation de la source de données pour obtenir un meilleur niveau de granularité.

  • Par défaut, si votre vue contient moins de neuf ans de données, Tableau consultera la source de données pour rechercher des données trimestrielles, estimer une prévision trimestrielle et ajouter à une annuelle prévoir de le montrer à votre vue. S’il y a toujours suffisamment de points de données, Tableau estimera une prévision mensuelle et montrera en vue des prévisions annuelles ajoutées.

  • Par défaut, si votre vue contient moins de neuf trimestres. Tableau estime une prévision mensuelle et montrera les résultats de la prévision trimestrielle ajoutée à votre vue.

  • Par défaut, si votre vue contient moins de neuf semaines de données, le tableau estime un Prévisions quotidiennes et montrera les résultats de la prévision hebdomadaire ajoutée à votre vue.

  • Si votre vue contient moins de neuf jours de données, tableau prédéterminé prévu à chaque fois et montrera Les résultats des prévisions quotidiennes ont ajouté à votre vue.

  • Si votre vue contient moins de neuf heures de données, tableau prédéterminé un pronostic par minute et montrera les résultats du supplément Prévisions horaires à votre vue.

  • Oui s u Vista contient moins de neuf minutes de données, tableau prédéterminé prédéterminé chaque seconde et montrera les résultats des prévisions de la minute ajoutées à votre vue.

Ces paramètres se produisent et n’avez pas besoin de configuration. Tableau ne change pas l’apparence de la visualisation et, en fait, ne change pas la valeur de la date. Toutefois, le résumé de la période de prévision dans la boîte de dialogue des prévisions décrives et des options de prévision reflétera la granularité réelle utilisée.

Tableau ne peut obtenir plus de données lorsque l’agrégation de la mesure est prédite, il est prévu, il est prédit qu’il est prédit, il est prévu, il est prédit qu’il est sum ou Compter. Voir Agrégation de données dans Tableau pour plus d’informations sur les types d’agrégations disponibles et sur la manière de modifier le type d’agrégation.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *