Affichage de données interactive en tant qu’outil d’analyse

Dans la société d’aujourd’hui, des données sont générées chaque jour un volume de 2,5 x 1018 octets, environ. Ces données sont de nature complexe et peuvent combiner différents aspects en même temps, entre autres: être multidimensionnel, aller lié aux restrictions longitudinales spatiales et longitudinales (qui évoluent au fil du temps), multimodal (combinant différentes sources et origines), ainsi que comme provenant de l’exécution de plusieurs processus et / ou modèles parallèles. La visualisation des données comprend la gestion de toute cette complexité pour les convertir en informations, c’est-à-dire obtenir des réponses aux questions ou aux objectifs de la visualisation. L’analyse visuelle ne remplace pas les statistiques classiques ou la construction de modèles miniers de données, mais fournit une perspective différente sur la base des capacités du système visuel humain. La visualisation des données en tant qu’outil d’analyse vise à lutter contre « Syndrome des boîtes noires », déjà présentées dans ce blog avant.

Ainsi, l’objectif d’une visualisation de données est de montrer la nature du même, facilitant leur compréhension et exploration ultérieure. C’est alors une analyse visuelle préliminaire pour détecter les aspects clés présents dans les données: Distributions de chaque variable, des valeurs extrêmes, des relations entre les variables, les tendances, les modèles, les valeurs aberrantes, etc., il est nécessaire d’avoir Un environnement graphique permettant de visualiser des données à l’aide de différentes prévisions, combinant des outils statistiques avec des modèles générés à partir des données, à partir de descripteurs statistiques à la suite d’un algorithme de classification non supervisé, par exemple, en variant les paramètres de celui-ci.

Dans ce sens, l’évolution de la visualisation des données n’a pas été axée uniquement sur la capacité Pour générer des graphiques complexes avec une résolution plus élevée dans une brève période de temps, mais elle a incorporé des éléments interactifs dans la visualisation elle-même, sous la forme d’opérations de base (sélection, filtrage, etc.). Selon les travaux de (Keim et al., 2008), l’analyse visuelle des données est basée sur un mantra une version modifiée de la version proposée par (Shneiderman, 1996):

« Analyse d’abord –

Affiche l’important –

zoom, filtrer et analyser plus loin –

Détails sur la demande « 

Ainsi, le processus d’analyse visuelle consiste en un cycle continu qui commence dans les données et ses transformations possibles, et qui est bifurquée en deux approches complémentaires, la visualisation et la construction de modèles, parmi lesquelles il existe un dialogue dans le but d’extraire des connaissances pouvant être utilisées pour itérer le processus d’analyse visuelle avec un niveau de détail et / ou une complexité plus élevé, comme indiqué dans Figure 1. La capacité d’interaction doit permettre à l’utilisateur de la visualisation d’effectuer au moins les opérations de base définies par Ben Shneiderman (aperçu, Zoom, filtre et sélection).

Figure 1. Processus d’analyse visuelle. Source: Keim et al. (2008).

à partir d’une perspective d’analyse visuelle, les deux premières étapes définies à la figure 1 sont la transformation (ou l’adaptation) des données et sa visualisation , y compris l’interaction. Par conséquent, une fois que la cible de l’analyse visuelle des données est établie, il s’agit de sélectionner un type d’affichage interactif qui permet une telle analyse préliminaire.

actuellement, pour atteindre cette tâche. Un nouvel allié, lequel Élimine la nécessité de créer des applications spécifiques et fournit une interface visuelle cohérente. Il s’agit des navigateurs Web, qui visualisent des pages contenant du code source qui construit (via le rendu) affichage lorsque la page est accédée et chargée. Résumé, une page Web est une combinaison de CSS (feuilles de style qui déterminent l’aspect des éléments de page), du contenu HTML et du code JavaScript permettant de manipuler le DOM (du modèle d’objet de document anglais, c’est-à-dire la structure des vues du site Web. elle-même en tant que document structuré hiérarchiquement), générant de nouveaux contenus incorporés de manière dynamique, y compris le code HTML et les graphiques vectoriels (SVG ou des graphiques vectoriels évolutifs). Le graphique (ou plutôt comment le construire) fait partie de la page et s’affiche lorsque le navigateur exécute les commandes nécessaires pour afficher le contenu de la page.

De cette manière, la génération d’un affichage de données interactif peut être considérée comme la création d’une page Web construite de manière dynamique qui visualise ces données selon une configuration pré-établie. Dans ce sens, D3 (ou également d3.js) est une librairie JavaScript qui permet de manipuler des données dans différents formats (tables, CSV ou JSON, entre autres) et générer des graphiques vectoriels de manière dynamique pouvant être intégrés sur la page Web pour sa manipulation, y compris les éléments d’interactivité, à la fois en ce qui concerne l’interface utilisateur et l’utilisation de transitions qui fournissent du dynamisme à la visualisation (Murray, 2013).

Compte tenu de sa flexibilité, D3 peut être utilisé pour créer n’importe quel type de visualisation interactive, générant Les éléments graphiques des données qui alimentent la visualisation, à partir de graphiques à barres à des affichages complexes en combinant différents éléments graphiques. L’un des aspects les plus intéressants de la D3 est l’incorporation de l’interaction dans le cadre de la visualisation elle-même, de sorte qu’elle devient l’interface d’accès aux données, permettant à sa manipulation en fonction des opérations de base définies par (Shneiderman, 1996).

Cet exemple, basé sur le travail de Jason Davies, vous permet de vérifier comment l’analyse visuelle peut être utilisée pour détecter les relations entre les variables, dans ce cas catégorique. Le graphique interactif permet de reproduire le tableau de contingence entre les différentes variables de l’ensemble de données, éventuellement possible de détecter les associations à l’œil nu, traversant, par exemple le sexe variable avec la variable de survie, par un déplacement vertical de celui-ci. Les valeurs de chaque variable catégorique montrée horizontalement, peuvent également être commandées. Bien que l’analyse visuelle ne fournisse pas le niveau de détail fourni par une analyse statistique classique (dans ce cas, le coefficient de chi-carré ou le V de cramor), permet de vérifier rapidement quelles combinaisons de variables méritent d’être explorées.
Julià Menguillón est professeur d’études informatiques, multimédias et télécommunications de l’UOC. Ses domaines de connaissances sont l’apprentissage virtuel (apprentissage en ligne) et les ressources éducatives ouvertes. Il est chercheur au groupe Laika (analyse d’apprentissage pour l’innovation et la demande de connaissances dans l’enseignement supérieur) et était responsable de la zone de recherche appliquée du Centre Elecelan.
Références

Keim, D. Andrienko, G., Fekete, JD, Görg, C., Kohlhammer, J., & Melançon, G. (2008). Analyse visuelle: définition, processus et défis. Dans la visualisation de l’information (p. 154-175). Springer Berlin Heidelberg.

Shneiderman, B. (1996, septembre). Les yeux l’ont: une tâche par type de taxonomie de type de données pour les visualisations d’informations. Dans les langues visuelles, 1996. Procédure, Symposium IEEE sur (p. 336-343). IEEE.

Murray, S. (2013). Visualisation des données interactives pour laweb. O’REILLYMEDIA, INC.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *