na sociedade de hoxe, os datos xerados cada día un volume de 2,5 x 1018 bytes, aproximadamente. Estes datos son de natureza complexa e poden combinar diferentes aspectos ao mesmo tempo, entre outros: ser multidimensional, van vinculados a restricións espaciais-temporal e lonxitudinal (que evolucionan ao longo do tempo), tamén (combinando diferentes fontes e orixes), así como como procedente da execución de múltiples procesos e / ou modelos paralelos. Os datos de visualización inclúen a xestión de toda esta complexidade para convertelos en información, é dicir, obter respostas ás preguntas ou obxectivos da visualización. A análise visual non substitúe as estatísticas clásicas ou a construción de modelos mineiros de datos, senón que proporciona unha perspectiva diferente baseada nas capacidades do sistema visual humano. A visualización de datos como ferramenta de análise ten como obxectivo loitar contra “Síndrome de caixas negras”, xa presentado neste blog antes.
Así, o obxectivo dunha visualización de datos é mostrar a natureza do mesmo, facilitando a súa comprensión e posterior exploración. É entón unha análise visual preliminar para detectar os aspectos clave presentes nos datos: distribucións de cada variable, valores extremos, relacións entre variables, tendencias, patróns, outliers, etc. Para iso, é necesario ter Un ambiente gráfico que permite visualizar datos utilizando diferentes proxeccións, combinando ferramentas estatísticas con modelos xerados a partir dos datos, desde os descritores estatísticos ata o resultado dun algoritmo de clasificación non supervisado, por exemplo, variando os parámetros.
Neste sentido, a evolución da visualización de datos non se centra só na capacidade Para xerar gráficos complexos con maior resolución nun breve período de tempo, pero incorporou elementos interactivos na propia visualización, en forma de operacións básicas (selección, filtrado, etc.). Segundo o traballo de (Keim et al., 2008), a análise de datos visual baséase nun mantra que é unha versión modificada da proposta por (Shneiderman, 1996):
“analizar primeiro –
Mostrar o zoom importante –
, filtrar e analizar máis –
Detalles sobre a demanda “
Así, o proceso de análise visual consiste nun ciclo continuo que comeza nos datos e as súas posibles transformacións e que está bifurcado en dous enfoques complementarios, a visualización e a construción de modelos, entre os que hai un diálogo co obxectivo de extraer coñecementos que se poden usar para iterar o proceso de análise visual cun maior nivel de detalle e / ou complexidade, como se mostra en Figura 1. A capacidade de interacción debe permitir que o usuario da visualización realice, polo menos, as operacións básicas definidas por Ben Shneiderman (Resumo, Zoom, filtro e selección).
Desde unha perspectiva de análise visual, os dous primeiros pasos definidos na Figura 1 son a transformación (ou adaptación) dos datos ea súa visualización , incluída a interacción. Polo tanto, unha vez que se establece o obxectivo da análise visual dos datos, trátase de seleccionar un tipo de visualización interactiva que permita unha escanea preliminar.
Actualmente, para acadar esta tarefa. Un novo aliado, que Elimina a necesidade de crear aplicacións específicas e proporciona unha interface visual coherente. Trátase de navegadores web que visualizan páxinas que conteñen código fonte que constrúe (a través de render) a visualización cando se accede e cargue a páxina. Resumo, unha páxina web é unha combinación de CSS (follas de estilo que determinan o aspecto dos elementos da páxina), o propio contido de HTML e o código de JavaScript que permite a manipulación do DOM (do modelo de obxecto do documento inglés, é dicir, a estrutura das vistas do sitio web Si mesmo como un documento estructurado de forma jerárquica), xerando novos contidos que están integrados dinámicamente, incluíndo código HTML e gráficos vectoriales (SVG ou gráficos vectoriales escalables). O gráfico (ou máis ben, como construílo) forma parte da páxina e móstrase cando o navegador executa as ordes necesarias para mostrar o contido da páxina.
Deste xeito, a xeración dunha pantalla de datos interactiva pode verse como a creación dunha páxina web construída dinámica que visualiza estes datos segundo unha configuración preestablecida. Neste sentido, D3 (ou tamén D3.JS) é unha librería JavaScript que permite manipular datos en diferentes formatos (táboas, CSV ou JSON, entre outros) e xerar gráficos vectoriales dinámicamente que poden ser incorporados na páxina web para o seu manexo, incluídos os elementos de interactividade, tanto no que se refire á interface de usuario como ao uso de transicións que proporcionan o dinamismo á visualización (Murray, 2013).
Dada a súa flexibilidade, D3 pode usarse para crear calquera tipo de visualización interactiva, xerar Elementos gráficos de datos que alimentan a visualización, a partir de gráficos de barras a pantallas complexas combinando diferentes elementos gráficos. Un dos aspectos máis interesantes de D3 é a incorporación da interacción como parte da propia visualización, de xeito que se converta na interface de acceso aos datos, permitindo a súa manipulación segundo as operacións básicas definidas por (Shneiderman, 1996).
Este exemplo, baseado no traballo de Jason Davies, permítelle comprobar como se pode empregar a análise visual para detectar relacións entre variables, neste caso categórico. O gráfico interactivo permite reproducir a táboa de continxencia entre as diferentes variables do conxunto de datos, sendo posible detectar asociacións a simple vista, cruzando, por exemplo, o sexo variable coa variable de supervivencia, por desprazamento vertical. Os valores de cada variable categórica, mostrados horizontalmente, tamén se poden ordenar. Aínda que a análise visual non proporciona o nivel de detalle proporcionado por unha análise estatística clásica (neste caso, o coeficiente de Chi-Square ou o V de Cramor) permite verificar rapidamente as combinacións de variables que merecen ser exploradas.
Julià Menguillón é profesor de estudos de computadora, multimedia e telecomunicacións de UOC. As súas áreas de coñecemento son a aprendizaxe virtual (e-learning) e os recursos educativos abertos. É investigador no Grupo Laika (Aprendizaxe Analytics for Innovation e Solicitude de Coñecemento en Educación Superior) e foi responsable da área de investigación aplicada do Centro Elecelan.
Referencias
Keim, D., Andrienko, G., Fekete, JD, Görg, C., Kohlhammer, J., & Melançon, G. (2008). Analytics Visual: Definición, proceso e desafíos. Na visualización da información (pp. 154-175). Springer Berlin Heidelberg.
Shneiderman, B. (1996, setembro). Os ollos teñen: unha tarefa por taxonomía tipo de datos para visualizacións de información. En linguas visuais, 1996. Procedementos, Simposio IEEE en (pp. 336-343). IEEE.
Murray, S. (2013). Visualización de datos interactivos para oweb. O’Reillediamedia, Inc.