Na sociedade de hoje, os dados são gerados todos os dias um volume de 2,5 x 1018 bytes, aproximadamente. Estes dados são de natureza complexa e podem combinar diferentes aspectos ao mesmo tempo, entre outros: ser multidimensional, vá ligado a restrições longitudinais temporais (que evoluem ao longo do tempo), multimodal (combinando diferentes fontes e origens), bem como vindo da execução de vários processos paralelos e / ou modelos. A visualização de dados inclui gerenciar toda essa complexidade para convertê-los em informações, ou seja, obter respostas para as perguntas ou objetivos da visualização. A análise visual não substitui estatísticas clássicas ou a construção de modelos de mineração de dados, mas fornece uma perspectiva diferente com base nas capacidades do sistema visual humano. Visualização de dados como uma ferramenta de análise visa lutar contra “síndrome de caixas pretas”, já apresentadas neste blog antes.
Assim, o objetivo de uma visualização de dados é mostrar a natureza do mesmo, facilitando sua compreensão e exploração subsequente. É então uma análise visual preliminar para detectar os aspectos principais presentes nos dados: distribuições de cada variável, valores extremos, relacionamentos entre variáveis, tendências, padrões, outliers, etc. Para isso, é necessário ter Um ambiente gráfico que permite visualizar dados usando diferentes projeções, combinando ferramentas estatísticas com modelos gerados a partir dos dados, desde descritores estatísticos para o resultado de um algoritmo de classificação não supervisionado, por exemplo, variando os parâmetros dele.
Nesse sentido, a evolução da visualização de dados não se concentrou apenas em capacidade Para gerar gráficos complexos com maior resolução em um breve período de tempo, mas ele vem incorporando elementos interativos na própria visualização, na forma de operações básicas (seleção, filtragem, etc.). De acordo com o trabalho de (Keim et al., 2008), a análise de dados visuais é baseada em um mantra que é uma versão modificada da proposta por (Shneiderman, 1996):
Analise primeiro –
Mostrar o importante –
Zoom, filtrar e analisar mais –
Detalhes sob demanda “
Assim, o processo de análise visual consiste em um ciclo contínuo que começa nos dados e às suas possíveis transformações, e Isso é bifurcado em duas abordagens complementares, visualização e construção de modelos, entre os quais existe um diálogo com o objetivo de extrair o conhecimento que pode ser usado para iterar o processo de análise visual com um nível mais alto de detalhes e / ou complexidade, como mostrado em Figura 1. A capacidade de interação deve permitir que o usuário da visualização execute, pelo menos, as operações básicas definidas por Ben Shneiderman (visão geral, Zoom, filtro e seleção).
De uma perspectiva de análise visual, as duas primeiras etapas definidas na Figura 1 são a transformação (ou adaptação) dos dados e sua visualização , incluindo a interação. Portanto, uma vez que o alvo da análise visual dos dados é estabelecido, é sobre selecionar um tipo de exibição interativa que permita uma varredura preliminar.
Atualmente, para atingir esta tarefa. Um novo aliado, que Elimina a necessidade de criar aplicativos específicos e fornece uma interface visual coerente. É sobre os navegadores da Web, que visualizam páginas que contêm código-fonte que constrói (via renderização) visualizando quando a página é acessada e carregada. Resumo, uma página da Web é uma combinação de CSS (folhas de estilo que determinam o aspecto dos elementos de página), o próprio conteúdo HTML e o código JavaScript que permite manipular o dom (do modelo de objeto de documento em inglês, ou seja, a estrutura do site visualizações em si como um documento estruturado hierarquicamente), gerando novos conteúdos que são incorporados dinamicamente, incluindo código HTML e gráficos vetoriais (SVG ou gráficos vetoriais escaláveis). O gráfico (ou melhor, como construí-lo) é parte da página e é exibido quando o navegador executa os pedidos necessários para mostrar o conteúdo da página.
Desta forma, gerar uma exibição de dados interativos pode ser vista como a criação de uma página da Web construída dinamicamente que visualiza esses dados de acordo com uma configuração pré-estabelecida. Nesse sentido, d3 (ou também d3.js) é uma livraria JavaScript que permite manipular dados em diferentes formatos (tabelas, CSV ou JSON, entre outros) e gerar gráficos vetoriais dinamicamente que podem ser incorporados na página da Web para seu manuseio, Incluindo elementos de interatividade, tanto quanto à interface do usuário e uso de transições que fornecem dinamismo à visualização (Murray, 2013).
Dada sua flexibilidade, D3 pode ser usado para criar qualquer tipo de visualização interativa, gerando Elementos gráficos de dados que alimentam a visualização, desde gráficos de barras a exibições complexas, combinando elementos gráficos diferentes. Um dos aspectos mais interessantes da D3 é a incorporação da interação como parte da própria visualização, de modo que se torne a interface do acesso aos dados, permitindo a sua manipulação de acordo com as operações básicas definidas por (Shneiderman, 1996). / p>
Este exemplo, com base no trabalho de Jason Davies, permite verificar como a análise visual pode ser usada para detectar relacionamentos entre variáveis, nesse caso categórico. O gráfico interativo permite reproduzir a tabela de contingência entre as diferentes variáveis do conjunto de dados, sendo possível detectar associações a olho nu, travessia, por exemplo, o sexo variável com a variável de sobrevivência, pelo seu deslocamento vertical. Os valores de cada variável categórico, mostrados horizontalmente, também podem ser encomendados. Embora a análise visual não forneça o nível de detalhe fornecido por uma análise estatística clássica (neste caso, o coeficiente qui-quadrado ou o V de Cramor), permite verificar rapidamente quais combinações de variáveis merecem ser exploradas.
Julià O MENGUILLÓN é professor de estudos de computador, multimídia e telecomunicações do UOC. Suas áreas de conhecimento são aprendizagem virtual (e-learning) e recursos educacionais abertos. Ele é um pesquisador do Grupo Laika (Analytics de Aprendizagem para a aplicação de inovação e conhecimento no ensino superior) e foi responsável pela área de pesquisa aplicada do Centro Elecelan. Referências
Keim, D. Andrienko, G., Fekete, JD, Görg, C., Kohlhammer, J., & Melançon, G. (2008). Analytics Visual: Definição, Processos e Desafios. Na visualização da informação (pp. 154-175). Springer Berlin Heidelberg.
Shneiderman, B. (1996, setembro). Os olhos têm: uma tarefa por tipo de dados taxonomia para visualizações de informações. Nas línguas visuais, 1996. Processo, Simpósio IEEE em (pp. 336-343). IEEE.
Murray, S. (2013). Visualização de dados interativa para oWeb. O’ReillyMedia, Inc.