Afișaj de date interactiv ca instrument de analiză

În societatea de astăzi, datele sunt generate în fiecare zi un volum de 2,5 X 1018 octeți, aproximativ. Aceste date sunt de natură complexă și pot combina în același timp diferite aspecte, printre altele: să fie multidimensionale, să fie legate de restricții spațiale temporale, longitudinale (care evoluează în timp), multimodal (combinând diferite surse și origini), de asemenea ca provenind din execuția mai multor procese și / sau modele paralele. Vizualizarea datelor includ gestionarea acestei complexități pentru a le converti în informații, adică să răspundă la întrebările sau obiectivele vizualizării. Analiza vizuală nu înlocuiește statisticile clasice sau construcția de modele miniere de date, dar oferă o perspectivă diferită bazată pe capabilitățile sistemului vizual uman. Vizualizarea datelor ca instrument de analiză își propune să lupte împotriva „sindromului cutii negre”, deja prezentată în acest blog înainte.

Astfel, obiectivul unei vizualizări de date este de a arăta natura aceluiași, facilitând acest lucru înțelegerea și explorarea ulterioară. Este apoi o analiză vizuală preliminară pentru a detecta aspectele cheie prezente în date: distribuții fiecărei variabile, valori extreme, relații între variabile, tendințe, modele, valori etc. Pentru aceasta, este necesar să avem Un mediu grafic care permite vizualizarea datelor utilizând proiecții diferite, combinând instrumentele statistice cu modelele generate de date, din descriptorii statistici la rezultatul unui algoritm de clasificare necondiționate, de exemplu, variind parametrii de la acesta.

În acest sens, evoluția vizualizării datelor nu sa concentrat numai pe capacitate Pentru a genera grafică complexă cu o rezoluție mai mare într-o scurtă perioadă de timp, dar a încorporat elemente interactive în vizualizarea în sine, sub formă de operații de bază (selecție, filtrare etc.). Potrivit lucrării (Keim et al., 2008), analiza datelor vizuale se bazează pe o mantra care este o versiune modificată a propusă de (Shneiderman, 1996):

„Analiza mai întâi –

Afișați importanța –

zoom, filtru și analiză mai departe –

detalii despre cerere „

Astfel, procesul de analiză vizuală constă dintr-un ciclu continuu care începe în date și posibilele sale transformări și care este bifurcat în două abordări complementare, vizualizarea și construcția modelelor, printre care există un dialog cu scopul de a extrage cunoștințele care pot fi utilizate pentru a itera procesul de analiză vizuală cu un nivel mai ridicat de detalii și / sau complexitate, așa cum se arată în Figura 1. Capacitatea de interacțiune trebuie să permită efectuarea utilizatorului vizualizării, cel puțin, operațiile de bază definite de Ben Shneiderman (Prezentare generală, Zoom, filtrare și selecție).

iv id = „fd3c663b5a” Figura 1. Procesul de analiză vizuală. Sursa: Keim și colab. (2008).

Din perspectiva analizei vizuale, primele două etape definite în figura 1 sunt transformarea (sau adaptarea) datelor și vizualizarea acestuia , inclusiv interacțiunea. Prin urmare, odată ce obiectivul analizei vizuale a datelor este stabilit, se selectează un tip de afișaj interactiv care permite o scanare preliminară.

în prezent, pentru a atinge această sarcină. Un nou aliat, care Elimină necesitatea de a crea aplicații specifice și oferă o interfață vizuală coerentă. Este vorba despre browserele web, care vizualizează paginile care conțin codul sursă care construiește (prin Render) Vizualizarea când pagina este accesată și încărcată. Rezumat, o pagină web este o combinație de CSS (foi de stil care determină aspectul elementelor de pagină), conținutul HTML propriu-zis și codul JavaScript care permite manipularea DOM (din modelul de obiect al documentului englez, adică structura vizualizărilor site-ului în sine ca ierarhic structurat), generând un conținut nou care sunt încorporate dinamic, inclusiv codul HTML și grafică vectorială (grafică vectorială SVG sau scalabilă). Graficul (sau mai degrabă, cum să îl construiți) face parte din pagină și este afișat când browserul rulează comenzile necesare pentru a afișa conținutul paginii.

În acest mod, generarea unui afișaj interactiv de date poate fi văzută ca crearea unei pagini web construite dinamic care vizualizează aceste date conform unei configurații prestabilite. În acest sens, D3 (sau D3.JS) este o librărie JavaScript care permite manipularea datelor în diferite formate (tabele, CSV sau JSON, printre altele) și generează grafică vectorială dinamic, care poate fi încorporată pe pagina web pentru manipularea sa, Inclusiv elemente de interactivitate, atât în ceea ce privește interfața cu utilizatorul, cât și utilizarea tranzițiilor care furnizează dinamism vizualizării (Murray, 2013).

Având în vedere flexibilitatea sa, D3 poate fi utilizat pentru a crea orice tip de vizualizare interactivă, generatoare Elemente grafice din date care alimentează vizualizarea, de la grafice de bare la afișaje complexe prin combinarea diferitelor elemente grafice. Unul dintre cele mai interesante aspecte ale D3 este încorporarea interacțiunii ca parte a vizualizării în sine, astfel încât să devină interfața de acces la date, permițând manipularea acestuia în funcție de operațiunile de bază definite de (Shneiderman, 1996).

Acest exemplu, bazat pe munca lui Jason Davies, vă permite să verificați modul în care analiza vizuală poate fi utilizată pentru a detecta relațiile dintre variabile, în acest caz categoric. Graficul interactiv permite reproducerea tabelului de urgență între diferitele variabile ale setului de date, fiind posibilă detectarea asociațiilor la ochiul liber, traversând, de exemplu, sexul variabil cu variabila de supraviețuire, prin deplasarea verticală a acestuia. Valorile fiecărei variabile categorice, arătate orizontal, pot fi, de asemenea, comandate. Deși analiza vizuală nu oferă nivelul de detaliu furnizat de o analiză statistică clasică (în acest caz, coeficientul Chi-pătrat sau V de Cramor), permite verificarea rapidă a combinațiilor de variabile care merită să fie explorate.
Julià Menguillón este profesor de studii de calculator, multimedia și telecomunicații ale UOC. Domeniile sale de cunoștințe sunt învățarea virtuală (e-learning) și resursele educaționale deschise. El este cercetător la Grupul Laika (învățarea analiticii pentru inovare și aplicarea cunoștințelor în învățământul superior) și a fost responsabil pentru domeniul de cercetare aplicat al Centrului Elecelan.
Referințe

Keim, D., Andrienko, Gwete, JD, Görg, C., Kohlhammer, J., & melançon, G. (2008). Analiză vizuală: definiție, proces și provocări. În vizualizarea informațiilor (pp. 154-175). Springer Berlin Heidelberg.

Shneiderman, B. (1996, septembrie). Ochii au: o sarcină prin taxonomia tipului de date pentru vizualizările informațiilor. În limbile vizuale, 1996. Proceedings, Simpozionul IEEE (PP. 336-343). IEEE.

Murray, S. (2013). Vizualizare interactivă a datelor pentru Theweb. O’ReillyMedia, Inc.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *