Ho raccolto informazioni sui grandi dati e introducono nozioni sull’argomento in alcuni dei miei corsi, ma oggi Mentre preparavo una conferenza ho capito che è stato un argomento che non avevamo ancora menzionato sulla pagina, nonostante sia una delle tendenze più attualmente indicate nel settore.
da Big Data ci riferiamo esattamente a ciò che il tuo Il proprio nome indica: il trattamento e l’analisi di enormi repository di dati, così sproporzionatamente grandi che è impossibile trattarli con strumenti e analisi del database convenzionali. La tendenza è incorniciata in un ambiente che suona come niente strano: la proliferazione di pagine Web, immagini e applicazioni video, social network, dispositivi mobili, app, sensori, internet di cose, ecc. Capace di generare, secondo IBM, più di 2,5 quintilloni di byte al giorno, al punto che il 90% dei dati del mondo è stato creato negli ultimi due anni. Parliamo di un ambiente assolutamente rilevante per molti aspetti, dall’analisi dei fenomeni naturali come i dati climatici o sismografici, a ambienti quali salute, sicurezza o, naturalmente, l’ambiente aziendale. Ed è proprio in quell’area in cui le aziende sviluppano la loro attività in cui un interesse che rende i grandi dati emergenti in qualcosa come “la prossima parola d’ordine”, la parola che scriverà sicuramente da tutto il resto: venditori tecnologici, strumenti, consulenti, ecc. In un momento in cui la maggior parte dei manager non si è mai seduta davanti a una semplice pagina di Google Analytics e sono molto sorpresi quando vedono cosa è in grado di fare, arriva un panorama di strumenti progettati in modo che le cose immensamente più grandi e complesse possano dare un senso. Augurati, molta paura.
Che cosa esattamente dietro la parola d’ordine? Fondamentalmente, le prove che gli strumenti di analisi non vengono in grado di convertire in informazioni utili per la gestione aziendale i dati generati. Se la tua azienda non ha problemi con l’analisi dei dati, è semplicemente perché non è dove deve essere o non sa come ottenere informazioni dall’ambiente: non appena ci uniiamo all’operazione tradizionale e alle operazioni di transazioni come un L’interazione bidirezionale sempre più intensa con i clienti e il movimento del Web Analytics che generano social network di tutti i tipi, ci troviamo un panorama in cui non è un grave svantaggio rispetto a coloro che sono. È semplicemente che operando nell’ambiente con una maggiore capacità di generazione di dati nella storia porta l’adattamento di strumenti e processi. Database non strutturali e non convenzionali, che possono raggiungere petabyte, exabyte o zetabyte e richiedono trattamenti specifici per le loro esigenze di archiviazione e elaborazione o di visualizzazione.
Big Data è stato, ad esempio, la stella al defunto Oracle OpenWorld: il Il posizionamento approvato è quello di offrire macchine enormi con enormi capacità, lavorazione multiparaleloe, analisi visiva illimitata, elaborazione di dati eterogenei, ecc. Sviluppi come Exadata e acquisizioni come Endeca supportano un’offerta basata sul pensiero grande, che alcuni non hanno esitato a discutere: di fronte a quell’approccio, la realtà è che alcune delle aziende si sono concentrate sull’argomento, come Google, Yahoo! o Facebook o la totalità delle startup non utilizzano strumenti di oracle e opt, invece, da un’approssimazione basata sulla distribuzione, nel cloud e in open source. Open Source sono Hadoop, un quadro molto popolare in questo campo che consente alle applicazioni di lavorare con enormi repository di dati e migliaia di nodi, originariamente creati da Doug Tagling (che gli ha dato lo stesso nome di Elephant giocattolo di suo figlio e ispirato da Google Tools MapReduce o Google System, o NOSQL, sistemi di database non relazionali necessari per ospitare ed elaborare l’enorme complessità dei dati di tutti i tipi generati e che in molti casi la logica delle garanzie non seguono acido (atomicità, coerenza, isolamento, durata ) Caratteristica dei database convenzionali.
In futuro: un panorama di adozione crescente e molte, molte domande. Implicazioni per gli utenti e la loro privacy, o le società e l’affidabilità o il potenziale reale dei risultati ottenuti: come revisione della tecnologia MIT, grandi responsabilità. Al momento, una cosa è sicura nei grandi dati: prepara le tue orecchie per ascoltare il termine.