Date mari: o mică introducere

iv id = „13841AC140”

Am colectat informații despre date mari și introducând noțiuni asupra subiectului în unele dintre cursurile mele, dar astăzi În timp ce pregătește o conferință, mi-am dat seama că a fost un subiect pe care nu l-am menționat încă pe pagină, în ciuda faptului că este una dintre cele mai în prezent tendințe din industrie.

Prin date mari, ne referim exact ce vă referiți Numele propriu indică: tratamentul și analiza depozitelor de date uriașe, atât de disproporționat de mari încât este imposibil să le tratăm cu instrumentele și analiticii bazei convenționale. Tendința este încadrată într-un mediu care pare nimic ciudat: proliferarea paginilor web, aplicații imagine și video, rețele sociale, dispozitive mobile, aplicații, senzori, internet de lucruri etc. Capabil să genereze, conform IBM, mai mult de 2,5 chintiloane de octeți pe zi, până la punctul în care 90% din datele lumii au fost create în ultimii doi ani. Vorbim despre un mediu absolut relevant pentru multe aspecte, de la analiza fenomenelor naturale, cum ar fi datele climatice sau seismografice, în medii precum sănătatea, siguranța sau, desigur, mediul de afaceri. Și tocmai în acea zonă, în cazul în care companiile își dezvoltă activitatea în cazul în care un interes care face ca datele mari să apară în ceva de genul „Următorul Buzzword”, cuvântul vom scrie cu siguranță de la peste tot: vânzătorii tehnologici, instrumente, consultanți etc. La un moment dat când majoritatea managerilor nu s-au așezat niciodată în fața unei singure pagini Google Analytics și sunt foarte surprinse atunci când văd ceea ce este capabil să facă, vine o panoramă de instrumente proiectate astfel încât lucrurile extrem de mai mari și complexe să aibă sens. Fiți frică, o mulțime de frică.

Ce exact în spatele buzunarului? Practic, dovezile că instrumentele de analiză nu vin să poată converti în informații utile pentru gestionarea afacerilor datele generate. Dacă compania dvs. nu are o problemă cu analiticii de date, este pur și simplu pentru că nu este locul în care trebuie să fie sau nu știe cum să obțină informații din mediul înconjurător: de îndată ce ne alăturăm problemelor tradiționale de operațiuni și tranzacțiilor ca fiind un Interacțiunea bidirecțională din ce în ce mai intensă cu clienții și mișcarea de analiză web care generează rețele sociale de tot felul, ne aflăm o panoramă în care nu este un dezavantaj major în ceea ce privește cei care sunt. Este pur și simplu că operarea în mediul înconjurător cu o mai mare capacitate de generare a datelor din istorie poartă adaptarea instrumentelor și proceselor. Baze de date neconvenționale, care pot ajunge la petabytes, exabytes sau zetabyte și necesită tratamente specifice pentru depozitarea și prelucrarea lor sau nevoile de vizualizare.

Datele mari au fost, de exemplu, steaua de la târgul Oracle OpenWorld: Poziționarea adoptată este de a oferi mașini uriașe cu capacități uriașe, procesare multiparaleloe, analiză vizuală nelimitată, prelucrarea datelor eterogene etc. Evoluții precum EXADATA ȘI ACHIZIȚIILE CA ENDECA sprijină o ofertă bazată pe gândirea mare, că unii nu au ezitat să discute: În fața acestei abordări, realitatea este că unele companii se concentrează mai mult pe subiect, cum ar fi Google, Yahoo! O Facebook sau totalitatea startupilor nu utilizează uneltele Oracle și optează, în schimb, printr-o aproximare bazată pe distribuție, în nor și în sursa deschisă. Open Source sunt Hadoop, un cadru extrem de popular în acest domeniu care permite aplicațiilor să lucreze cu depozite uriașe de date și mii de noduri, create inițial de Doug Cutting (care i-au dat același nume ca și elefantul fiului său și inspirat de Google Instrumente, cum ar fi MapReduce sau Sistemul Google File sau Nosql, sistemele de baze de date non-relaționale necesare pentru a găzdui și procesa complexitatea enormă a datelor de toate tipurile generate și că, în multe cazuri, logica garanțiilor nu respectă acidul (atomicitatea, consistența, izolarea, durabilitatea ) Caracteristica bazelor de date convenționale.

În viitor: o panoramă de adopție tot mai mare și multe multe întrebări. Implicațiile pentru utilizatori și confidențialitatea acestora sau companiile și fiabilitatea sau potențialul real al rezultatelor obținute: ca revizuirea tehnologiei MIT, mari responsabilități. În prezent, un lucru este sigur în date mari: pregătiți urechile pentru a asculta termenul.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *