Je collectionne des informations sur les grandes données et l’introduction de notions sur le sujet dans certains de mes cours, mais aujourd’hui Tout en préparant une conférence, j’ai compris que c’était un sujet que nous n’avions pas encore mentionné sur la page, malgré l’une des tendances les plus actuellement indiquées dans l’industrie.
par de grandes données, nous référons exactement ce que votre Nom propre indique: le traitement et l’analyse d’énormes référentiels de données, de manière disproportionnée de manière disproportionnée qu’il est impossible de les traiter avec des outils de base de données conventionnels et des analyses. La tendance est encadrée dans un environnement qui ne ressemble à rien d’étrange: la prolifération des pages Web, des applications d’image et de vidéo, des réseaux sociaux, des appareils mobiles, des applications, des capteurs, Internet des objets, etc. Capable de générer, selon IBM, plus de 2,5 quintillones d’octets par jour, au point 90% des données du monde ont été créées au cours des deux dernières années. Nous parlons d’un environnement absolument pertinent pour de nombreux aspects, de l’analyse de phénomènes naturels tels que les données climatiques ou sismographiques, aux environnements tels que la santé, la sécurité ou, bien sûr, l’environnement des entreprises. Et c’est précisément dans ce domaine dans lequel les entreprises développent leur activité dans laquelle un intérêt qui rend les données importantes est émergeant dans quelque chose comme « la prochaine motwnword », le mot que nous écrirons certainement de partout: les fournisseurs de technologie, les outils, les consultants, etc. En un momento en que la mayoría de los directivos nunca se han sentado delante de una simple página de Google Analytics y se sorprenden poderosamente cuando ven lo que es capaz de hacer, llega un panorama de herramientas diseñadas para que cosas inmensamente más grandes y complejas puedan avoir du sens. Ayez peur, beaucoup de peur.
Qu’est-ce que c’est exactement derrière la motopaire? Fondamentalement, la preuve que les outils d’analyse ne viennent pas pouvoir convertir dans des informations utiles pour la gestion des entreprises les données générées. Si votre entreprise n’a pas de problème avec les données analytiques, c’est simplement parce que ce n’est pas là où il doit être ou ne sait pas comment obtenir des informations de l’environnement: dès que nous rejoignons les problèmes de fonctionnement et de transactions traditionnelles en tant que Interaction bidirectionnelle de plus en plus intense avec les clients et les mouvements d’analyses Web qui génèrent des réseaux sociaux de toutes sortes, nous nous trouvons un panorama dans lequel ne pas être un inconvénient majeur concernant ceux qui sont. Il s’agit simplement d’opérer dans l’environnement avec une plus grande capacité de génération de données dans l’histoire comporte l’adaptation d’outils et de processus. Des bases de données non conventionnelles non conventionnelles, qui peuvent atteindre des pétambytes, des exsabytes ou des zétabytes et nécessitent des traitements spécifiques pour leurs besoins de stockage et de traitement ou de visualisation.
Big Data a été, par exemple, l’étoile à la fin Oracle Openworld: le Le positionnement adopté consiste à offrir d’énormes machines avec des capacités énormes, de transformation multiparaleloe, d’analyse visuelle illimitée, de traitement de données hétérogènes, etc. Les développements tels que les exadata et les acquisitions que l’endeca soutiennent une offre basée sur la pensée gros, que certains n’ont pas hésité à discuter: devant cette approche, la réalité est que certaines des entreprises sont plus concentrées sur le sujet, comme Google, Yahoo! o Facebook ou la totalité des startups n’utilisent pas d’outils Oracle et optez, par une approximation basée sur la distribution, dans le cloud et dans la source ouverte. Open Source sont Hadoop, un cadre très populaire dans ce domaine qui permet aux applications de travailler avec d’énormes référentiels de données et des milliers de nœuds, créés à l’origine par Doug Cutting (ce qui lui a donné le même nom que l’éléphant de son fils et inspiré des outils de Google tels que Système de fichier Mapreduce ou Google, ou NOSQL, systèmes de base de données non relationnels nécessaires à la maison et à traiter l’énorme complexité des données de tous types générés et que, dans de nombreux cas, la logique des garanties ne suive pas d’acide (atomicité, cohérence, isolement, durabilité ) Caractéristique des bases de données conventionnelles.
à l’avenir: un panorama d’adoption croissant, et de nombreuses questions. Les implications pour les utilisateurs et leur confidentialité, ou les entreprises et la fiabilité ou le potentiel réel des résultats obtenus: comme l’examen de la technologie MIT, de grandes responsabilités. Pour le moment, une chose est sûre dans les grandes données: préparez vos oreilles pour écouter le terme.