El Big Data (datos masivos) es un concepto que ha estado de moda este último tiempo. Fue nombrado y mencionado en diversos lugares y por diferentes personas en distintos contextos, pero no es fácil encontrar una sola definición y que, a su vez, tenga consenso.
Cuando se comparte una publicación en nuestras redes sociales, se consulta por algún producto en una tienda on line o se envía un correo electrónico, se genera un gran volumen de datos sobre el comportamiento, y gustos de las personas. Estas huellas digitales que se dejan registradas, son producidas por la interacción con los diferentes dispositivos a los que estamos conectados: celulares, computadoras, televisores, GPS, dispositivos IoT, sensores, entre otros, que se han transformado en una importante y valiosa información pretendida por diversos actores y con diferentes utilidades.
Sin embargo esta enorme cantidad de datos es solo una parte de la historia. El Big Data, a diferencia de los focus group o de una encuesta tradicional en la que se tiene que elaborar una respuesta de manera lineal y estructurada, tiene la particularidad de que los datos creados fueron generados de manera espontánea a partir de acciones como, por ejemplo, pagar los servicios en plataformas de pago electrónico, comprar entradas para el teatro por Internet o transmitir un recital en streaming, entre otra infinidad de posibilidades. Es tan grande el volumen de datos y la velocidad con la que circulan, que para poder recopilarlos, analizarlos y procesarlos, es necesario contar con tecnología que nos ayude a ordenar la información.
Cuanta más información pueda procesarse, más data se puede analizar y esto nos otorga la posibilidad de desarrollar tecnologías que no teníamos en nuestros horizontes. Es por eso que las áreas de la inteligencia artificial, como Machine Learning y Deep Learning no podrían existir sin el desarrollo del Big Data.
En el año 2001 se produjo un hito clave en la historia del Big Data. El analista Doug Laney de la consultora Gartner, empresa de origen estadounidense, escribió el artículo Gestión de datos: controlar el volumen, la velocidad y la variedad de los datos. Este documento fue considerado como uno de los más influyentes para que distintos actores comiencen a estudiar el fenómeno de los grandes datos. Este escrito fue el que comenzó hablar de las 3V: volumen, velocidad y variedad, la razón de ser del Big Data. La primera de ellas hace referencia a la enorme cantidad de información que es posible generar, ya que en la actualidad tenemos dispositivos conectados y funcionando al mismo tiempo en diferentes partes del mundo. La segunda refiere a la velocidad con la que se intercambia la información ya que los datos son creados de manera vertiginosa. Y por último, la tercera de las V alude a la diversidad del dato generado que puede ser, por ejemplo, una publicación en una red social, la búsqueda de un domicilio en alguna aplicación de mapas, escuchar una canción o reproducir un video. Años más tarde, IBM impulsó a nivel mundial la 4V, veracidad, que hace referencia a un punto importante: comprobar que la información que se registra, almacena y analiza sea verdadera.
Son grandes y numerosos los desafíos que se deberán enfrentar en relación al Big Data. La cantidad de datos crece, y con este crecimiento también surgen dilemas relacionados a la filosofía y a la ética. Por ejemplo, vinculado a la privacidad, ya que todos nuestros datos quedan registrados en el mundo digital y esta información puede ser utilizada para diferentes funciones con las cuales hemos acordado o aceptado sin tener el conocimiento adecuado para hacerlo: desde campañas publicitarias cada vez más perfeccionadas y dirigidas a una audiencia específica, a políticas públicas orientadas a mejorar la calidad de vida de las personas.
Como todo nuevo fenómeno el Big Data despierta diversas posturas. Viktor Schönberger, profesor de regulación y gestión de Internet en el Instituto de la Universidad de Oxford, y uno de los expertos más reconocidos internacionalmente en el mundo de los datos masivos dice que el Big Data es el nuevo oro del siglo XXI, mientras que Philip Evans, experto en ciberseguridad, se despega de esta fascinación afirmando que el Big Data puede usarse contra ti. Lo que sí podemos afirmar es que el Big Data está modificando la manera en que conocemos el mundo, desde el modo en que se realiza el planeamiento urbano, la actividad agrícola hasta la manera en que cada Estado o empresa de salud planifica los tratamientos médicos.