Las tecnologías de Big Data y analítica permiten hacer a tu organización más competitiva y crecer sin límites. Para aprovechar al máximo este valioso recurso de datos, las empresas deben abordar las 4 V’s del Big Data. Pero si una organización está capturando grandes cantidades de datos necesitará soluciones específicas para su análisis, como un Intelligent Data Lake. Pero antes de ello vamos a detenernos un momento a analizar el valor que aporta el Big Data para una compañía.
Las 4 V’s del Big Data en infografía
Expertos Data Scientists de IBM dividen el Big Data en 4 dimensiones del Big Data: Variedad, Volumen, Veracidad y Velocidad. Esta infografía explica y da ejemplos de cada una de ellas:
Es cierto que el término “Big Data” no es algo nuevo. Para muchas personas este término se asocia directamente a “muchos datos”. No obstante entender esta tecnología de esta manera, no es del todo acertado. La tecnología Big Data implica:
- Recopilación.
- Almacenamiento.
- Explotación.
… De un gran volumen de datos. No obstante, esto no implica necesariamente que estemos hablando de “Big Data”.
Las 4 V´s del Big Data
Se puede decir que el entorno Big Data tiene que tener estas dimensiones, conocidas como las 4 V’s del Big Data, que representan los desafíos y las oportunidades clave que enfrentamos al lidiar con volúmenes masivos de información desempeñando un papel fundamental en cómo abordamos la recopilación, el almacenamiento, el procesamiento y la comprensión de los datos en la era digital.
Volumen
Es posible que en más de una ocasión hayas escuchado que el Big Data no es más que business ingelligence, pero en un formato muy grande. No obstante, más datos, no significan necesariamente que sea Big Data.
Obviamente, el Big Data, necesita una cierta cantidad de datos, pero tener una ingente cantidad de datos, no significa necesariamente que se esté trabajando en Big Data.
También sería un error pensar que todas las áreas del Big Data, son de business intelligence. El Big Data, no está limitado o definido por los objetivos que se buscan con esa iniciativa. Sino que lo estará por las características de los propios datos.
Ejemplo
Una empresa de comercio electrónico esta celebrando su «Black Friday». Durante este evento, miles de personas visitan su sitio web y realizan compras en línea. Cada acción que un cliente realiza en el sitio, como ver productos, agregar elementos al carrito o realizar compras, se registra como datos.
El volumen de datos generado en este día es inmenso. Cada segundo, se recopilan datos de miles de usuarios, y esto se mantiene durante todo el día. Al final del evento, tienes terabytes de datos de transacciones, registros de actividad del sitio web y perfiles de clientes.
Este es un ejemplo de la V de Volumen en las 4 V’s del Big Data. Se refiere a la inmensa cantidad de datos que se generan y recopilan continuamente en situaciones como esta. En el contexto del Big Data, gestionar y analizar este volumen masivo de datos de manera eficiente es esencial para obtener información valiosa que pueda ayudar a tomar decisiones comerciales informadas y brindar una mejor experiencia al cliente.
Variedad
En la actualidad, podemos basar nuestras decisiones en los datos prescriptivos conseguidos a través del Big Data. Gracias a esta tecnología, cada acción de clientes, competidores, proveedores etc, va a generar información prescriptiva que irá desde datos estructurados y fáciles de gestionar, hasta información no estructurada difícilmente usable para la toma de decisiones.
Cada dato, o núcleo de información va a requerir que sea tratado de una manera específica. Además, cada tipo de dato, requerirá unas necesidades de almacenamiento específicas (el almacenamiento de un e-mail será mucho menor que el de un vídeo).
Ejemplo
Imagina que eres un analista de datos en una agencia de marketing digital. Tu trabajo consiste en analizar el rendimiento de las campañas en línea de tus clientes. Ahora bien, tus datos provienen de diversas fuentes: redes sociales, anuncios en línea, correos electrónicos, sitios web y más. Cada fuente de datos tiene su propio formato y estructura. Algunos datos son numéricos, otros son texto no estructurado, algunos están en hojas de cálculo y otros en bases de datos.
Aquí es donde entra en juego la V de Variedad en las 4 V’s del Big Data. La variedad se refiere a la amplia gama de tipos de datos y formatos en los que vienen. En tu trabajo, debes lidiar con esta diversidad de datos para obtener una imagen completa del rendimiento de las campañas.
Veracidad
Esta V se va a referir tanto a la calidad del dato como a su disponibilidad.
Cuando hablamos de analítica de negocio tradicional, el origen de los datos va a ser mucho más reducido tanto en su cantidad como en su variedad. No obstante, la organización va a tener un mayor control sobre ellos, siendo mayor su veracidad.
Cuando hablamos de Big Data, variedad va a significar una mayor incertidumbre sobre la calidad que tiene ese dato y su disponibilidad. También va a tener su implicación en cuanto a las fuentes de datos que podremos tener.
Ejemplo
En el departamento de atención al cliente de una tienda en línea muy popular. Tienen acceso a una gran cantidad de datos de los clientes, incluidas sus compras, historiales de navegación y preferencias. Un día, el equipo recibe un informe que muestra un aumento inusual en las quejas de los clientes sobre la calidad de los productos entregados. Según los datos, parece que la calidad de los productos ha disminuido significativamente en las últimas semanas.
En las 4 V’s del Big Data esta dimensión se convierte en algo crítico. Para garantizar la veracidad de los datos, el equipo debe realizar un análisis exhaustivo y verificar la calidad de los datos recopilados. A veces, problemas técnicos o errores en la recopilación pueden dar lugar a datos inexactos. Es crucial que los datos sean confiables antes de tomar decisiones importantes basadas en ellos.
Velocidad
Es muy posible que la Variedad y la Veracidad no fuesen tan relevantes ni supondrían tanta presión al afrontar una iniciativa de Big Data si no fuera por el elevado Volumen de información que hay que manejar y, sobre todo, por la Velocidad a la que hay que generar y gestionar la información.
Los datos van a suponer un input para el área de tecnología (será fundamental que se sea capaz de almacenar y digerir grandes cantidades de información). Y la parte del output será el de las decisiones y reacciones que posteriormente implicará a los dpto correspondientes. Lo importante en este punto es que sean capaces de reaccionar con la velocidad necesaria para potenciar el área de negocio.
Ejemplo:
Eres parte de un equipo de análisis de una empresa de transmisión de video en línea. La plataforma es utilizada por millones de personas en todo el mundo para ver películas y programas de televisión. Ahora bien, cada vez que alguien reproduce un video, se generan datos. Esto incluye cuánto tiempo se tarda en cargar el video, cuánto tiempo se reproduce, qué parte se omite y si hay problemas de calidad.
Es así como la V de Velocidad en las 4 V’s del Big Data destaca la importancia de la capacidad de procesar datos rápidamente y tomar decisiones en tiempo real. En este contexto, las soluciones de Big Data, como el procesamiento de datos en streaming, son esenciales para garantizar que tus usuarios tengan una experiencia de visualización fluida y de alta calidad.