¿Qué es el Big Data?

Las Tecnologías de la Información y la Comunicación han experimentado un importante desarrollo en los últimos años, generando una auténtica revolución tecnológica que afecta a prácticamente todos los ámbitos de nuestra sociedad. Uno de los efectos más notables de esta transformación ha sido la capacidad que han adquirido las organizaciones para generar continuamente ingentes cantidades de datos de diversa naturaleza. Sin embargo, el hecho de que la producción de datos masiva sea una realidad en la sociedad actual, no significa necesariamente que dichos datos estén siendo procesados o analizados correctamente para extraer todo su potencial informativo. Así, la necesidad de “sacarle partido” a la gran cantidad de información de la que disponen las organizaciones ha propiciando el surgimiento de una nueva ciencia, el Big Data, cuyo cometido ha sido desarrollar nuevas metodologías para el procesamiento masivo de diversos tipos de datos (Paniagua et al., 2015).

El término “Big Data” fue introducido por primera vez en el mundo de la computación en el año 2005, para referirse a aquellos volúmenes de datos que, debido a su complejidad, formato y/o tamaño, no pueden ser procesados mediante métodos tradicionales, y por lo tanto requieren del uso de alguna técnica alternativa para extraer su valor (Ularu et al., 2012). Sin embargo, a pesar de que el término se ha popularizado enormemente en los últimos años, no todo el mundo tiene claro a qué se refiere exactamente, existiendo cierta confusión en torno a su definición (Schroeck et al., 2012). El problema está en que el propio término, al incluir la palabra “big” como elemento central, dirige la atención casi exclusivamente a la cuestión del tamaño de los datos, si bien en la práctica las exigencias del Big Data no siempre están basadas en el volumen de la información (PowerData, 2013). De hecho, la importancia del Big Data recae en su capacidad para generar valor a partir del procesamiento y el análisis de distintos tipos de datos, más allá del tamaño que tengan éstos (Paniagua et al., 2015), de modo que la mayor parte de sus métodos pueden ser también empleados para trabajar con cantidades de información relativamente reducidas.

Una manera usual de definir el Big Data se basa en la enumeración de las “cinco V” (Volumen, Variedad, Velocidad, Veracidad y Valor), ya que la convergencia de estas cinco dimensiones es precisamente la que caracteriza al fenómeno. A continuación se describen cada una de esas características con mayor detalle:

  • Volumen: esta dimensión hace referencia a la cantidad de datos que es capaz de manejar (Ularu et al., 2012), que como ya se ha comentado es la característica con la que más se asocia al Big Data. En cualquier caso, la dimensión de volumen se refiere sobre todo a la capacidad que tiene el Big Data de procesar grandes cantidades de datos, y no tanto al tamaño de los datos que procesa realmente en la práctica, pues como ya hemos visto, su metodología también puede resultar útil para analizar cantidades de datos más reducidas.
  • Variedad: este término hace referencia a la capacidad que tiene el Big Data de procesar distintos tipos de datos, procedentes de diversas fuentes de información (Schroeck et al., 2012). En este sentido, mientras que hace décadas la naturaleza de la información era básicamente numérica y textual, hoy en día los datos son recogidos en múltiples formatos, ya sean estructurados, semi-estructurados o no estructurados (Rajaraman, 2016). Así, con la reciente estampida de las redes sociales y los dispositivos inteligentes, los datos están siendo generados hoy en día en todo tipo de formatos, desde imágenes, audios y vídeos, hasta tweets, “clicks” y geolocalizaciones (Schroeck et al., 2012).
  • Velocidad: mientras que las bases de datos convencionales eran relativamente estáticas, hoy en día gran parte de la información se genera en tiempo real, por lo que se ha precisado la construcción de nuevos métodos que generen, procesen y analicen los datos de manera cada vez más rápida (Rajaraman, 2016), para evitar así que pierdan relevancia (PowerData, 2013). El Big Data ha dado respuesta a esa necesidad, permitiendo reducir o incluso eliminar el desfase existente entre el momento en el que se obtiene la información y el momento en el que se interpreta, lo cual es especialmente importante en campos como el de la detección de fraude en tiempo real o el del marketing “instantáneo” (Schroeck et al., 2012).
  • Veracidad: esta dimensión hace referencia al hecho de que muchos de los datos que son generados en la actualidad poseen una gran cantidad de “ruido”, por lo que resulta difícil asegurar la veracidad de los análisis realizados mediante Big Data (Rajaraman, 2016). En este sentido, aunque trabajar con grandes cantidades de datos provoca que el error de la muestra se minimice, ni siquiera los procedimientos más avanzados de limpieza y procesamiento de los datos tienen la capacidad de eliminar completamente la imprevisibilidad inherente a determinados procesos, como la climatología, la fluctuación económica o las decisiones de compra de los clientes (Schroeck et al., 2012).
  • Valor: como ya se ha comentado, los datos por sí mismos no tienen ningún valor hasta que son correctamente procesados. En esta línea, el Big Data, gracias al desarrollo de sistemas de almacenamiento y procesamiento accesibles como Hadoop o MapReduced, ha hecho posible la extracción de información de interés a través de la detección de patrones en todo tipo de bases de datos (Rajaraman, 2016). Por lo tanto, el interés principal del Big Data recae, no tanto en que permite trabajar con grandes bases de datos de diversos formatos y en tiempo real, sino en que consigue extraer información de valor a partir de ellas.

Teniendo en cuenta todo esto, el Big Data es de gran utilidad dentro del mundo empresarial, ya que ofrece a las compañías la posibilidad de conocer mejor su propio funcionamiento y entorno, favoreciendo la optimización de los procedimientos en diversas áreas, como la producción, la contabilidad o el marketing (Ularu et al., 2012). Por ejemplo, el público demanda cada vez más un trato personalizado por parte de las empresas, por lo que éstas deben ser capaces de detectar los gustos de sus clientes, para poder así mejorar la fidelización y aumentar en última instancia su volumen de ventas. Esto es algo que puede realizarse hoy en día gracias a las herramientas que ofrece el Big Data (PowerData, 2013), por lo que podemos considerarla como una ciencia que permite identificar y generar nuevas oportunidades de negocio a partir de la extracción de valor de los datos de los que disponen las empresas (Paniagua et al., 2015). En este sentido, según un informe publicado en 2012 por la empresa tecnológica IBM, el 63% de las empresas que hacen uso de herramientas relacionadas con el Big Data reportan una mayor ventaja competitiva en el mercado (Schroeck et al., 2012).

 

REFERENCIAS BIBLIOGRÁFICAS:

Paniagua, E., Martínez-Cava, S., Cancho, M., Jiménez, M. T., García de Vinuesa, L., Lockhart, D., & Lancry, P. (2015). Big Data: El poder de los datos.

PowerData. (2013). Del bit al Big Data. https://doi.org/10.25100/iyc.v16i1.3707

Rajaraman, V. (2016). Big Data Analytics. Resonance, Agosto 2016, 695–716.

Schroeck, M., Shockley, R., Smart, J., Romero-Morales, D., & Trufano, P. (2012). Analytics: The real-world use of big data. How innovative enterprises extract value from uncertain data.

Ularu, E. G., Puican, F. C., Apostu, A., & Velicanu, M. (2012). Perspectives on Big Data and Big Data Analytics. Database Systems Journal, III(4), 3–13.

Política de privacidad