Big data: retos, posibilidades y aprovechamiento

En los últimos años han surgido nuevas fuentes de información que generan volúmenes de datos sin precedentes. Las redes sociales, los dispositivos móviles, sensores, dispositivos GPS, las fotos y los vídeos se almacenan en bases de datos que pueden llegar a alcanzar los petabytes o exabytes.

Según IBM, el 90% de la información generada en la actualidad ha sido creada en los dos últimos años. Debido a este crecimiento se ha popularizado el término Big Data, que está llamado a convertirse en una de las tendencias tecnológicas con más futuro en los próximos años.

¿Qué es Big Data?

Podría decirse que el principal objetivo del análisis de Big Data es transformar inmensas cantidades de datos incorrelados en algo útil para la toma de decisiones. Las posibilidades que ofrece Big Data son prácticamente infinitas y puede encontrarse una aplicación práctica en casi todos los sectores. Algunas de ellas pueden ser más intuitivas, como la detección de tendencias complejas que permitan tomar decisiones en mercados de activos financieros o el adelantarse a cualquier tipo de desastre natural o meteorológico. Otras, más sociológicas: mediante el análisis de patrones de texto en Twitter se puede entender y predecir el comportamiento y el sentimiento de un grupo social o incluso detectar gaps de conocimiento entre los más jóvenes para establecer planes de estudio. También puede aumentar nuestra calidad de vida mejorando diagnósticos médicos gracias a la correlación de multitud de pruebas médicas digitales.

Retos del Big Data
Cada vez más empresas se están dando cuenta de que las grandes cantidades de información que acumulan pueden ayudar de manera decisiva a la toma de decisiones de los equipos de management y a la generación de nuevos negocios. Sin embargo, esto no es una tarea sencilla y hay algunos retos que afrontar para lograrlo.

En la actualidad, casi cualquier organización que quiera implementar Big Data se topa con carencias tecnológicas. Las herramientas convencionales no están diseñadas para obtener el máximo provecho de los grandes volúmenes de información por lo que son necesarias nuevas inversiones en tecnología. Dentro de los nuevos retos que el Big Data propone a los departamentos de IT de las empresas se encuentran el almacenamiento masivo de datos, la integración de múltiples formatos (textos, documentos, fotos, videos…), la incorporación de información desde múltiples orígenes (incluso desde fuera de la propia organización) y el tratamiento y obtención de resultados en tiempo real.

Durante la integración de estas tecnologías, es fundamental el desarrollo de técnicas a medida de análisis de Big Data que sean apropiadas para los objetivos perseguidos por cada empresa. Las técnicas existentes son muy variadas y van desde el análisis de patrones por comparación hasta los algoritmos genéticos para detectar tendencias no lineales. Por ejemplo, utilizando unas técnicas de análisis concretas sobre un conjunto de datos de consumos se pueden determinar comportamientos comerciales que nos ayuden en nuestro negocio, mientras que con otras técnicas diferentes sobre el mismo conjunto de datos se pueden detectar posibles fraudes a la Administración. Por tanto, la estrecha colaboración entre los equipos de IT y los diferentes departamentos de negocio es un reto clave para determinar qué técnicas de análisis de Big Data son más útiles para la toma de decisiones en cada sector de actividad.

A pesar de lograr tener un escenario tecnológico apropiado con técnicas de análisis afinadas, puede darse la circunstancia de que los muestreos de información disponibles no sean completos. Esto también puede provocar que las conclusiones obtenidas del análisis del Big Data no sean concluyentes y lleven a decisiones erróneas. Cada día se generan unos 350 TB de tweets, lo que podría hacer pensar que Twitter tiene un caldo de cultivo excelente acerca de las tendencias de la sociedad actual. Sin embargo, esta afirmación no sería del todo correcta porque las tendencias observadas corresponden a la parte de la sociedad que hace uso de Twitter. Gran parte del éxito del Big Data recae sobre la correcta presentación e interpretación de los análisis por parte de los equipos de dirección teniendo en cuenta los orígenes de la información y su sesgo.

Por último, cabe destacar también los nuevos retos en cuanto a legislación se refiere. En un entorno tan globalizado, el tratamiento de los datos con fuentes en diferentes países debe ser acorde a las leyes de protección de datos internacionales [5]. Una de las mayores potencialidades que tiene el Big Data es la combinación de datos de diferentes fuentes, ya sean empresas o Administraciones Públicas, ya que cuanto mayores sean los muestreos de información más precisos serán los análisis y más aplicaciones surgirán.

Conclusiones

El análisis de Big Data es una nueva tendencia en el uso de la información que puede generar beneficios tanto a las empresas como a toda la sociedad dado el amplio universo de las aplicaciones prácticas que se le puede dar. No obstante, los retos técnicos que plantea no son sencillos y requieren mucha inversión lo que puede provocar que los beneficios no lleguen

a ser notables en el corto plazo. Los efectos de la legislación de la protección de datos son más difíciles de determinar pero pueden igualmente dificultar el aprovechamiento de todas las posibilidades del Big Data.

 

Igor Delgado

Manager en el Data Warehouse Corporativo, BBVA, Madrid (España)