Small Data frente a Big Data: de vuelta a lo básico

Small Data es un conjunto de datos con un volumen y un formato que hacen que los datos sean accesibles, informativos y procesables.

El Grupo Small Data da la siguiente explicación:

El Small Data o las bases de datos pequeñas conectan a las personas con perspectivas oportunas y reveladoras (derivadas del Big Data o de fuentes “locales”), organizadas y empaquetadas, a menudo visualmente, de forma que son accesibles, entendibles y procesables en las tareas de cada día.

Esta definición es aplicable a los datos que tenemos, así como a las aplicaciones de usuario final y a los bancos de trabajo de los analistas para convertir los conjuntos de Big Data en conjuntos de datos procesables. Las palabras clave de “acción” son conectarorganizarempaquetar y el “valor” estriba en hacer que las perspectivas estén disponibles para todos (accesibles), sean fáciles de aplicar (entendibles) y se centren en la tarea en cuestión (procesables).

bbva-openmind-banafa-big-data-basics

El término Small Data contrasta con el de Big Data, que normalmente hace referencia a una combinación de datos estructurados y no estructurados que se pueden medir en petabytes o exabytes. A menudo se dice que el Big Data se caracteriza por las 3 uves: el volumen de datos, la variedad de los tipos de datos y la velocidad a la que se procesan, la combinación de todo lo cual hace que el Big Data sea muy difícil de manejar. En cambio, el Small Data se compone de porciones utilizables.

La idea del Big Data es convincente: ¿quiere descubrir patrones ocultos acerca del comportamiento de los clientes, predecir la siguiente elección o ver dónde se debe centrar el gasto en publicidad? Hay una aplicación para ello. Y, si prestamos atención a los entendidos, tenemos que decir a nuestros hijos que se conviertan en científicos de datos, pues todas las empresas necesitarán contratar todo un ejército de profesionales para sobrevivir a la siguiente oleada de cambio digital.

Pero todo el vapor que arroja la máquina de moda del Big Data parece oscurecer nuestra visión del panorama general: en muchos casos el Big Data resulta excesivo. Y en la mayoría de los casos solo es útil si los que no somos científicos de datos podemos hacer algo con ello en nuestro trabajo diario: aquí es donde entra en juego el Small Data.

En esencia, la idea del Small Data es que las empresas pueden obtener resultados procesables sin tener que adquirir los tipos de sistemas que habitualmente se utilizan en el análisis del Big Data. Una empresa podría invertir en un lote completo de almacenamiento en servidores y utilizar máquinas de análisis avanzadas y aplicaciones de minería de datos para examinar una red de multitud de bits de datos, incluidas las fechas y las horas de actuación de los usuarios, información demográfica, etc. Todo esto podría canalizarse en un almacén de datos central, donde algoritmos complejos ordenan y procesan los datos para mostrarlos en informes detallados. Aunque las empresas se han beneficiado de este tipo de procesos de muchas maneras, muchas empresas consideran que estas mediciones requieren muchísimo esfuerzo y, en algunos casos, se pueden conseguir resultados similares con estrategias de minería de datos mucho menos robustas.

Small Data es una de las formas en que las empresas retroceden y se desentienden ahora de una especie de obsesión por las últimas y más novedosas tecnologías que apoyan procesos empresariales más sofisticados. Los que promueven el Small Data sostienen que es importante que las empresas utilicen sus recursos de manera eficiente y evitar gastar en exceso en ciertos tipos de tecnologías.

¿Por qué utilizar Small Data?

  • El análisis Big Data es difícil: hacerlo a escala y esperar a que se manifiesten los beneficios puede llevar tiempo. Por no hablar del hecho de que la mayoría de los profesionales de marketing y los estrategas de Internet no necesitan los datos completos del Big Data para enfocar sus campañas ni para ofrecer experiencias personalizadas.
  • El análisis Small Data está a nuestro alrededor: los canales sociales disponen de gran abundancia de Small Data, datos ya listos que se pueden recoger y que proporcionan información para tomar decisiones de marketing y de compra. A nivel personal creamos constantemente pequeños conjuntos de datos cada vez que nos registramos, hacemos una búsqueda, navegamos, publicamos algo, etc., creando así una firma única que deja entrever nuestro estado físico y digital.
  • El análisis Small Data forma el nuevo núcleo de CRM : CRM social que se utiliza para crear un panorama completo de los clientes, sus segmentos, las personas influyentes e incluso los competidores: tenemos que combinar las perspectivas de los canales sociales y las campañas con el análisis Web y los datos transaccionales. El Small Data es la clave para crear estos ricos perfiles que formarán la parte central de las nuevas soluciones CRM.
  • ROI: al hacer hincapié en la recta final del Big Data se pueden aprovechar las inversiones en el Small Data (10.000 millones de dólares y subiendo, según el IDC, gastados en sistemas de entrada, herramientas y servicios).
  • El marketing basado en los datos es la nueva ola: el marketing basado en el Big (y en el Small) Data tiene el potencial de revolucionar la forma en que las empresas interactúan con los clientes, de transformar la forma en que los clientes acceden y consumen (e incluso llevan) datos útiles y, en última instancia, de redefinir la relación entre compradores y vendedores.
  • Los ejemplos relacionados con el consumo son abundantes: los consumidores han visto el potencial del Small Data para optimizar sus compras, potenciar su rutina de actividad física o hacer recomendaciones sobre el mejor precio para su próximo vuelo. Los dispositivos basados en datos más inteligentes y portátiles que están en camino prometen que habrá una mayor demanda de dispositivos de datos configurados y de entrega de datos que se “ajusten” a las necesidades de los consumidores cotidianos.
  • Los vendedores de plataformas y herramientas comienzan a prestar atención: la promesa de hacer que el análisis Big Data sea operativo y de “convertir las ideas en acción” es una señal importante que están lanzando grandes nombres del mundo de la tecnología como SAP, Oracle y EMC.
  • Concierne al usuario final: el Small Data trata del usuario final, de lo que necesitan los usuarios finales y de cómo pueden actuar. Si nos centramos primero en el usuario, muchas de nuestras decisiones tecnológicas se tornan más claras.
  • Sencillo: Small Data son los datos adecuados, parte del Small Data se iniciará como Big Data, pero no deberíamos necesitar un científico de datos para entenderlos o para aplicarlos a las tareas diarias, así de sencillo.

El futuro del Small Data

Rufus Pollock, de la Open Knowledge Foundation, dice que el bombo que se le ha dado al Big Data está equivocado, son los pequeños conjuntos de datos, los datos vinculados los que realmente tienen valor.

Los debates en torno al Big Data pierden un panorama mucho mayor y más importante: la oportunidad real no está en el Big Data sino en el Small Data. No en el “gran sistema” centralizado, sino en la discusión de los datos descentralizados. No en “un anillo que lo gobierne todo” sino en las “pequeñas piezas ligeramente unidas”.

La verdadera revolución es la democratización de los medios de acceso, almacenamiento y procesamiento de datos, no se trata de que las grandes organizaciones estén ejecutando software en paralelo en decenas de miles de servidores, sino de haya más personas que nunca que puedan colaborar de forma eficaz en torno a un ecosistema de información distribuido, un ecosistema de Small Data.

Los pequeños conjuntos de datos son suficientes para resolver muchos problemas y responder a muchas preguntas. Los datos del consumo energético de mi hogar, los horarios de los autobuses locales, el gasto del gobierno: todos esos son pequeños conjuntos de datos. Todo lo que se procesa en Excel es un pequeño conjunto de datos. Y si queremos aumentar la escala, la forma de hacerlo es convertir en componentes los pequeños conjuntos de datos: creando e integrando “paquetes” pequeños de datos, no creando enormes monolitos de datos, dividiendo los problemas de forma que funcione entre las personas y las organizaciones, no creando enormes silos centralizados.

La próxima década será la de los modelos distribuidos, no la de los modelos centralizados, la de la colaboración, no la del control, la del Small Data, no la del Big Data.

Ahmed Banafa

Experto en IC | Profesor | Autor | Orador

Referencias

http://www.theguardian.com/news/datablog/2013/apr/25/forget-big-data-small-data-revolution

http://whatis.techtarget.com/definition/small-data

http://www.zdnet.com/10-reasons-2014-will-be-the-year-of-small-data-7000023667/

http://www.techopedia.com/definition/29539/small-data

http://technologies.lesechos.fr/partners/capgemini/cacheDirectory/HTMLcontributions/img/20120711152005_BigData.jpeg

http://www.312analytics.com/wp-content/uploads/2013/03/big-data-versus-small-data1.jpg

http://www.b-eye-network.com/blogs/oneal/Big%20data%20Small%20data%20v4.png

https://www.rd-alliance.org/system/files/800px-BigData_SmallData.png