Blog

microPIXEL News
01 NOV

Big o small data: el debate sobre si, para analizar la realidad, "mas es mejor"

¿Cuán grande es una pizza grande? Una rápida consulta a Google dice que una pizza grande debe medir como mínimo 35 centímetros de diámetro. ¿Cuál es el máximo tiempo tolerable para llegar tarde a una boda? "Media hora", responde con idéntica vehemencia la misma fuente. ¿Cuán grande es una base de datos para que sea considerada "de big data"? Y aquí el iconico buscador hace agua. "Si no entra en Excel, es big data", respondió hace poco en las redes sociales un reconocido programador. Una frase que muchos interpretaron en forma peligrosamente literal.

Big data es un término difuso, que refiere al fenómeno de datos masivos provenientes de interactuar con tecnologías interconectadas, como celulares, tarjetas de créditos, redes sociales, etcétera. El volumen es lo primero que salta a la vista de la revolución de datos, pero la naturaleza disruptiva del fenómeno va mucho más allá del tamaño, al punto tal que new data o right data tal vez sean caracterizaciones más felices.

Pero aun cuando la auténtica innovación de big data proviniese de la masividad, cabe cuestionarse si realmente más es mejor y en qué sentido. En una encuesta o experimento científicamente diseñado, más es mejor porque, diseño riguroso mediante, más datos es más de lo mismo, de la misma fuente de información. Por ejemplo, tirar una moneda repetidas veces permite aprender cada vez con más precisión que las chances de que salga cara son 50%. "Más de lo mismo" significa que se tira siempre la misma moneda y que no se la aprende a tirar en los sucesivos tiros, de modo que cada uno de los lanzamientos agrega el mismo tipo de información que la de cualquier tiro, anterior o posterior.

Pero aun cuando la auténtica innovación de big data proviniese de la masividad, cabe cuestionarse si realmente más es mejor y en qué sentido. En una encuesta o experimento científicamente diseñado, más es mejor porque, diseño riguroso mediante, más datos es más de lo mismo, de la misma fuente de información. Por ejemplo, tirar una moneda repetidas veces permite aprender cada vez con más precisión que las chances de que salga cara son 50%. "Más de lo mismo" significa que se tira siempre la misma moneda y que no se la aprende a tirar en los sucesivos tiros, de modo que cada uno de los lanzamientos agrega el mismo tipo de información que la de cualquier tiro, anterior o posterior.

 

 

Leer la nota completa.