La siguiente tendencia de innovación.

Según Microsoft, el cuarto paradigma de la ciencia son datos.

En los descubrimientos científicos, los tres primeros paradigmas eran experimentales, teóricos y (más recientemente) la ciencia computacional. 

Un nuevo libro de ensayos publicado por Microsoft (disponible para su descarga gratuita – kudos, MS) sostiene que un cuarto paradigma del descubrimiento científico está a la mano: el análisis de grandes conjuntos de datos. El libro está dedicado al fallecido investigador Dr. Jim Gray, que fue pionero en la idea con el eslogan: «Son los datos, estúpido». 



La idea básica es que nuestra capacidad para recoger datos científicos ha superado con creces nuestra capacidad actual para analizar, y lo que nuestra atención debe centrarse en el desarrollo de tecnologías que hagan sentido a esta «avalancha de datos».


Del Dr. Gray estipula que ya no es necesario desarrollar computadoras super poderosas de forma aislada,  sino «tener un mundo en el que toda la literatura de la ciencia está en línea, todos los datos de la ciencia está en línea, y que interactúe con los demás.» 

Este sueño ya está cerca de una realidad en algunos ámbitos científicos como la astronomía, donde los instrumentos avanzados generan rutinariamente petabytes de datos disponibles para el análisis público. Y con los nuevos acontecimientos en la computación distribuida y de alto rendimiento, con herramientas de gestión de datos a gran escala de libre disponibilidad, como Hadoop, y con herramientas de análisis de datos de código abierto avanzadas como R rápidamente adaptándose a las escalas de estos conjuntos de datos, el cuarto paradigma es seguro para convertirse en una realidad dominante en otros campos científicos también.


Deja un comentario