SQL versus MapReduce?
miércoles, abril 22nd, 2009En los últimos días se han publicado varios artículos sobre un paper titulado «A Comparison of Approaches to Large-Scale Data Analysis», el cual compara el rendimiento de análisis de datos usando MapReduce (Hadoop) y SQL (en dos bases de datos: Vertica y una comercial no identificada). Los resultados: SQL es más eficiente en las consultas mientras que Hadoop es más eficiente al momento de cargar/leer los datos. El problema del estudio realizado es que los investigadores (uno de ellos asociado con Microsoft) escogieron problemas para los cuales SQL es obviamente más apropiado. El paper trata de comparar ambas tecnologías como si fueran equivalentes y la una pudiera reemplazar a la otra. En realidad, ambas tecnologías fueron diseñadas para resolver problemas distintos y pueden llegar a ser complementarias. En el futuro, MapReduce y SQL co-existirán, como ya lo están sugiriendo la gente de Aster.