Archive for abril, 2009

Apache Cloud Computing Edition

jueves, abril 30th, 2009

Apache está trabajando en una versión para Cloud Computing. La idea surge del hecho de que actualmente existen varios proveedores de servicios de cloud computing, entre ellos Amazon (con los Amazon Web Services), HP e IBM. Lastimosamente, no existe una pila estándar de Apache para ambientes de cloud computing. Por esta razón surgen problemas de incompatibilidad, lentitud en el desarrollo, dificultades para la identificación y solución de bugs, dificultad (y hasta imposibilidad) de migrar el sistema a otra plataforma de cloud computing, etc. Hay una muy buena presentación sobre el tema disponible en el website de Apache. Recomiendo empezar en la página 31, ya que las páginas 31-60 contienen las diapositivas 1-30 pero con comentarios.

CloudSim Toolkit 1.0 Beta

lunes, abril 27th, 2009

Un grupo de investigación de la Universidad de Melbourne en Australia acaba de liberar la versión Beta de CloudSim. CloudSim es una plataforma de simulación que busca dar soporte a la investigación y desarrollo en el campo de Cloud Computing. El software puede ser descargado de: http://www.gridbus.org/cloudsim/.

Nuevos fondos para investigación sobre Cloud Computing

viernes, abril 24th, 2009

La NSF acaba de otorgar casi $5 millones en fondos para investigación a 14 universidades de EE.UU. para que desarrollen proyectos de cloud computing. Los proyectos utilizarán la infraestructura de la Cloud Computing University Initiative, creada en el 2007 gracias a una alianza de IBM y Google.

Los proyectos financiados utilizarán software y servicios que se ejecutarán en la «nube» de IBM/Google, para explorar ideas innovadoras en el campo del procesamiento masivo de datos.

Más información disponible en Supercomputing Online.

Ct: C for Throughput Computing

miércoles, abril 22nd, 2009

Investigadores de Intel están desarrollando un lenguaje llamado Ct, el cual ayudará a que los programas puedan aprovechar al máximo el rendimiento de computadores con procesadores multicore.

De manera independiente, a Microsoft también le preocupa el problema de la programación en paralelo. Su propuesta, llamada Axum, busca ayudar a los programadores de .NET a desarrollar aplicaciones usando técnicas de programación en paralelo.

Difusión sobre Hadoop

miércoles, abril 22nd, 2009

Allan Avendaño nos ayudó en la difusión del uso de Hadoop para ambientes de cloud computing, dictando una charla en el Flisol. El resumen, material de la charla y hoja de vida de Allan están disponibles en la página del evento.

SQL versus MapReduce?

miércoles, abril 22nd, 2009

En los últimos días se han publicado varios artículos sobre un paper titulado «A Comparison of Approaches to Large-Scale Data Analysis», el cual compara el rendimiento de análisis de datos usando MapReduce (Hadoop) y SQL (en dos bases de datos: Vertica y una comercial no identificada). Los resultados: SQL es más eficiente en las consultas mientras que Hadoop es más eficiente al momento de cargar/leer los datos. El problema del estudio realizado es que los investigadores (uno de ellos asociado con Microsoft) escogieron problemas para los cuales SQL es obviamente más apropiado. El paper trata de comparar ambas tecnologías como si fueran equivalentes y la una pudiera reemplazar a la otra. En realidad, ambas tecnologías fueron diseñadas para resolver problemas distintos y pueden llegar a ser complementarias. En el futuro, MapReduce y SQL co-existirán, como ya lo están sugiriendo la gente de Aster.

Elastic MapReduce

miércoles, abril 22nd, 2009

Amazon anunció que pone a disposición su servicio Elastic MapReduce, el cual permite levantar clusters Hadoop de manera eficiente y económica. El nuevo servicio representa una mejora a lo que anteriormente se podía hacer con EC2 y hadoop en AWS.