Archive for the ‘Educación’ Category

Alumnos de «Procesamiento masivo y escalable de datos», 2009-1T

miércoles, mayo 13th, 2009

Ya están listos los resultados del proceso de selección. Se seleccionó a los siguientes estudiantes de acuerdo al criterio de selección adjunto:

Allan Avendaño 200306611
Denisse Cayetano 200407708
Christian Rivadeneira 200209799
Irene Varas 200306413
Freddy de la Rosa 200006013
Mario García 200306868
Gabriel Paladines 200402279
Carlos Granda 200423507
Ligia Calva 200223741
Ana Victoria Kam 199908245
Grace Aragundi 200123354
Washington Bastidas 200410710
Jesús González 200211472
Bolivar Elbert 200208783
Adriana Bedoya 200211019
Andrés Cantos 200407682
Romeo Cabrera 199711326
Luis Mora 200406791
Mervyn Macías 200017838
Luis Zúñiga 200319556
Pedro Torres 200307270
Angel Cruz 200416469

NOTA: Debido a que el Sr. Zuñiga cedió su cupo, he añadido al Sr. FABRICIO MEDINA (200123560) a la lista.

A continuación se encuentran algunas estadísticas sobre los estudiantes seleccionados: 

Distribución del promedio de los estudiantes seleccionados
Promedio general Número de estudiantes
< 7.6 0
[7.6 -7.7) 5
[7.7 -7.8 ) 5
[7.8 – 7.9) 5
[7.9 – 8) 4
[8 – 8.1) 1
>= 8.1 2
Número de materias que faltan por aprobar a los estudiantes seleccionados (exceptuando inglés)
Número de materias Número de estudiantes
0 15
1 3
2 4
3 0
> 3 0
Año de egreso Número de estudiantes
< 2003 0
2003 2
2004 0
2005 0
2006 0
2007 5
> 2007 8
Año de ingreso Número de estudiantes
1997 1
1998 0
1999 1
2000 2
2001 1
2002 5
2003 5
2004 7

¡Felicitaciones a los estudiantes seleccionados! Quisiera indicar que 4 estudiantes con excelente promedio (mayor a 7.85) no fueron seleccionados porque les falta por aprobar 4 ó más materias. A aquellos estudiantes, les comento que me encantaría trabajar con ellos el próximo semestre (la materia se volverá a dictar el II Término 2009-2010); si desean adelantar su trabajo en el proyecto, pueden conversar conmigo para coordinar su asistencia como oyentes este semestre.

Finalmente, si alguno de los seleccionados no podrá asistir en el horario planteado (todos los viernes de 7h30 a 11h30), por favor indíquenlo cuanto antes para ceder su cupo a otro estudiante ya que si un estudiante falta el 40% o más de las horas dictadas, perderá automáticamente la materia.

Usando los scripts de Cloudera para procesar la Wikipedia

martes, mayo 12th, 2009

Hay una entrada muy detallada en el blog de Cloudera que demuestra paso a paso como usar los scripts de Cloudera para procesar la Wikipedia, usando Hadoop corriendo en EC2 y una versión separada por tabs (TSV) de la Wikipedia que está disponible de manera gratuita en S3. La información está detallada a manera de tutorial, y nos será muy útil en la materia de graduación; sobre todo porque 3 grupos trabajarán procesando la Wikipedia (pistas: ¿qué se sabe de Ecuador en la Wikipedia?, ¿qué se sabe de Guayaquil en la Wikipedia?, WikiGrep… más detalles el primer día de clases).

Materia de graduación

lunes, mayo 4th, 2009

Los detalles sobre la materia de graduación «Procesamiento Masivo y Escalable de Datos» ya están disponibles en la página de la materia y en la sección de recursos de la misma. Si tienen dudas adicionales, pueden colocarlas como comentarios a este mensaje, y yo los contestaré los más pronto posible.

Difusión sobre Hadoop

miércoles, abril 22nd, 2009

Allan Avendaño nos ayudó en la difusión del uso de Hadoop para ambientes de cloud computing, dictando una charla en el Flisol. El resumen, material de la charla y hoja de vida de Allan están disponibles en la página del evento.