Actividades
Hasta el viernes 5 de junio:
- Terminar el laboratorio (LineIndexer) iniciado en la clase del 29 de mayo. Enviarme screenshots u otra documentación que muestre la ejecución del LineIndexer.
- Completar el documento adjunto sobre objetivos/alcance/etc. y enviármelo (de ser posible hasta el lunes 1) por email.
- Avanzar con el proyecto conforme al cronograma de trabajo de cada grupo y leer al menos un paper de la bibliografía del grupo.
- (puede que surja algo más durante la semana…)
Hasta el viernes 29 de mayo:
- Instalar una máquina virtual con Hadoop.
- Preparar un documento con: nombre del proyecto (pueden modificar el planteado), integrantes, objetivo, alcance, y cronograma de trabajo. El cronograma debe incluir un responsable de las actividades y una indicación de qué se entregará en cada uno de los avances indicados en el syllabus.
- Investigar un poco del tema del proyecto y empezar con la revisión de la literatura. Compilar una lista de al menos 10 artículos/papers/etc. que serán revisados por los miembros del grupo como parte de la revisión de la literatura. Un buen punto de partida es usar scholar.google.com. Yo tengo acceso a la biblioteca digital de la ACM y la de la IEEE, así que los puedo ayudar consiguiendo ciertos papers con acceso restringido.
- Leer el paper MAD Skills: New Analysis Practices for Big Data, que será discutido en clase.
- ¡No olviden subscribirse al blog!