Actividades

Hasta el viernes 5 de junio:

  • Terminar el laboratorio (LineIndexer) iniciado en la clase del 29 de mayo. Enviarme screenshots u otra documentación que muestre la ejecución del LineIndexer.
  • Completar el documento adjunto sobre objetivos/alcance/etc. y enviármelo (de ser posible hasta el lunes 1)  por email.
  • Avanzar con el proyecto conforme al cronograma de trabajo de cada grupo y leer al menos un paper de la bibliografía del grupo.
  • (puede que surja algo más durante la semana…)

Hasta el viernes 29 de mayo:

  • Instalar una máquina virtual con Hadoop.
  • Preparar un documento con: nombre del proyecto (pueden modificar el planteado), integrantes, objetivo, alcance, y cronograma de trabajo. El cronograma debe incluir un responsable de las actividades y una indicación de qué se entregará en cada uno de los avances indicados en el syllabus.
  • Investigar un poco del tema del proyecto y empezar con la revisión de la literatura. Compilar una lista de al menos 10 artículos/papers/etc. que serán revisados por los miembros del grupo como parte de la revisión de la literatura. Un buen punto de partida es usar scholar.google.com. Yo tengo acceso a la biblioteca digital de la ACM y la de la IEEE, así que los puedo ayudar consiguiendo ciertos papers con acceso restringido.
  • Leer el paper MAD Skills: New Analysis Practices for Big Data, que será discutido en clase.
  • ¡No olviden subscribirse al blog!