Al 2016, mil millones de personas son usuarios de la aplicación de mensajería instantánea WhatsApp. Es decir, 1 de cada 7 humanos ha enviado por lo menos un mensaje a través de ella en su vida. Estos números pueden resultar alarmantes para las personas ajenas al análisis de datos, pero para aquellos que disfrutan de ello es una oportunidad fascinante.
Diariamente, 42 mil millones de mensajes, mil millones y medio de imágenes, y 250 millones de vídeos son enviados por este servicio. En conclusión, ¡BIG DATA!. A pesar de esto, la empresa se ha opuesto radicalmente a la creación de una API que permita desarrollar aplicaciones mediante el uso de sus datos. Desde el año 2012, han existido iniciativas para el cumplimiento de este proyecto pero la respuesta siempre ha sido: NO; aduciendo el cumplimiento de sus Políticas de Privacidad.
Sin embargo, la esperanza no está perdida. Si bien no podemos decidir sobre los datos de los demás, podemos decidir sobre los nuestros. Y es aquí, donde ingresan las maravillosas ideas de los amantes de Text Mining. Muchos de ellos han desarrollado aplicaciones gratuitas disponibles en Google PlayStore que nos permiten de manera rápida, fácil y efectiva determinar ciertos “hitos” de nuestros chats.
WhatsApp Analyzer es una de ellas. Gran herramienta para estos fines, que ofrece gráficos tipo pastel de la participación de cada integrante de un grupo (aquí descubres al spammer), así como la hora donde existe mayor interacción entre los miembros del mismo.
Para acceder a estos servicios hacemos lo siguiente.
Previamente obtenemos los datos a analizar siguiendo estos pasos:
- Entra a tu cuenta de WhatsApp.
- Ve al chat que quieras analizar.
- Envíalo a tu correo electrónico a través de las opciones extra.
- Luego descarga el archivo “.txt” que recibiste.
Ahora que tenemos listos nuestros datos, realiza lo siguiente:
- Descarga WhatsApp Analyzer.
- Abre la aplicación y sube el archivo que descargaste.
- Deja que la magia del Text Mining haga el resto.
Si bien los resultados de WhatsApp Analyzer son aceptables, existen varias fallas. Por ejemplo: al mostrar palabras comunes: presenta artículos, conectores y conjunciones, que debieron haber sido filtrados.
Sin embargo, estos “errores” son solucionables con técnicas de programación.
El mundo del análisis de texto (Text Mining) es cual selva virgen, inexplorado. Invitamos al lector a ser curioso e intentar solucionar estos errores; y quizás si es algún profesor de Programación, a plantear las ideas de este post como un proyecto, pues estamos seguros que el interés de sus estudiantes aumentará exponencialmente.
No se han encontrado comentarios