Categoría: estadística

Unir datos – un repaso de las diferencias entre merge, inner join, left join, right join, full join, cbind y rbind cuando se usa objetos tipo data.table en R

Esta semana alguien me preguntó como realizar unos joins utilizando objetos tipo data.table, esta persona dudaba si lo correcto era usar merge, rbind o cbind así que hago esta entrada al blog aprovechando el script que se usó para explicarle las diferencias.

Cuando queremos «unir» dos conjuntos de datos en general se …

Continuar leyendo

VIII Seminario Internacional de Estadística Aplicada

La Sociedad Ecuatoriana de Estadística (SEE) ha organizado el VIII Seminario Internacional de Estadística Aplicada, que se llevará a cabo del 11 al 15 de noviembre del 2013 en la Escuela Politécnica Nacional y Pontificia Universidad Católica del Ecuador, ambas en Quito.

Se cuenta con más de una decena de conferencistas internacionales y:

CONFERENCIAS …

Continuar leyendo

Forecasting: principles and practice, libro online recomendado

Gráfico de ACF y PACF generado con el paquete forecast

«Forecasting: principles and practice» es un libro pensado para usuarios básicos e intermedios de las técnicas de forecasting, perfecto para quien desea realizar pronósticos sin entrar a fondo en los detalles teóricos de cada método…

Continuar leyendo

La estadística en el hallazgo del Boson de Higgs y el significado del 5-sigma

5-sigma en una Normal Estándar

La noticia del hallazgo del Boson de Higgs fue dada en términos de 5-sigma, y he leído en varios post que hay mucha confusión sobre que esto significa (se habla de que 5-sigma significa 95% de confianza, 99,5% y cosas así), es por ello que en el presente post espero explicar un poco de que se trata el experimento y que significa dicha forma de presentar el resultado.

Continuar leyendo

Google Correlate, para los que trabajamos con tendencias y correlaciones

Google Correlate

Averiguando un poco sobre los servicios que ofrece Google, me encontré con Google Correlate que lanzado hace más de un año es un servicio que muy pocos conocemos y que puede servir mucho a los que trabajamos con tendencias y correlaciones.

Continuar leyendo

R Studio.- Excelente IDE para R

RStudio y paquete manipulate

RStudio es un IDE (Entorno Integrado de Desarrollo) para el software R q facilita el trabajo en consola, mejora las prestaciones de la GUI oficial de R y brinda varias características que facilita el trabajo con R ya sea para realizar nuestros proyectos profesionales o académicos.

Continuar leyendo

Creando un gráfico de Dispersión con ggplot2 (Scatterplot) Parte 3 .- Introducción al uso de Condicionamiento

Altura vs Peso con condicionamiento para la variable Genero

La idea del condicionamiento es simple, en general se tiene un conjunto de datos y con ellos se genera un gráfico, la idea del condicionamiento es partir el subconjunto de datos en función de una (o dos) variables de interés y generar varios sub-gráficos por cada partición creada

Continuar leyendo

Creando un gráfico de Dispersión con ggplot2 (Scatterplot) Parte 2 .- Usando Transparencias

Altura vs Peso con Alpha de 1/2

Usar ggplot2 para: Visualizar tres variables: Altura, Peso, Género, las dos primeras en los ejes mientras que la tercera será el resultado de una combinación de forma y color, Aplicar transparencias para datos superpuestos, Aplicar transparencias para visualizar tres variables

Continuar leyendo

Creando un gráfico de Dispersión con ggplot2 (Scatterplot) Parte 1

Altura vs Peso vs Genero

Luego de tener una primera impresión de Ggplot2, de conocer sus conceptos básicos, y de haberlo instalado y cargado vamos a usarlo, empezaremos con los famosos gráficos de dispersión (Scatterplot en inglés).

Continuar leyendo

Instalación del Paquete ggplot2 en R

simplemente ejecutamos install.packages(«ggplot2»), y esperamos a que R haga su trabajo

Continuar leyendo

Ir a la barra de herramientas