Categoría: R

Taller: Manejo eficiente de grandes volúmenes de datos en R utilizando el paquete data.table

Publicidad Taller de R: Paquete datatable

La FCNM y el R-UserGroup Ecuador organizan el taller gratuito: «Manejo eficiente de grandes volúmenes de datos en R utilizando el paquete data.table»

Continuar leyendo

Diferencias entre %in% y match o del como hacer una actualización condicional de valores dentro de un data.frame utilizando valores de otro data.frame (Parte 1)

Escribo este post como respuesta a una pregunta de un colega y además porque sirve muy bien como ejemplo para entender un poco más del indexado de R.

Problema

Supongamos que tenemos las calificaciones de un curso en un data.frame, algo así como:

# Declarar una semilla para reproducibilidad del …

Continuar leyendo

Instalar paquete RCurl de R en Debian Wheezy (Debian 7) estable

Mismo error que en una entrada anterior, pero esta vez en Debian Wheezy rama estable:

# Instalar el paquete RCurl install.packages(«RCurl») ## checking for curl-config… ## no Cannot find curl-config ## ERROR: configuration failed for package ‘RCurl’

Claramente hay problemas con el curl-config «no Cannot find curl-config», es …

Continuar leyendo

Instalar paquete RCurl de R en CentOS 6.1

imagen RCurl error

Al instalar el paquete RCurl en una maquina con Linux CentOS 6.1 con R 3.0.1 (lo mismo debería pasar con RedHat) se me produjo el siguiente error:

# Instalar el paquete RCurl install.packages(«RCurl») ## checking for curl-config… ## no Cannot find curl-config ## ERROR: configuration failed for package ‘RCurl’ …

Continuar leyendo

Merge data – a review of the differences between: merge, inner join, left join, right join, full join, cbind and rbind when used data.table objects in R

Someone this week ask me about how to make joins using data.table objects, this person was doubting whether it was right to use: merge, rbind o cbind; so I’ve made this blog post leveraging the script that we used to explain the differences.

Continuar leyendo

Unir datos – un repaso de las diferencias entre merge, inner join, left join, right join, full join, cbind y rbind cuando se usa objetos tipo data.table en R

Esta semana alguien me preguntó como realizar unos joins utilizando objetos tipo data.table, esta persona dudaba si lo correcto era usar merge, rbind o cbind así que hago esta entrada al blog aprovechando el script que se usó para explicarle las diferencias.

Cuando queremos «unir» dos conjuntos de datos en general se …

Continuar leyendo

Forecasting: principles and practice, libro online recomendado

Gráfico de ACF y PACF generado con el paquete forecast

«Forecasting: principles and practice» es un libro pensado para usuarios básicos e intermedios de las técnicas de forecasting, perfecto para quien desea realizar pronósticos sin entrar a fondo en los detalles teóricos de cada método…

Continuar leyendo

La estadística en el hallazgo del Boson de Higgs y el significado del 5-sigma

5-sigma en una Normal Estándar

La noticia del hallazgo del Boson de Higgs fue dada en términos de 5-sigma, y he leído en varios post que hay mucha confusión sobre que esto significa (se habla de que 5-sigma significa 95% de confianza, 99,5% y cosas así), es por ello que en el presente post espero explicar un poco de que se trata el experimento y que significa dicha forma de presentar el resultado.

Continuar leyendo

R Studio.- Excelente IDE para R

RStudio y paquete manipulate

RStudio es un IDE (Entorno Integrado de Desarrollo) para el software R q facilita el trabajo en consola, mejora las prestaciones de la GUI oficial de R y brinda varias características que facilita el trabajo con R ya sea para realizar nuestros proyectos profesionales o académicos.

Continuar leyendo

Creando un gráfico de Dispersión con ggplot2 (Scatterplot) Parte 3 .- Introducción al uso de Condicionamiento

Altura vs Peso con condicionamiento para la variable Genero

La idea del condicionamiento es simple, en general se tiene un conjunto de datos y con ellos se genera un gráfico, la idea del condicionamiento es partir el subconjunto de datos en función de una (o dos) variables de interés y generar varios sub-gráficos por cada partición creada

Continuar leyendo

Ir a la barra de herramientas