11/08, 2020
Bienvenida
Curso Análisis y manipulación de datos en R
Primeros pasos
- ¿Quien no ha usado nunca R? Swirl
- Evaluación sencilla (Informes reproducibles + presentación reproducible)
- Evaluación por pares (Quien evalua a los evaluadores)
- Mucho trabajo personal guiado
- Pagina donde esta todo el curso
Como se organizan los datos en R
Estructura de datos
- Vector: Un conjunto lineal de datos (secuencia génica, serie de tiempo)
- Matrix: Una tabla con solo números
- Data Frame: Una tabla donde cada columna tiene un tipo de datos (estándar dorado)
- List: Aqui podemos meter lo que queramos
Vector
- Secuencia lineal de datos
- Pueden ser de muchos tipos (numéricos, de carácteres, lógicos, etc.)
- Ejemplo data(uspop)
- para crear uno c(1,4,6,7,8)
- para subsetear un vector se pone el índice entre []
- uspop[4], uspop[2:10], uspop[c(3,5,8)]
Data Frame
- Una tabla, cada columna un tipo de datos (Numérico, lógico, etc)
- Cada columna un vector
- Ejemplo data(iris)
- Para subsetear data.frame[filas,columnas]
- Ejemplos iris[,3], iris[“Petal.Length”], iris[2:5,c(1,5)], iris$Petal.Length
Principios de Tidydata
Tidy Data

- Cada columna una variable
- Cada fila una observación
untidy data
