Clase 1 Tidy Data y manipulación de datos

Derek Corcoran
"07/08, 2018"

Curso Análisis y manipulación de datos en R

Primeros pasos

  • ¿Quien no ha usado nunca R? Swirl
  • Evaluación sencilla (Completar tareas + 1 evaluación)
  • Mucho trabajo personal guiado
  • Pagina donde esta todo el curso

Estructura de datos

  • Vector: Un conjunto lineal de datos (secuencia génica, serie de tiempo)
  • Matrix: Una tabla con solo números
  • Data Frame: Una tabla donde cada columna tiene un tipo de datos (estándar dorado)
  • List: Aqui podemos meter lo que queramos

data

Vector

  • Secuencia lineal de datos
  • Pueden ser de muchos tipos (numéricos, de carácteres, lógicos, etc.)
  • Ejemplo data(uspop)
  • para crear uno c(1,4,6,7,8)
  • para subsetear un vector se pone el índice entre []
  • uspop[4], uspop[2:10], uspop[c(3,5,8)]

Vector

Data Frame

  • Una tabla, cada columna un tipo de datos (Numérico, lógico, etc)
  • Cada columna un vector
  • Ejemplo data(iris)
  • Para subsetear data.frame[filas,columnas]
  • Ejemplos iris[,3], iris[,“Petal.Length”], iris[2:5,c(1,5)], iris$Petal.Length