11/08, 2020

Bienvenida

Curso Análisis y manipulación de datos en R

Primeros pasos

  • ¿Quien no ha usado nunca R? Swirl
  • Evaluación sencilla (Informes reproducibles + presentación reproducible)
  • Evaluación por pares (Quien evalua a los evaluadores)
  • Mucho trabajo personal guiado
  • Pagina donde esta todo el curso

Como se organizan los datos en R

Estructura de datos

  • Vector: Un conjunto lineal de datos (secuencia génica, serie de tiempo)
  • Matrix: Una tabla con solo números
  • Data Frame: Una tabla donde cada columna tiene un tipo de datos (estándar dorado)
  • List: Aqui podemos meter lo que queramos

Vector

  • Secuencia lineal de datos
  • Pueden ser de muchos tipos (numéricos, de carácteres, lógicos, etc.)
  • Ejemplo data(uspop)
  • para crear uno c(1,4,6,7,8)
  • para subsetear un vector se pone el índice entre []
  • uspop[4], uspop[2:10], uspop[c(3,5,8)]

Data Frame

  • Una tabla, cada columna un tipo de datos (Numérico, lógico, etc)
  • Cada columna un vector
  • Ejemplo data(iris)
  • Para subsetear data.frame[filas,columnas]
  • Ejemplos iris[,3], iris[“Petal.Length”], iris[2:5,c(1,5)], iris$Petal.Length

Principios de Tidydata

Tidy Data

  • Cada columna una variable
  • Cada fila una observación

untidy data