25/10, 2020

Que es la investigación reproducible?

  • Código, datos (Crudos) y texto entrelazados
  • en R: Rmarkdown (Rmd)

Github

Github

  • Como “Google Drive” o “Dropbox” para código
  • Control de cambios (Podemos volver a cualquier versión anterior)
  • En base a codigo (idealmente), pero hay GUIs
  • Cada proyecto es un repositorio

Crear primer repositorio

  • Crearse cuenta en github.com
  • Crear repositorio en github

Crear primer repositorio

Copiar la url

Volvamos a RStudio

  • Creamos un proyecto nuevo

Pegamos la URL

La nueva pestaña git

Los “¿tres?” pasos de un repositorio

  • Git add: Agregar a los archivos que vas a guardar
  • Git commit: Guardar en el repositorio local (Mi computador)
  • Git push: Guardar en el repositorio remoto (En la nube)
  • Otros como git merge, git pull, git clone, etc

Git Add

  • Sumar un archivo al repositorio
  • ¿Cuando no hacerlo?
    • Limite de un archivo de 100 Mb
    • Límite de un repositorio de un Gb

Git commit

  • Con esto dices quiero guardar mis cambios en mi disco duro
  • Se guarda en tu repositorio local (Tu computador)

Mensaje del commit

  • Debe ser relevante (ejemplo, no poner Version final ahora si)
  • Si te equivocas puedes restablecer a cualquier commit anterior (si sabes cual es)

A guardar el repositorio (git push)

  • Con esto subes tu commit a la nube (queda respaldado)

Clásico error

Configurar github

git config --global user.name "derek-corcoran-barrios"
git config --global user.email "derek-corcoran-barrios@gmail.com"

Si no resulta

  • Si estas en windows instala git
  • Si estas en mac
  • Si estas en linux
sudo apt-get update
sudo apt-get install git

Dudas?

Reproducibilidad en R

  1. Una carpeta
    • Datos crudos (csv, xls, html, json)
    • Codigo y texto (Rmd, Rpres, shiny)
    • Resultados (Manuscrito, Pagina Web, App)

Antes de empezar (importar datos)

  • Hasta ahora hemos usado data (sólo para bases incorporadas en R)
  • Desde hoy usaremos read_csv (Para csv, para otros archivos hay otras funciones)
  • Otro tipo de datos son los .rds, todo puede ser transformado a este formato

Datos para trabajar

  • Puedes hacer:
library(readr)
plants <- read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-08-18/plants.csv")

o

plants <- readr::read_csv("https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-08-18/plants.csv")

Crear un nuevo Rmarkdown

Esta vez usaremos un template de un github document

Partes de un Rmd

Texto

link

# Titulo

## subtitulo

*cursiva*

**negrita**

[link](https://stackoverflow.com/users/3808018/derek-corcoran)

Chunks

Ejemplo 1

Elijamos solo plantas de Chile

  • En nuestro Rmd hagamos un data.frame solo con plantas de chile
  • Elijamos solo las columnas de especie

Ejemplo 2

  • En nuestro Rmd hagamos un data.frame resumen, de número de plantas extintas por país de America del Sur
  • Ahora subamoslo a github