class: title-slide, middle, right background-image: url(https://images.unsplash.com/photo-1533279443086-d1c19a186416?ixid=MXwxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHw%3D&ixlib=rb-1.2.1&auto=format&fit=crop&w=1489&q=80) background-size: cover ### Cargar datos # ### **Miriam Lerma**<br> Febrero 2021 --- class: inverse ## 1. Intro - Teoría. Paquetes, Directorios, Cargar datos. - Practica. Cargar datos desde csv, txt, excel y desde una url (internet). -- ## Quienes son ustedes? - Saben abrir e identificar partes de R Studio - Quieren cargar sus datos a RStudio y poder inspeccionarlos. ### Objetivo de hoy - Puedan cargar datos y verlos en su computadora. --- class: inverse # Créditos -El material esta basado en el libro: [
R4DS, editado por Riva Quiroga](https://r4ds-en-espaniol.netlify.app/) -El libro de: [
Bookdown, por Sonia Mendizabal](https://songeo.github.io/introduccion-r-bookdown/) -Y materiales de RLadies [
Zero to Hero](https://github.com/rladies/meetup-presentations_freiburg) [
Recursos en espanol ](https://github.com/rladies/recursos_en_espanol) [
RdesdeCero por Yanina Bellini](https://github.com/rladies/meetup-presentations_santarosa/blob/master/RdesdeCero) [
Primeros pasos en R por Riva Quiroga](https://github.com/rivaquiroga/RLadies-Santiago/blob/master/2018-04_taller_primeros_pasos_en_R.Rmd) Imágenes adicionales<br> [
Unsplash](https://unsplash.com/)<br> [
Portada por Fredy Jacob](https://unsplash.com/@thefredyjacob) --- class: title-slide, middle, right background-image: url(https://images.unsplash.com/photo-1533279443086-d1c19a186416?ixid=MXwxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHw%3D&ixlib=rb-1.2.1&auto=format&fit=crop&w=1489&q=80) background-size: cover # Empecemos! --- ## 1. Intro Un proyecto típico de ciencia de datos se ve así: <img src="https://r4ds-en-espaniol.netlify.app/diagrams_w_text_as_path/es/data-science.svg" height="300" /> .right[ Fuente: [R4DS](https://r4ds-en-espaniol.netlify.app/) ] Hoy queremos pasar el primer paso que es **importar nuestros datos**. --- ## 1.1. Paquetes - Son colecciones de funciones que realizan operaciones. - Se instalan una única vez pero deben cargarse cada vez que se utilizan. Para instalar hay que escribir: install.packages(""). Para cargar hay que escribir: library(""). Si han bajado apps a su cel, install.packages() es descargar la app y se hace una sola vez y library() es abrirla. -- Ahora mismo abran la consola, escriban el siguiente código y denle enter ```r install.packages("cowsay") ``` ```r install.packages("here") ``` 🕤 Tarda un poquito en cargarse... ```r install.packages("tidyverse") ``` Nota: nos da un warning, solo para **advertirnos** o **informarnos** de que contiene el paquete. No es un mensaje de error. Otra opción es ir al **workspace** Packages>Install>Escribir el nombre. --- ## 1.1. Paquetes ```r say(what = "Ya sabes cargar paquetes!", by = "cat") ``` -- No sale nada? Hay que cargar la libreria primero. -- ```r library("cowsay") ``` ``` Warning: package 'cowsay' was built under R version 4.2.3 ``` ```r say(what = "Ya sabes cargar paquetes!", by = "cat") ``` ``` -------------- Ya sabes cargar paquetes! -------------- \ \ \ |\___/| ==) ^Y^ (== \ ^ / )=*=( / \ | | /| | | |\ \| | |_|/\ jgs //_// ___/ \_) ``` --- ## 1.2. Directorios Donde están los archivos en tu computadora. Manualmente: Esquina inferior derecha: **Salida** > Files > More > Set working directory <img src="https://r4ds-en-espaniol.netlify.app/diagrams_w_text_as_path/es/rstudio-console.svg" height="300" /> Pero recuerden que no queremos hacer esto cada vez que entramos a R, queremos que sea automático y rápido. --- ## 1.2. Directorios Donde están tus datos? Opción 1 ```r getwd() ``` ```r setwd() ``` Se tiene que copiar y pegar completo y cada quien va a tener diferentes carpetas en sus computadoras. --- ## 1.2. Directorios Donde están tus datos? ```r library(here) ``` ```r here() ``` Ventajas: - Usa la carpeta donde tenemos guardado el script para encontrar el archivo que necesitamos. - Se puede compartir con colaboradores. - Se adapta si mueves la carpeta de lugar. --- ## 1.3. Cargar datos Cargar el paquete tidyverse ```r library("tidyverse") ``` ``` ## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ── ## ✔ dplyr 1.1.1 ✔ readr 2.1.4 ## ✔ forcats 1.0.0 ✔ stringr 1.5.0 ## ✔ ggplot2 3.4.2 ✔ tibble 3.2.1 ## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0 ## ✔ purrr 1.0.1 ## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ── ## ✖ dplyr::filter() masks stats::filter() ## ✖ dplyr::lag() masks stats::lag() ## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors ``` --- ## 1.4. Formato CSV Manualmente: esquina inferior derecha Files> Doble clic en el archivo de **Pingus_1.csv** Esta separado por comas, entonces: read_csv se usa cuando los valores están separados por **comas**. ```r Pingus_csv<-read_csv(here("Pingus_1.csv")) ``` ```r head(Pingus_csv) ``` --- ## 1.4. Formato CSV Doble clic en el archivo de **Pingus_2.csv** Esta separado por punto y coma. read_csv2 se usa para cuando están separados con **punto y coma**. ```r Pingus_csv2<-read_csv(here("Pingus_2.csv")) ``` ```r head(Pingus_csv2) ``` -- Funciono? Ah! tengo que usar read_csv2 para ";" ```r Pingus_csv2<-read_csv2(here("Pingus_2.csv")) ``` ```r head(Pingus_csv2) ``` --- ## 1.5. Formato tab Doble clic en el archivo de **Pingus_3.txt**. Esta separado por espacios. read_tsv se usa para documentos que tengan tab (espacio) separated values. ```r Pingus_txt<-read_tsv(here("Pingus_3.txt")) ``` ```r head(Pingus_txt) ``` --- ## 1.6. Formato Excel Hay que cargar la librería readxl ```r library("readxl") ``` read_excel se usa para cargar archivos de excel. ```r Pingus_excel<- read_excel(here("Pingus_4.xlsx")) ``` ```r head(Pingus_excel) ``` Hay otros tipos de formatos pero no los vamos a ver hoy, ni creo que los vayamos a necesitar durante el curso. --- ## 1.7. Desde Internet Fuentes de datos en Internet para practicar y que vamos a usar durante el curso: - [TidyTuesday](https://github.com/rfordatascience/tidytuesday) - [DatosDeMiercoles](https://github.com/cienciadedatos/datos-de-miercoles) Base de datos de plásticos. Datos liberados el 26 de enero de 2021. ```r plastics <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-01-26/plastics.csv') ``` Datos de plásticos ```r head(plastics,5) ``` --- ## 1.8. Paquetes que contienen datos ```r install.packages("remotes") remotes::install_github("cienciadedatos/datos") ``` ```r library(datos) ``` ``` ## Warning: package 'datos' was built under R version 4.2.3 ``` ```r Pingus<-pinguinos ``` ```r head(Pingus) ``` ``` ## # A tibble: 6 × 8 ## especie isla largo_pico_mm alto_pico_mm largo_aleta…¹ masa_…² sexo anio ## <fct> <fct> <dbl> <dbl> <int> <int> <fct> <int> ## 1 Adelia Torgersen 39.1 18.7 181 3750 macho 2007 ## 2 Adelia Torgersen 39.5 17.4 186 3800 hemb… 2007 ## 3 Adelia Torgersen 40.3 18 195 3250 hemb… 2007 ## 4 Adelia Torgersen NA NA NA NA <NA> 2007 ## 5 Adelia Torgersen 36.7 19.3 193 3450 hemb… 2007 ## 6 Adelia Torgersen 39.3 20.6 190 3650 macho 2007 ## # … with abbreviated variable names ¹largo_aleta_mm, ²masa_corporal_g ``` --- ## 1.9. Unir documentos Se pueden unir muchos documentos (En este ejemplo .xlsx) Pero **ojo** el numero de columnas y nombres de las columnas debe ser lo mismo. ```r MainFolder<-here() FilesTracking <- list.files(MainFolder,pattern="*.xlsx",full.names=TRUE) ListTracking <- lapply(FilesTracking,read_excel) ListTracking #Te muestra todos los documentos de la carpeta AllTracks <- do.call("rbind",ListTracking) ``` --- class: inverse # 1.10. Ejercicios
Carga los datos de pinguinos Usando read_csv <br> Usando read_csv2 <br> Usando read_tsv <br> Usando read_excel <br> --- class: title-slide background-image: url(https://images.unsplash.com/photo-1533279443086-d1c19a186416?ixid=MXwxMjA3fDB8MHxwaG90by1wYWdlfHx8fGVufDB8fHw%3D&ixlib=rb-1.2.1&auto=format&fit=crop&w=1489&q=80) background-size: cover ## Recapitulando Esta clase: - Instalar y cargar paquetes - Directorios - Cargar csv y excel .right[ ### Contacto Para dudas, comentarios y sugerencias: <br> Escríbeme a miriamjlerma@gmail.com Este material esta accesible <br> y se encuentra en mi [
github](https://github.com/MiriamLL/Curso_CIAD/) y mi [
página](https://www.miriam-lerma.com) ] <h1> .right[ [
](https://www.miriam-lerma.com/teaching.html) ]</h1>