Introducción a los elementos del DS
Programa
-
Introducción a la programación con R.
- Ambiente de programación Rstudio.
- Proyectos y scripts.
- Creación, manipulación y asignación de objetos.
- Ejecutando código.
-
Análisis Exploratorio de datos.
- Visualización de datos con ggplot2: Mapeos estéticos, separación
en facetas, geometrías.
- Transformación de datos: filtrar, ordenar, seleccionar,
transformaciones, resúmenes agrupados y transformaciones
agrupadas.
- Introducción al Pipe
|>
.
-
Manipulación de datos.
- Datos relacionales: uniones (joins) de transformación y
filtrado.
- Datos ordenados: pivotar, separar y unir, valores faltantes.
- Manejo de strings y expresiones regulares. Manipulación de
factores y fechas.
- Importación y orígenes de información: texto plano, API, bases
de datos, Web scraping.
-
Modelamiento.
- Conceptos básicos: predicción, error, sesgo, métricas de
evaluación.
- Modelos de Regresión: Lineal y Logística.
- Árboles de decisión.
- Random Forests. Ideas tras Bagging y Boosting.
- Importancia de variables.
- Métodos no supervisados, métodos de clustering.
Slides
- Bienvenida R Rstudio Copy
Paste
- AED Viz
ggplot2
- Transformación de datos
dplyr
- Manipulación de datos
dplyr
tidyr
- Lectura de datos
readr readxl httr rvest
dbplyr
- Introducción al modelamiento
ranger partykit
yardstick
Repositorio
Repositorio del curso en github
https://github.com/jbkunst/intro-elementos-ds. Acá podrás encontrar
datos, código fuente de las slides, evaluaciones, etc.
Bibliografía
Dinámicas de clase (Segundo semestre 2022)
Online
- Objetivo principal: Mostrar contenidos, ejemplos y fuentes de
información. Programar en conjunto (pair programming).
- Horario: Lunes 16:45-18.10
- Lugar: Via google meet https://meet.google.com/upx-rxan-vwt
Presencial
- Objetivo principal: Realizar ejercicios, responder dudas y repasar
contenidos previos.
- Horario: Miércoles 17:10-18:40.
- Lugar: Laboratorio 208.