R para ciencias sociales
Preámbulo
0.1
¿Para quién es este libro?
0.2
El
tidyverse
1
Introducción
1.1
¿Qué es R?
1.1.1
El
lenguaje de programación R
1.1.2
El
intérprete
1.2
Instalación de R y Rstudio en Windows.
1.3
Interface de Rstudio.
1.3.1
Consola.
1.3.2
Editor de Archivos.
1.3.3
Entorno de trabajo.
1.3.4
Gráficos.
1.3.5
Ayuda.
1.3.6
Paquetes de extensión.
1.4
Tipos y estructuras de datos
1.4.1
Tipos de datos
1.4.2
Estructuras de datos.
1.5
Orientación a objetos.
1.6
Programación funcional.
1.7
Funciones y librerías de funciones.
1.8
Convenciones de estilo de este documento.
1.9
Bloques de código y comentarios.
1.9.1
Uso de mayúsculas.
1.10
Buenas prácticas
2
Primeros pasos en R
2.1
Crear un proyecto.
2.2
Sintaxis de R: operadores y operandos.
2.3
Sintaxis de R: funciones y argumentos.
2.4
Vectores y atributos de los vectores.
2.5
Manipulación de datos.
2.6
Función para calcular una mediana con funciones primitivas de R.
2.7
Manipulación de estructuras de datos.
2.7.1
Magia
2.8
Sobre los archivos de sintaxis.
2.9
Anexo
2.9.1
Operadores binarios de R
3
Investigación reproducible.
3.1
Introducción: alcances del problema.
3.2
Investigación reproducible.
3.2.1
Ventajas de la investigación reproducible.
3.2.2
Desafíos de la investigación reproducible.
3.3
Filosofía: programación funcional con inmutabilidad de datos, transparencia referencial y funciones puras.
3.4
Hagamos pizza en R.
3.4.1
Pizzería “El asignador”. Pizzas de hoy y de ayer.
3.4.2
Pizzería La funcional clásica. El cambio se lo da en paréntesis.
3.4.3
Pizzería magrittr ¡La más %>% del rumbo!
4
Manipulación de datos
4.1
Introducción
4.2
Manipulación de datos con
tidyverse::
4.3
La forma de los datos.
4.3.1
¿Sumarios de datos o base de datos?
4.4
Datos rectangulares.
4.4.1
Datos prolijos (tidy data)
4.4.2
Reformateo de datos.
4.5
Manejo de datos con
dplyr::
4.5.1
Verbos básicos de
dplyr::
4.5.2
Uso de la de sintaxis de
dplyr::
4.6
Uso avanzado de
dplyr::
4.6.1
Alternar entre formato largo y ancho.
4.6.2
Seleccionar las columnas que cumplen determinada condición.
4.6.3
Filtrar por más de una condición o dentro de un conjunto.
4.6.4
Transformacion avanzada de datos.
4.6.5
Sumarios avanzados.
4.6.6
Funciones avanzadas de combinación de bases de datos.
4.6.7
Operadores avanzados de
magrittr::
4.7
Límites de
dplyr::
4.8
Manipulación con
dplyr::
en la práctica. Flujo de trabajo.
4.8.1
Implementación en dplyr:: de un análisis exploratorio de la base de datos Índice de marginación del CONAPO.
5
Gráficos con R y ggplot
5.1
Acerca de este documento.
5.2
La gramática de los gráficos.
5.2.1
Filosofía.
5.3
La gramática de los gráficos aplicada en
ggplot()
.
5.4
La base de datos.
5.4.1
Índice de marginación por municipios 1990-2015.
5.5
Descripción rápida de la base de datos.
5.5.1
Nombres cortos y largos.
5.6
Gráfico básico.
5.6.1
Construcción de un gráfico de barras paso a paso.
5.7
Personalización de gráfico.
5.7.1
Orden manual de las categorías.
5.7.2
Orden automático de categorías.
5.7.3
Título, subtítulo, títulos de ejes, viñeta
5.7.4
Estilos visuales.
5.8
Gráficos intermedios (más de una serie de datos)
5.8.1
Datos Formato de datos largo y ancho.
5.8.2
Gráfico de barras lado a lado.
5.8.3
Gráficos multipanel.
5.8.4
Gráfico de punto.
5.8.5
Gráfico de punto y línea.
5.8.6
Gráfico de dispersión.
5.8.7
Gráfico de dispersión en paneles.
5.8.8
Gráfico de caja.
5.9
Personalización avanzada de gráficos.
5.9.1
Etiquetas y elementos de texto.
5.9.2
Ajuste del elemento texto.
5.9.3
Posición de las leyendas.
5.10
Escalas.
5.10.1
Escalas y sistemas de coordenadas
5.10.2
Ajuste manual de intervalos de escala.
5.10.3
Transformación de escalas
5.11
Sistemas de coordenadas.
5.11.1
Coordenadas polares.
5.12
Fortificar nuestros gráficos con datos de un modelo
5.12.1
Rectas de ajuste
5.12.2
Intervalos de confianza y barras de error.
5.12.3
Etiquetado de casos.
5.13
Extensiones a
ggplot2::
5.14
Etiquetas
5.14.1
Gráfico de dispersión con histogramas marginales.
5.14.2
Gráficos de proporciones jerárquicas.
5.14.3
I’m feeling lucky…
5.14.4
Relaciones multivariadas.
6
Análisis de datos categóricos
6.1
Introducción
6.1.1
Datos categóricos
6.2
Tablas
6.2.1
Tablas de contingencia de dos dimensiones.
6.2.2
Tablas de contingencia en R.
6.3
Prueba de hipótesis de independencia estadística para tablas de contingencia.
6.3.1
El modelo de independencia.
6.3.2
Prueba de independencia para una tabla bidimensional.
6.4
Análisis de los residuos.
6.4.1
Prueba
\(\chi\)
2
en R.
6.5
Métodos gráficos para tablas de contingencia.
6.5.1
Modelos loglineales para datos categóricos.
6.6
Análisis práctico de datos categóricos.
6.6.1
La base de datos.
6.7
Género y partido político.
7
Modelos lineales
7.1
Introducción
7.2
Ajuste de modelo lineales con
lm()
7.2.1
Sumario de un modelo.
7.2.2
Interpretación básica del sumario de un modelo.
7.2.3
Intervalos de confianza.
7.2.4
Valores estimados y residuos.
7.2.5
Predicción del modelo.
7.3
Modelos lineales con más de una variable independiente.
7.3.1
Exploración de datos multivariados.
7.3.2
Especificación de modelos con múltiples variables independientes.
7.3.3
Comparar modelos lineales múltiples.
7.3.4
Imprimir un sumario de varios modelos.
7.3.5
Imprimir un sumario formateado de varios modelos.
7.3.6
ANOVA de varios modelos.
7.3.7
Criterio de información de Akaike.
7.3.8
Modelos lineales con variables independientes categóricas.
7.4
Supuestos de un modelo lineal.
7.4.1
Normalidad.
7.4.2
Independencia.
7.4.3
Linealidad.
7.4.4
Homocedasticidad.
7.4.5
Casos atípicos.
7.5
Regresión robusta.
7.6
Supuestos de los modelos lineales: problemas y soluciones.
7.7
Funciones adicionales para modelos lineales.
8
Modelos lineales generalizados
8.1
Introducción.
8.2
Ajuste de modelos logit con
glm()
8.2.1
Presentación de los datos.
8.2.2
Un modelo lineal con
glm()
8.2.3
La ordenada al origen de un modelo logit.
8.2.4
Estimación de
\(\beta_1\)
8.2.5
Modelo logit con dos variables independientes.
8.2.6
Modelo logit con múltiples variables dependientes.
8.2.7
Pruebas de significancia.
8.3
Presentación de resultados.
8.3.1
Intervalos de confianza.
8.3.2
Gráfico de coeficientes.
8.3.3
Tabla y gráfico de efectos totales promedio.
8.3.4
Sumario de efectos marginales.
8.4
Modelos ligit multinomiales.
8.4.1
Ajuste de modelos logit multinomiales com
multinom()
8.5
Anexo I. Probabilidades y razones de probabilidad.
8.6
Anexo II. Asterisco sobre los asteriscos.
8.7
Anexo III. Tipos de variables independiente y modelo lineal apropiado.
9
Anexos
Anexo 1. Vocabulario
9.1
Vocabulario.
Martín Paladino
R para Ciencias Sociales
Capítulo 9
Anexos