-
Notifications
You must be signed in to change notification settings - Fork 5
/
README.Rmd
187 lines (121 loc) · 9.1 KB
/
README.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
---
output: github_document
---
<!-- README.md is generated from README.Rmd. Please edit that file -->
```{r, include = FALSE}
knitr::opts_chunk$set(
collapse = TRUE,
comment = "#>",
fig.path = "man/figures/README-",
out.width = "100%",
dpi = 400
)
```
# ech <img align="right" src="man/figures/ech_logo.png" alt="logo" width="160">
<!-- badges: start -->
[![CRAN/METACRAN Version](https://www.r-pkg.org/badges/version/ech)](https://CRAN.R-project.org/package=ech)
[![CRAN/METACRAN Total downloads](https://cranlogs.r-pkg.org/badges/grand-total/ech?color=blue)](https://CRAN.R-project.org/package=ech)
[![CRAN/METACRAN downloads per month](https://cranlogs.r-pkg.org/badges/ech?color=orange)](https://CRAN.R-project.org/package=ech)
[![R build status](https://github.com/calcita/ech//workflows/R-CMD-check/badge.svg)](https://github.com/calcita/ech//actions)
[![AppVeyor build status](https://ci.appveyor.com/api/projects/status/github/calcita/ech?branch=master&svg=true)](https://ci.appveyor.com/project/calcita/ech)
[![Codecov test coverage](https://codecov.io/gh/calcita/ech/branch/master/graph/badge.svg)](https://codecov.io/gh/calcita/ech?branch=master)
[![DOI](https://zenodo.org/badge/224897952.svg)](https://zenodo.org/badge/latestdoi/224897952)
<!-- badges: end -->
Caja de herramientas para el procesamiento de la [Encuesta Continua de Hogares de Uruguay](https://www.gub.uy/instituto-nacional-estadistica/datos-y-estadisticas/encuestas/encuesta-continua-hogares) del Instituto Nacional de Estadística (INE). Pretendemos contribuir a la comunidad de usuaries de R en Uruguay, facilitando el uso de una de las encuestas socioeconómicas más importantes del país. En este sentido, el paquete implementa una serie de funciones que permiten el cálculo de los principales indicadores socioeconómicos que permite la encuesta.
Instalación
===========
Para la versión estable
``` r
install.packages('ech')
library(ech)
```
Para la versión en desarrollo
``` r
# install.packages('devtools')
# si no tiene instalado devtools
devtools::install_github("calcita/ech")
library(ech)
```
Funciones para leer datos
===========
Una serie de funciones del paquete que se usan internamente permiten descargar de la página del INE y convertir a un formato tidy los datos de: Índice de Precios al Consumo (IPC con base 2010), el Índice de Precios de Alimentos y Bebidas (IPAB con base 2010), Canasta Básica Alimentaria y No Alimentaria (CBA y CBNA), la codigue de CIIU4, los microdatos de cada ECH y sus respectivos diccionarios para los años 2011 a 2019.
Funciones para crear variables
===========
Las funciones para crear variables se organizan según la dimensión a la cual corresponden, así tenemos:
- Vivienda (Dwelling): permite calcular la situación estructural y coyuntural de la vivienda, las privaciones de la vivienda, hacinamiento y la tenencia de la vivienda.
- Educación (Education): permite calcular el máximo nivel alcanzado, los años de estudio, la completitud según niveles, la asistencia a un centro educativo.
- Mercado de trabajo (Employment): permite calcular la condición de actividad, la PEA (población económicamente activa), PET (población en edad de trabajar), PO (población ocupada) y PD (población desocupada), las restricciones al empleo, subempleo y las ramas de actividad según CIIU4.
- Tipo de hogar (Household type): permite construir una tipología de hogar.
- Ingresos y desigualdad (Income): permite calcular el ingreso deflactado (por el índice y año base elegido), quintiles y deciles de ingreso, el ingreso laboral per cápita y por hora.
- Pobreza (Poverty): permite calcular pobreza e indigencia y las NBI (Necesidad Básicas Insatisfechas).
Funciones para estimar indicadores
===========
Se pueden estimar medias, medianas y proporciones, totales y ratios, el Índice de Gini, el Brecha salarial de género (GPG, por sus siglas en inglés Gender Pay Gap) y la relación quintil5/quintil1 (QSR, Quintil Share Ratio). Para los años 2018 y 2019 se cuenta con la información de las UPM (Unidades Primarias de Muestreo) y estratos por lo cual es posible definir correctamente el diseño de muestra y obtener intervalos de confianza correctos.
Modo de uso
===========
El paquete ech permite descargar los microdatos oficiales desde la web del INE o bien utilizar microdatos ya procesados. En el primer caso los datos se obtiene a través de la función `get_microdata()`. En el segundo caso, puede usar la función `read_microdata()` para leerlos. El paquete tiene tres grandes conjuntos de funciones:
- las que leen datos desde la web del INE, se llaman get_*().
- las que calculan variables tanto a nivel hogares como personas, estas tienen nombres descriptivos en inglés que se detallan más adelante.
- las que estiman indicadores y calculan los intervalos de confianza asociados, se llaman get_estimation_*().
Ejemplo de descarga de microdatos:
``` r
# Cargo la libreria
library(ech)
# Cargo la base
ech19 <- get_microdata(year = "2019", # Año/s a descargar (2011-2019)
folder = tempdir(), # Carpeta para descarga
toR = TRUE) # Lo guarda en formato RData
```
Como un segundo paso, recomendamos utilizar la función `organize_names()` que estandariza los nombres de variables llevándolas a los nombres de 2017. Este paso facilita el uso de las demás funciones en la medida que todas contienen parámetros que dan cuenta del nombre de alguna variable y cuyo valor por defecto es el nombre de la variable para 2017. La correspondencia entre variables para cada año se puede observar en el diccionario `ech::dic`. No todas las variables de la ech están contempladas en el diccionario por lo que este proyecto está abierto a contribuciones que en la medida que se agreguen nuevas funciones serán necesarias.
``` r
# Organizamos nombres de variables
ech19 <- organize_names(ech19, 2019)
```
Para estimar la proporción de hogares pobres por departamento, usamos la variable `pobre06` que ya viene en la ECH calculada y elegimos la función de estimación `get_estimation_mean()`. Para estimar por departamento definimos como variable de cruce `nomdpto`. Elegimos el nivel de la estimación, hogares o personas, en el argumento `level`, en este caso, lo definimos como "h".
``` r
# Genero una estimación:
pobre_x_dpto <- get_estimation_mean(data = ech19, # Indico el data.frame
variable = "pobre06", # La variable a estimar
by.x = "nomdpto", # La variable de agrupación
by.y = NULL, # Se permite otra variable de agrupación
domain = NULL, # Se podría indicar un dominio
level = "h", # Defino que lo haga a nivel de hogar
name = "Pobreza")
```
ech & geouy
===========
El uso de este paquete se potencia al usarlo en conjunto con [geouy](https://github.com/RichDeto/geouy) ya que permite acceder a diferentes capas geográficas de Uruguay y construir mapas temáticos. Por ejemplo, a la estimación anterior de hogares pobres por departamento se le pueden agregar las geometrías de los polígonos de cada departamento para construir un mapa de coropletas.
``` r
# Solo me quedo con la estimación de pobre
pobre_x_dpto <- pobre_x_dpto %>% dplyr::filter(pobre06 == "Pobre")
# Agrego geometrías
pobre_x_dpto_geo <- add_geom(data = pobre_x_dpto, # Los datos en una unidad geográfica
unit = "Departamentos", # Unidad de agregación de los datos
variable = "nomdpto") # Variable correspondiente a los códigos a la unidad
```
Y con esto, podemos hacer un mapa con `ggplot2` muy fácilmente de estas estimaciones.
``` r
# Hago un mapa
plot_geouy(x = pobre_x_dpto_geo, col = "Pobreza", l = "%")
```
```{r echo=FALSE, fig.align="center", message=FALSE, warning=FALSE, fig.height=5, fig.width=7, eval = FALSE}
load("man/figures/pobre_readme.Rds")
pobre_readme
```
Aportes de la comunidad
-----------------------
Este paquete se propone incorporar cualquier función de propósitos generales que utilice como base le Encuesta Continua de Hogares (ECH) de Uruguay. Todos los aportes en este sentido son bienvenidos.
Si trabajas con la ECH de Uruguay y querés agregar tu función o tus datos, te recomendamos que leas los siguientes consejos de como colaborar [aquí](https://github.com/calcita/ech/issues/2). También podés generar un issue si encontrás algún error.
Si este paquete te parece útil también hacenoslo saber que es nuestro motor para seguir desarrollándolo.
Citar el paquete
-----------------------
Para citar ech en publicaciones, por favor usa:
Mathieu, Gabriela & Detomasi, Richard (2020) "ech: Caja de herramientas para procesar la Encuesta Continua de Hogares". R package version 0.0.1.20. URL: https://github.com/calcita/ech.
El formato BibTex para usar en tus archivos .bib o el gestor bibliográfico de tu preferencia:
@Misc{ech20,
title = {ech: Caja de herramientas para procesar la Encuesta Continua de Hogares},
author = {Gabriela Mathieu & Richard Detomasi},
note = {R package version 0.2.1},
year = {2020},
url = {https://github.com/calcita/ech},
}