-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathcasen2022_preparar_datos.r
31 lines (26 loc) · 1.06 KB
/
casen2022_preparar_datos.r
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
#en este script se cargan los datos de la casen preprocesados en casen2022_procesar.r,
#y se seleccionan las variables a utilizar en el visualizador, calculando las medidas
#necesarias para optimizar el rendimiento en vivo de la app.
library(dplyr)
library(purrr)
library(stringr)
library(ggplot2)
#cargar datos de casen2022_procesar.r
casen2022_2 <- arrow::read_parquet("datos/casen2022.parquet")
variables_casen <- c(
"comuna",
"region",
# "area",
"pco1",
"expc", #factor de expansión comunal
# "sexo", #género
"ytotcorh", #Ingreso total del hogar corregido
"ytotcor", #Ingreso total corregido
"yoprcor", #Ingreso ocupación principal
"ypc", #Ingreso total per cápita del hogar corregido
"y2803")
# filtrar variables y aplicar factor de expansión ----
casen2022_comunas <- casen2022_2 |>
select(any_of(variables_casen)) |>
mutate(across(where(is.factor), as.character))
arrow::write_feather(casen2022_comunas, "app/casen_ingresos.feather")