Limpieza Datos de Transparencia

La información a disposición en el portal de transparencia (https://www.portaltransparencia.cl/PortalPdT/web/guest/home) está en archivos csv. Los archivos son de tamaño 1GB a 4GB, ya que trae la data histórica sobre las contrataciones y es por el tamaño de archivos que usaremos la libraría dask. En este caso, filtraremos por un mes y año en específico. El resultado serán archivos de 4KB (aprox x10^6 más pequeños).

Personal Código del Trabajo

Ahora filtramos el dataframe por el mes y por el año para finalmente guardarlo en un archivo

Personal Contrata

Ahora filtramos el dataframe por el mes y por el año para finalmente guardarlo en un archivo

Personal de Planta

Ahora filtramos el dataframe por el mes y por el año para finalmente guardarlo en un archivo

Personal Contratada a Honorario

Ahora filtramos el dataframe por el mes y por el año para finalmente guardarlo en un archivo

new_df4.head(10)