0. Análisis ADP

Objetivos

Librerias y funciones

Set de clusters

Set de Apellidos Indígenas

Vamos a identificar todos los apellidos mapuches basado en los datos de Painemal (2011) y Amigo y Bustos (2008).

0.2.2 De prestigio (Revista Desigual)

Fuente: http://www.laizquierdadiario.cl/IMG/jpg/fafa8ffd-3884-44f2-ba77-f214a4a00759.jpg

0.2.3 Paper de Naim Bro

Frecuencia apellidos nacional

Se analizará las frecuencias nacional de los apellidos materno, paternos y en conjunto. A partir de los datos del Registro Civil.

Lectura de datasets

Estos son los grandes datasets de la investigación. Están separados por que el tamaño de la operación sería muy grande.

Remover tildes

Apellidos Paternos x Region

Apellidos Paternos Total

Apellidos Maternos x Región

Apellidos Maternos Total

Apellidos Totales

Limpiar Apellidos ADP

ADP: Apellidos Paternos

ADP: Apellidos Maternos

ADP: Apellidos Totales

ADP: Apellidos Sobrerepresentados

ADP: Apellidos Subrepresentados

ADP: Subrepresentación Total

Esta representación vemos que hay muchos apellidos que quedan fuera de la nómima del ADP. Eso es normal ya que la muestra es de sólo aprox 800 personas, i.e, 1600 apellidos. Sería interesante ver la baja participación de clusters, ej: indígena.

ADP: Representación Grupos Indígenas

0.10.1 Vemos no hay presencia indígena en el ADP

ADP: Representación Grupos Cluster

ADP: Representación Ideal Grupos

0.11 Join ADP + Info Transparencia

Leer base de datos del personal de planta

Pérdida de datos

Por ende, debemos desarrollar algo para recuperar esos datos perdidos.

Mejores sueldos ADP

Ojo que tenemos la cantidad de personal en el ADP menor que lo que en realidad era (798), porque se pierden datos al hacer el match entre nombre, probablemente porque no coinciden exactamente

Join Códigos de Organismo