Este taller será dictado por los Dres. Ernesto San Martín y Eduardo Alarcón Bustamante.
“Todo argumento económico
adquiere solidez toda vez que se sustenta en datos”. Aunque una afirmación como
esta podría ser compartida por muchos, tanto por aquellos que construyen los
argumentos (académicas y académicos, estudiantes de postgrado, investigadores
de think tanks), como por aquellos que los reciben (hacedores de
políticas públicas, funcionarias y funcionarios del Estado, asesoras y asesores
en el Congreso Nacional, periodistas), es necesario examinarla de cerca,
preguntándose por la consistencia lógica que debería existir en lo que
llamaremos la producción de los datos. Para ello focalizaremos nuestra
atención en la Encuesta de Caracterización Económica CASEN 2020, en particular
en los módulos que recolectan información sobre los ingresos de asalariados y
de pensionados. Para entender la producción de estos datos, mostraremos cuál es
el espacio muestral que es posible describir a partir de la información del
marco muestral que CASEN 2020 proporciona. Ello nos permitirá mostrar el rol
que tienen tanto los factores de expansión, como la imputación de datos
faltantes, en la producción de los datos de los asalariados, la que a su vez se
basa en los datos recolectados por CASEN 2020. Con esto a la mano,
responderemos las siguientes preguntas:
1. ¿En
qué medida las técnicas estadísticas de factores de expansión e imputación de
datos permiten inferir la distribución poblacional del ingreso tanto de
asalariados como de pensionados a partir de los datos recolectados por la
encuesta CASEN? Para responder a esta pregunta, jugará un rol fundamental el
espacio muestral que es posible identificar en base a la documentación de CASEN
2020.
2. Haciendo
la distinción entre lo que se puede aprender de los datos y lo que se
quiere aprender de los datos, exploraremos lo que efectivamente se puede
aprender de los datos recolectados por CASEN 2020. Mostraremos además qué es lo
que permiten aprender de los datos las técnicas estadísticas de factores de
expansión e imputación de datos, haciendo explícito que dicho aprendizaje no
se basa en los datos recolectados, sino en supuestos implícitos.
3. Discutiremos
cómo esos supuestos implícitos se hacen parte de toda argumentación que use la
producción de datos como si fuesen los datos recolectados. Al distinguir ambos
tipos de datos, mostraremos que tanto las conclusiones y recomendaciones que se
obtienen dependen mucho más de dichos supuestos que de los datos recolectados
por CASEN 2020.
4. Lo
anterior nos permitirá discutir los límites a los que siempre está sujeta toda
investigación empírica. Argumentaremos cómo estas limitaciones invitan a
repensar las interacciones entre la metodología y las restricciones éticas a
las que está sujeta toda investigación con seres humanos.