Un dataset internacional acerca de nombres, género y frecuencias en Damegender: Contando hombres y mujeres en GNU/Linux

Resumen

La igualdad de género es el quinto objetivo de desarrollo sostenible (ODS) para Naciones Unidas. Esta igualdad puede ser lograda midiendo, analizando datos y creando buenas políticas con los resultados. Muchos estudios de género cuentan hombres y mujeres para explicar la posible desigualdad, por ejemplo, artículos de investigación, puestos de trabajo, calles, etc. El método tradicional de investigación es usar APIs comerciales con datos propietarios sin idea acerca de cómo los datos fueron recogidos. Los datos pueden también ser recogidos desde Wikipedia, estudios lingüísticos, sitios científicos, u oficinas estadísticas. Este enfoque está basado en recoger Datasets Abiertos (Open Datasets) que incluyen nombre, género y frecuencia desde muchas instituciones estadísticas. Así́, las tareas abordadas están basadas en unificar formatos, procesar datos y, crear pruebas para medir la precisión de los nuevos datasets. El dataset usado cubre más de 20 países en el mundo occidental trayendo miles de nombres con una precisión de acierto mayor del 90%. Esto permitirá medir brecha de género a estudiantes y académicos interesados en el fenómeno sin costes y de una manera reproducible y más personas estarán contribuyendo a eliminar la brecha de género. El Software Libre y los datos provistos por instituciones estadísticas hacen posible producir investigación reproducible por pares.

Presentadores

David Arroyo Menéndez
Freelance, davidam.com, Madrid, Spain

Details

Presentation Type

Ponencia temática de un trabajo

Theme

Tema destacado de 2024: Personas, Educación y Tecnología para un Futuro Sostenible

KEYWORDS

Herramientas, Detección de Género, Nombre