Un Dataset Internacional Acerca de Nombres, Género y Frecuencias en Damegender

Work thumb

Views: 266

  • Title: Un Dataset Internacional Acerca de Nombres, Género y Frecuencias en Damegender: Contando Hombres y Mujeres en Debian GNU/Linux
  • Author(s): David Arroyo Menéndez
  • Publisher: Common Ground Research Networks
  • Collection: Common Ground Español
  • Series: Aprendizaje
  • Journal Title: Revista Internacional de Aprendizaje
  • Keywords: Herramientas de Detección de Género desde el Nombre, Brecha de Género, Feminismo de Datos, Libertad de Datos.
  • Volume: 9
  • Issue: 2
  • Date: September 05, 2023
  • ISSN: 2575-5544 (Print)
  • ISSN: 2575-5560 (Online)
  • DOI: https://doi.org/10.18848/2575-5544/CGP/v09i02/75-95
  • Citation: Arroyo Menéndez, David. 2023. "Un Dataset Internacional Acerca de Nombres, Género y Frecuencias en Damegender: Contando Hombres y Mujeres en Debian GNU/Linux." Revista Internacional de Aprendizaje 9 (2): 75-95. doi:10.18848/2575-5544/CGP/v09i02/75-95.
  • Extent: 21 pages

Open Access

Copyright © 2023 Authors. Published By Common Ground Research Networks.
This work is licensed under a Creative Commons Attribution 4.0 International License(CC BY 4.0).

View License

Abstract

La igualdad de género es el quinto objetivo de desarrollo sostenible (ODS) para Naciones Unidas. Esta igualdad puede ser lograda midiendo, analizando datos y, creando buenas políticas con los resultados. Muchos estudios de género cuentan hombres y mujeres para explicar la posible desigualdad, por ejemplo, artículos de investigación, puestos de trabajo, calles, etc. El método tradicional de investigación es usar APIs comerciales con datos propietarios sin idea acerca de cómo los datos fueron recogidos. Los datos pueden también ser recogidos desde Wikipedia, estudios lingüísticos, sitios científicos, u oficinas estadísticas. Este enfoque está basado en recoger Datasets Abiertos (Open Datasets) que incluyen nombre, género y frecuencia desde muchas instituciones estadísticas. Así́, las tareas abordadas están basadas en unificar formatos, procesar datos y, crear pruebas para medir la precisión de los nuevos datasets. El dataset usado cubre más de 20 países en el mundo occidental trayendo miles de nombres con una precisión de acierto mayor del 90%. Esto permitirá medir brecha de género a estudiantes y académicos interesados en el fenómeno sin costes y de una manera reproducible y más personas estarán contribuyendo a eliminar la brecha de género. El Software Libre y los datos provistos por instituciones estadísticas hacen posible producir investigación reproducible por pares.