Clasificación de texto. Utilizando métricas de ganancia de in ...

Work thumb

Views: 37

  • Title: Clasificación de texto. Utilizando métricas de ganancia de información para categorizar disposiciones legales
  • Author(s): Rosa Rodríguez Sánchez, Jorge Chamorro Padial
  • Publisher: Common Ground Research Networks
  • Collection: Common Ground Español
  • Series: Tecnologia, Conocimiento y Sociedad
  • Journal Title: Revista Internacional de Tecnología, Conocimiento y Sociedad
  • Keywords: aprendizaje automático, clasificación de texto, minado de texto, entropía, ganancia de información, textos jurídicos
  • Volume: 7
  • Issue: 2
  • Year: 2019
  • ISSN: 2474-588X (Print)
  • ISSN: 2174-8985 (Online)
  • DOI: https://doi.org/10.18848/2474-588X/CGP/v07i02/37-48
  • Citation: Rodríguez Sánchez, Rosa , and Jorge Chamorro Padial. 2019. "Clasificación de texto. Utilizando métricas de ganancia de información para categorizar disposiciones legales." Revista Internacional de Tecnología, Conocimiento y Sociedad 7 (2): 37-48. doi:10.18848/2474-588X/CGP/v07i02/37-48.
  • Extent: 12 pages

Abstract

Dentro del ámbito de la clasificación de textos, en este trabajo hemos estudiado herramientas para clasificar textos en castellano pertenecientes al dominio jurídico. Concretamente, hemos estudiado diferentes métricas basadas en la ganancia de información y su rendimiento a la hora de clasificar las disposiciones legales que conforman un Boletín Oficial. Todas las métricas estudiadas han presentado unos buenos resultados de clasificación, incluso cuando la muestra de entrenamiento era de tamaño reducido. Los resultados presentados muestran las métricas basadas en la ganancia de información como una alternativa a tener en cuenta a la hora de abordar problemas de Aprendizaje Automático con este tipo de textos.