Clasificación de texto. Utilizando métricas de ganancia de in ...

Work thumb

Views: 916

Open Access

Copyright © 2021, Common Ground Research Networks, (CC BY)
This work is licensed under a Creative Commons Attribution 4.0 Generic

View License

Abstract

Dentro del ámbito de la clasificación de textos, en este trabajo hemos estudiado herramientas para clasificar textos en castellano pertenecientes al dominio jurídico. Concretamente, hemos estudiado diferentes métricas basadas en la ganancia de información y su rendimiento a la hora de clasificar las disposiciones legales que conforman un Boletín Oficial. Todas las métricas estudiadas han presentado unos buenos resultados de clasificación, incluso cuando la muestra de entrenamiento era de tamaño reducido. Los resultados presentados muestran las métricas basadas en la ganancia de información como una alternativa a tener en cuenta a la hora de abordar problemas de Aprendizaje Automático con este tipo de textos.