Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire - Machine Learning and Information Access
Conference Papers Year : 2024

Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire

Santiago Herrera
Caio Corro

Abstract

Nous proposons une nouvelle approche pour extraire et explorer des motifs grammaticaux à partir de corpus arborés, dans le but de construire des règles de grammaire syntaxique. Plus précisément, nous nous intéressons à deux phénomènes linguistiques, l’accord et l’ordre des mots, en utilisant un espace de recherche étendu et en accordant une attention particulière au classement des règles. Pour cela, nous utilisons un classifieur linéaire entraîné avec une pénalisation L1 pour identifier les caractéristiques les plus saillantes. Nous associons ensuite des informations quantitatives à chaque règle. Notre méthode permet de découvrir des règles de différentes granularités, certaines connues et d’autres moins. Dans ce travail, nous nous intéressons aux règles issues d’un corpus du français.
Fichier principal
Vignette du fichier
2505.pdf (285.06 Ko) Télécharger le fichier
Origin Publisher files allowed on an open archive

Dates and versions

hal-04623018 , version 1 (01-07-2024)

Licence

Identifiers

  • HAL Id : hal-04623018 , version 1

Cite

Santiago Herrera, Caio Corro, Sylvain Kahane. Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire. 35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), Jul 2024, Toulouse, France. pp.211-218. ⟨hal-04623018⟩
81 View
48 Download

Share

More