Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire

Santiago Herrera; Caio Corro; Sylvain Kahane

Communication Dans Un Congrès Année : 2024

Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire

(1) , (2) , (1)

1
2

Santiago Herrera

Fonction : Auteur
PersonId : 1184580
IdHAL : santiago-herrera

Modèles, Dynamiques, Corpus

Caio Corro

Fonction : Auteur
PersonId : 740403
IdHAL : caiocorro
ORCID : 0000-0001-7443-4109
IdRef : 242971059

Machine Learning and Information Access

Sylvain Kahane

Fonction : Auteur

Modèles, Dynamiques, Corpus

Résumé

Nous proposons une nouvelle approche pour extraire et explorer des motifs grammaticaux à partir de corpus arborés, dans le but de construire des règles de grammaire syntaxique. Plus précisément, nous nous intéressons à deux phénomènes linguistiques, l’accord et l’ordre des mots, en utilisant un espace de recherche étendu et en accordant une attention particulière au classement des règles. Pour cela, nous utilisons un classifieur linéaire entraîné avec une pénalisation L1 pour identifier les caractéristiques les plus saillantes. Nous associons ensuite des informations quantitatives à chaque règle. Notre méthode permet de découvrir des règles de différentes granularités, certaines connues et d’autres moins. Dans ce travail, nous nous intéressons aux règles issues d’un corpus du français.

Mots clés

extraction de grammaire règles de grammaire grammaire fondée sur des corpus grammaire quantitative régression logistique pénalité L1

Domaines

Informatique et langage [cs.CL]

Fichier principal

2505.pdf (285.06 Ko)

Origine	Fichiers éditeurs autorisés sur une archive ouverte

Matthieu Labeau : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-04623018

Soumis le : lundi 1 juillet 2024-09:12:58

Dernière modification le : mercredi 30 octobre 2024-13:29:19

Dates et versions

hal-04623018 , version 1 (01-07-2024)

Licence

Paternité

Identifiants

HAL Id : hal-04623018 , version 1

Citer

Santiago Herrera, Caio Corro, Sylvain Kahane. Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire. 35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), Jul 2024, Toulouse, France. pp.211-218. ⟨hal-04623018⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS MODYCO ISIR SORBONNE-UNIVERSITE SU-SCIENCES UNIV-PARIS-LUMIERES TALN-RECITAL UNIV-PARIS-NANTERRE ISIR_MLIA JEP-TALN-RECITAL2024

144 Consultations

76 Téléchargements

Régression logistique parcimonieuse pour l'extraction automatique de règles de grammaire

Résumé

Mots clés

Domaines

Dates et versions

Licence

Identifiants

Citer

Relations

Exporter

Collections

Partager