Une mesure d'intérêt à base de surreprésentation pour l'extraction des motifs syntaxiques stylistiques - Sorbonne Université
Communication Dans Un Congrès Année : 2015

Une mesure d'intérêt à base de surreprésentation pour l'extraction des motifs syntaxiques stylistiques

Résumé

In this contribution, we present a computational stylistic study of the French classic literature texts based on a data- driven approach where discovering interesting linguistic patterns is done without any prior knowledge. We propose an objective measure capable of capturing and extracting meaningful stylistic syntactic patterns from a given author’s work. Our hypothesis is based on the fact that the most relevant syntactic patterns should significantly reflect the author’s stylistic choice and thus they should exhibit some kind of overrepresentation behavior controlled by the author’s purpose. The analysed results show the effectiveness in extracting interesting syntactic patterns from classic French literary text, and seem particularly promising for the analyses of such particular text.
Dans cette contribution, nous présentons une étude sur la stylistique computationnelle des textes de la littérature classiques française fondée sur une approche conduite par données, où la découverte des motifs linguistiques intéressants se fait sans aucune connaissance préalable. Nous proposons une mesure objective capable de capturer et d'extraire des motifs syntaxiques stylistiques significatifs à partir d'un oeuvre d'un auteur donné. Notre hypothèse de travail est fondée sur le fait que les motifs syntaxiques les plus pertinents devraient refléter de manière significative le choix stylistique de l'auteur, et donc ils doivent présenter une sorte de comportement de surreprésentation contrôlé par les objectifs de l'auteur. Les résultats analysés montrent l'efficacité dans l'extraction de motifs syntaxiques intéressants dans le texte littéraire français classique, et semblent particulièrement prometteurs pour les analyses de ce type particulier de texte.
Fichier principal
Vignette du fichier
taln2015_BOUKHALED.pdf (484.25 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01198409 , version 1 (12-09-2015)

Identifiants

  • HAL Id : hal-01198409 , version 1

Citer

Mohamed-Amine Boukhaled, Francesca Frontini, Jean-Gabriel Ganascia. Une mesure d'intérêt à base de surreprésentation pour l'extraction des motifs syntaxiques stylistiques. 22ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2015, Caen, France. ⟨hal-01198409⟩
174 Consultations
122 Téléchargements

Partager

More