Une méthode non supervisée pour la vérification d'auteur à base d'un modèle gaussien multivarié - Sorbonne Université
Communication Dans Un Congrès Année : 2015

Une méthode non supervisée pour la vérification d'auteur à base d'un modèle gaussien multivarié

Résumé

In this paper, we present a first study on using a distance-based outlier detection method for the authorship verification task. We have considered an unsupervised method based on a multivariate Gaussian model. To evaluate the effectiveness of the proposed method, we conducted experiments on a classic French corpus. Our preliminary results show that the proposed method can achieve a high verification performance that can reach an F 1 score of 83% outperforming the baseline. MOTS-CLÉS : vérification non supervisée de l'auteur, détection des cas aberrants, modèle Gaussien multivarié.
Dans cet article, nous présentons une première étude sur l'utilisation d'une méthode de détection des cas aberrants à base de distance pour la tâche de vérification de l'auteur. Nous avons considéré une méthode non supervisée basée sur un modèle gaussien multivarié. Pour évaluer l'efficacité de la méthode proposée, nous avons mené une expérimentation sur un corpus de textes littéraires français classiques. Nos résultats préliminaires montrent que la méthode proposée peut réaliser une haute performance de vérification qui peut atteindre un score de F 1 de 83%, supérieure à celle de la méthode de référence.
Fichier principal
Vignette du fichier
authorship_verification_BOUKHALED.pdf (401.16 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01198412 , version 1 (12-09-2015)

Identifiants

  • HAL Id : hal-01198412 , version 1

Citer

Mohamed Amine Boukhaled. Une méthode non supervisée pour la vérification d'auteur à base d'un modèle gaussien multivarié. 10es Rencontres Jeunes Chercheurs en Recherche d’Information (RJCRI), Mar 2015, Paris, France. pp.525-533. ⟨hal-01198412⟩
111 Consultations
55 Téléchargements

Partager

More