Large Data Reduction and Structure Comparison with Topological Data Analysis - Sorbonne Université Accéder directement au contenu
Thèse Année : 2019

Large Data Reduction and Structure Comparison with Topological Data Analysis

Réduction et comparaison de structures d’intérêt dans des jeux de données massifs par analyse topologique

Maxime Soler
  • Fonction : Auteur
  • PersonId : 1035626
  • IdRef : 250257254

Résumé

In this thesis, we propose different methods, based on Topological Data Analysis, in order to address modern problematics concerning the increasing difficulty in the analysis of scientific data. In the case of scalar data defined on geometrical domains, extracting meaningful knowledge from static data, then time-varying data, then ensembles of time-varying data proves increasingly challenging. Our approaches for the reduction and analysis of such data are based on the idea of defining structures of interest in scalar fields as topological features. In a first effort to address data volume growth, we propose a new lossy compression scheme which offers strong topological guarantees, allowing topological features to be preserved throughout compression. The approach is shown to yield high compression factors in practice. Extensions are proposed to offer additional control over the geometrical error. We then target time-varying data by designing a new method for tracking topological features over time, based on topological metrics. We extend the metrics in order to overcome robustness and performance limitations. We propose a new efficient way to compute them, gaining orders of magnitude speedups over state-of-the-art approaches. Finally, we apply and adapt our methods to ensemble data related to reservoir simulation, for modeling viscous fingering in porous media. We show how to capture viscous fingers with topological features, adapt topological metrics for capturing discrepancies between simulation runs and a ground truth, evaluate the proposed metrics with feedback from experts, then implement an in-situ ranking framework for rating the fidelity of simulation runs.
Dans cette thèse, nous proposons différentes méthodes, basées sur l’analyse topologique de données, afin de répondre aux problématiques modernes concernant l’analyse de données scientifiques. Dans le cas de données scalaires, extraire un savoir pertinent à partir de données statiques, de données qui varient dans le temps, ou données d’ensembles s’avère de plus en plus difficile. Nos approches pour la réduction et l’analyse de telles données reposent sur l’idée de définir des structures d’intérêt dans les champs scalaires à l’aide d’abstractions topologiques. Dans un premier temps, nous proposons un nouvel algorithme de compression avec pertes offrant de fortes garanties topologiques, afin de préserver les structures topologiques tout au long de la compression. Des extensions sont proposées pour offrir un contrôle supplémentaire sur l’erreur géométrique. Nous ciblons ensuite les données variables dans le temps en proposant une nouvelle méthode de suivi des structures topologiques, basée sur des métriques topologiques. Ces métriques sont étendues pour être plus robustes. Nous proposons un nouvel algorithme efficace pour les calculer, obtenant des accélérations de plusieurs ordres de grandeur par rapport aux approches de pointe. Enfin, nous appliquons et adaptons nos méthodes aux données d’ensembles relatives à la simulation de réservoir, dans un cas de digitation visqueuse en milieu poreux. Nous adaptons les métriques topologiques pour quantifier l’écart entre les simulations et la vérité terrain, évaluons les métriques proposées avec le retour d’experts, puis implémentons une méthode de classement in-situ pour évaluer la fidélité des simulations.
Fichier principal
Vignette du fichier
soler_thesis.pdf (26.42 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-02171190 , version 2 (02-07-2019)
tel-02171190 , version 3 (16-11-2020)
tel-02171190 , version 1 (25-05-2023)

Identifiants

  • HAL Id : tel-02171190 , version 1

Citer

Maxime Soler. Large Data Reduction and Structure Comparison with Topological Data Analysis. Computer Science [cs]. Sorbonne Université, 2019. English. ⟨NNT : 2019SORUS364⟩. ⟨tel-02171190v1⟩
408 Consultations
191 Téléchargements

Partager

Gmail Facebook X LinkedIn More