Chemoinformatics of DNA-encoded libraries : design, in silico generation, management, analysis, and comparison - Archive ouverte du site Alsace
Thèse Année : 2024

Chemoinformatics of DNA-encoded libraries : design, in silico generation, management, analysis, and comparison

Chémoinformatique des chimiothèques à codage ADN : design, génération in silico, gestion, analyse, et comparaison

Regina Pikalyova
  • Fonction : Auteur
  • PersonId : 1459161
  • IdRef : 274004704

Résumé

This thesis is dedicated to the generation of the virtual space of 2.5K DNA-encoded libraries and its detailed structural and property chemoinformatic analysis. GTM-based methodologies allowing to quickly compare and select optimal DELs out of thousands of possible ones based on the structural or property similarity to a reference database were developed. The problem of combinatorial compound enumeration was addressed by developing a highly performant deep learning model capable of predicting the position of a compound on the GTM based solely on its building blocks and reactions, skipping compound enumeration. Machine learning models allowing to predict the reactivity of building blocks and activity of DEL compounds were created. The latter coupled with GTM visualization, allowed to rationalize and facilitate the reagent selection for DEL synthesis and hit prioritization.
Cette thèse est dédiée à la génération de l'espace virtuel de 2.5K chimiothèques codées par ADN et à leur analyse chémoinformatique détaillée par structures et propriétés. Des méthodologies basées sur GTM permettant de comparer rapidement et de sélectionner les chimiothèques DEL optimales parmi des milliers de possibilités en fonction de la similarité structurelle ou par propriétés par rapport à une base de données de référence ont été développées. Le problème de l'énumération combinatoire des composés a été abordé en développant un modèle d’apprentissage profond capable de prédire la position d'un composé sur la GTM en se basant uniquement sur les réactifs associés et les réactions, en évitant l'énumération. Des modèles permettant de prédire la réactivité des réactifs et l'activité biologique des composés DEL ont été créés. Ces derniers couplés à la visualisation GTM, ont permis de rationaliser et de faciliter la sélection des réactifs pour la synthèse DEL et la priorisation des hits.
Fichier principal
Vignette du fichier
PIKALYOVA_Regina_2024_ED222.pdf (51.13 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04816243 , version 1 (03-12-2024)

Identifiants

  • HAL Id : tel-04816243 , version 1

Citer

Regina Pikalyova. Chemoinformatics of DNA-encoded libraries : design, in silico generation, management, analysis, and comparison. Cheminformatics. Université de Strasbourg, 2024. English. ⟨NNT : 2024STRAF032⟩. ⟨tel-04816243⟩
0 Consultations
0 Téléchargements

Partager

More