Investigating chromosome dynamics through Hi-C assembly
Exploration des dynamiques de chromosomes par assemblage Hi-C
Résumé
The advent of high-throughput DNA sequencing technologies has set off an expanding trend in genome assembling and scaffolding. Such genome quality is an essential preliminary to understand interactions between and among chromosomes. We built upon a computational and technological framework that let us tackle genome assembly problems of increasing complexity. Our methods are mainly based on chromosome conformation capture technologies such as Hi-C. In a Hi-C experiment, DNA molecules are cross-linked with the surrounding proteins and form a large, static protein-DNA complex. This captures the spatial conformation by trapping together molecules that are physically close to each other. Therefore, Hi-C is very suitable for 3D genome structure analysis, which lets us infer a wealth of information about the genome. It was indeed shown that the tridimensional structure of the genome can be unambiguously linked to its 1D structure thanks to the physical properties of DNA polymers. Moreover, such 3D proximity also gives access to cell compartment information, thus opening the way for an additional approach for metagenomic binning, known as meta3C. In this work, we expand upon these methods and apply them to use cases with more and more complexity. We first improve on tools for genome assembly and demonstrate their validity with the scaffolding of Ectocarpus sp., then unveil rearrangements in joint scaffoldings of Trichoderma reesei and Cataglyphis hispanica. Lastly, we use the same approach with metagenomic binning on live mouse microbiome samples to reconstruct hundreds of genomes.
L'avènement des technologies de séquençage ADN à haut-debit a initié une tendance grandissante dans l'assemblage de génomes. La qualité de ces génomes est un prérequis essentiel pour comprendre les interactions au sein de et entre ces chromosomes. Nos méthodes se basent principalement sur les technologies de capture de conformation de chromosomes comme le Hi-C. Lors d'un protocole de Hi-C, les molécules d'ADN sont réticulées avec les protéines environnantes pour former un complexe protéine-ADN statique et volumineux. Ceci permet de capturer la conformation spatiale en piégeant les molécules physiquement proches dans l'espace. Ainsi, le Hi-C est très approprié pour l'analyse de la structure 3D des génomes, ce qui permet d'obtenir un certain nombre d'informations sur le génome. Il a été ainsi montré que sa structure tridimensionnelle peut être reliée directement à sa structure 1D grâce aux propriétés physiques des polymères d'ADN. De plus, une telle proximité en 3D donne également accès à des informations de compartimentation, ce qui a ouvert la voie à une nouvelle approche de binning métagénomique, connue sous le nom de meta3C. Au cours de ce travail, nous étendons ces méthodes à des études de cas présentant une complexité grandissante. Tout d'abord, nous améliorons les outils d'assemblage de génomes et démontrons leur validité avec l'assemblage de Ectocarpus sp., puis nous mettons en évidence des réarrangements chromosomiques au sein d'assemblages joints de Trichoderma reesei et Cataglyphis hispanica. Enfin, nous utilisons la même approche avec le binning métagénomique sur des échantillons de souris in vivo afin de reconstruire des centaines de génomes.
Origine | Version validée par le jury (STAR) |
---|
Loading...