Nos Boursiers

Sélection des projets de recherche
Home / Nos Boursiers / Docteur Nicolas DIERCKXSENS

Docteur Nicolas DIERCKXSENS

Qualifications:
Master of Science in Bio-Engineering: Cell and Gene Biotechnology KULeuven 2012

Années bourse(s):
2015-2016, 2016-2017, 2017-2018
2017-2018: "Bourse de la Loterie Nationale"



Le projet

Development of a precision de novo assembly algorithm for targeted regions (NOVOLoci)

Superviseurs du projet

Promotor :
Dr. Guillaume Smits, MD PhD
HUDERF, Centre de Génétique de l’ULB

Collaborators:
Dr Catheline Vilain, MD PhD , Hôpital Erasme, HUDERF et Centre de Génétique de l’ULB
Dr. Patrick Mardulyn, PhD , Evolutionary Biology, ULB
Dr. Olivier Hardy, PhD , Evolutionary Biology, ULB
Prof. Dr Ludwig Triest, PhD , Environment, Biodiversity and Ecosystems, VUB

Laboratoire ou Hôpital la majeure partie du projet se déroule

The project will be realized in collaboration with HUDERF, IB2 and the ULB. The main work will be executed at the IB2.


Objectif du projet

The goal of the project is to develop an algorithm that is capable of assembling regions of interest de novo from short Illumina reads (NOVOLoci). When we can achieve a high quality assembly, it will be possible to detect new variants (impossible to call with a classic mapping + variant calling alignment) that could help in the diagnosis of individual patients. We will also develop a customized version of NOVOPlasty [1] for the human mitochondrial genome that can be integrated in to the Highlander platform [2]. This module will not only assemble the mitochondrial genome, but also detect the variance and heteroplasmy in the sample.

We will test NOVOLoci on two datasets, the human genome and the genome of a leaf beetle (Gonioctena intermedia). For the human genome, we will focus on a linkage region, which is associated to congenital nongoitrous hypothyroidism. The beetle dataset is useful to test the algorithm for genomes without reference and as a benchmark, since we already have assemblies from DISCOVAR De Novo and Platanus. With the experience gained on these subjects, we would like to develop a bioinformatic pipeline to assemble regions of interest de novo, followed by the best possible variance calling. With the continuous progress in sequencing technologies, whole genome sequencing and de novo alignment will become the central genomic tool in clinics and research. Being able to produce the best alignment and calling possible and to characterize variants that were not distinguishable with mapping, de novo assembly will strongly contribute to the melioration of the comprehension and diagnosis of rare genetic disorders, a disease category very important for pediatrics


Résumé

Etant donné que le coût du séquençage de génome entier (WGS en anglais) ne cesse de baisser, il sera bientôt possible d'utiliser cette technique de séquençage en clinique. Cela signifie que nous serons bientôt en mesure d'utiliser cette méthode d'alignement pour la détection d'un type encore plus large de variants dans l'ADN de nos patients pédiatriques. Il existe deux approches pour l'étape d'assemblage, un assemblage de novo ou un assemblage par cartographie (méthode "classique", par exemple utilisée pour les exomes). La méthode de novo est la méthode la plus pertinente, car elle produit une liste de variants plus complète et spécifique au patient (par absence d'utilisation d'un "génome de référence") toutefois elle est informatiquement plus complexe et nécessite le séquençage de génomes entiers. Les algorithmes de novo existants présentent plusieurs faiblesses : ils produisent trop d'erreurs, nécessitent trop de ressources informatiques, ou utilisent des méthodes de séquençage par de plus longs bouts de séquences, techniques trop onéreuses pour la pédiatrie clinique.

Dans un premier temps, nous voulons développer un algorithme qui serait capable d'assembler de novo des régions d'intérêt clinique au sein d'un génome entier, en utilisant des reads Illumina paired-end de longueur 100 - 250 bp. Les tests que nous avons effectués sur l’assemblage du génome de la mitochondrie et du chloroplaste ont fonctionné et nous avons commencé à travailler avec une simulation d'une région de 9 Mb, qui est associée à l'hypothyroïdie congénitale sans goître (collaboration avec le Prof. Refetoff, Chicago et le Prof. Vassart, Bruxelles). Dans l'avenir, nous devrons adapter notre algorithme de manière à ce qu’il puisse gérer les différences entre les deux haplotypes parentaux et résoudre les régions génomiques humaines difficiles (par exemple avec des répétitions, avec une extrême hétérogénéité, avec des variants structuraux complexes). Nous voulons également développer notre outil pour lui permettre de travailler sur les régions génomiques les plus longues possibles (la limite serait un temps de calcul raisonnable) en utilisant la parallélisation grâce aux technologies big data comme Hadoop et ses protocoles map/reduce (en collaboration avec le le MLG et IRIDIA). Étant la méthode la plus complète et la plus puissante, l’assemblage de novo deviendra le gold standard lorsque le coût de séquençage d'un génome entier chez l’humain atteindra des prix applicables pour la clinique. L'assemblage de novo étant la seule méthode d'alignement capable d'appeler certain type de variants (variants structuraux de 50 à 1000 bp), il permettra également un meilleur diagnostic et une meilleure recherche clinique au profit de nos petits patients


Découvrez comment faire >