Imputation de données de séquençage low-pass dans des pedigrees génotypés
il y a 6 jours
Retour à la liste des résultatsPrésentation INRAEL'Institut national de recherche pour l'agriculture, l'alimentation et l'environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l'animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.Environnement de travail, missions et activitésVous serez accueilli(e) au sein du laboratoire de recherche GenPhySE (Génétique, Physiologie et Systèmes d'Elevage), sur le campus INRAE de Toulouse à Auzeville, dans l'équipe Chamade.Contexte et objectifsLe génotypage précis de grandes cohortes d'individus est essentiel pour mener des études d'association avec des traits phénotypiques ou reconstituer l'histoire évolutive de populations. Pour cela, le génotypage par puce SNP représente une solution abordable comparativement au séquençage tout génome, mais limitée à un ensemble restreint de variants pré-sélectionnés. Une approche plus récente, le séquençage à faible profondeur ("low-pass"), consiste à séquencer un grand nombre d'individus avec une couverture très faible (Lou et al Bien que la qualité du génotypage par individu soit moindre, l'utilisation de méthodes d'imputation permet d'obtenir un génotypage de haute résolution à un coût compétitif par rapport aux puces de génotypage, ce qui en fait une stratégie particulièrement adaptée aux études génomiques de grande envergure. Cette approche exige toutefois des algorithmes spécialisés et une puissance de calcul importante.Des méthodes se sont spécialisées dans l'imputation de ce type de données (Davies et al. 2016; Browning and Yu 2009; Rubinacci et al Sur ces méthodes, une pipeline d'imputation ainsi qu'un benchmark a été développé (Guyomar et al dans le laboratoire sur un jeu de données réel de de 1 050 porcs issus de 12 fondateurs, dont les données de séquençage ont été sous-échantillonnées à différentes profondeurs. Les résultats montrent de très bonne performances même à très faible profondeur, mais les ressources en calculs et en stockage sont extremement élevés. De plus, l'information du pedigree qui est disponible dans nos données entre les individus n'est jamais prise en compte pendant l'imputation.Au court de ce stage, nous proposons d'implémenter une méthode bien connue de la littérature, le peeling (Kerr and Kinghorn 1996; Fernando, Stricker, and Elston 1993), permettant d'estimer les probabilités génotypiques de chaque membre d'un pedigree en prenant en compte l'ensemble des relations de parenté. Cette méthode intègre également l'incertitude liée au séquençage et offrirait ainsi la possibilité d'exploiter l'information du pedigree pour imputer des données de séquençage low-pass.La technique du peeling s'appplique à chaque polymorphisme de manière indépendante. Pour pouvoir considérer l'ensemble des polymorphismes de manière conjointe, elle sera donc intégrée dans un deuxième temps à un outil d'estimation des transmissions d'haplotypes dans un pedigree génotypé développé au sein du laboratoire (Servin Il faudra alors évaluer dans quelle mesure ceci permet d'améliorer la qualité de l'imputation et constituer une alternative viable, moins coûteuse, aux méthodes actuelles reposant sur l'association entre données de puces de génotypage et information de pedigree, grâce à l'utilisation du séquençage low-pass.Au cours de ce stage, le/la stagiaire aura l'occasion de se former à l'analyse statistique de données génétiques en grande dimension, à la programmation python pour le calcul scientifique (NumPy, Dask) et à l'optimisation de l'execution de programmes de calcul intensif sur un cluster de calcul notamment en utilisant des systèmes de gestion de pipeline de traitement de données (Nextflow, snakemake, conda).Browning, Brian L., and Zhaoxia Yu "Simultaneous Genotype Calling and Haplotype Phasing Improves Genotype Accuracy and Reduces False-Positive Associations for Genome-Wide Association Studies." American Journal of Human Genetics 85 (6): 847–61. Davies, Robert W., Jonathan Flint, Simon Myers, and Richard Mott "Rapid Genotype Imputation from Sequence Without Reference Panels." Nature Genetics 48 (8): 965–69. Fernando, R. L., C. Stricker, and R. C. Elston "An Efficient Algorithm to Compute the Posterior Genotypic Distribution for Every Member of a Pedigree Without Loops." Theoretical and Applied Genetics 87 (1): 89–93. Guyomar, Cervin, Denis Milan, Christophe Klopp, Cécile Donnadieu, Bertrand Servin, and Julie Demars "Evaluating low-pass genotyping strategies using PARSEC, a scalable and modular Nextflow pipeline." Intelligent Systems for Molecular Biology/European Conference on Computational Biology. Kerr, R. J., and B. P. Kinghorn "An Efficient Algorithm for Segregation Analysis in Large Populations." Journal of Animal Breeding and Genetics 113 (1–6): 457–69. Vous Serez Plus Particulièrement En Charge DeTravailler sur l'implémentation python de la méthode du peeling et tester son bon fonctionnement.Intégrer cette implémentation au package python existant proposant l'estimation des haplotypes (phasage).Appliquer la méthode au benchmark existant.Intégrer ce benchmark à la pipeline existante.Formations et compétences recherchéesMaster/Ingénieur (Bac+5)Formation recommandée: Bioinformatique, statistique, génétique, data-scienceConnaissances souhaitées: Programmation python (expérience en calcul scientifique bienvenue), BashVotre qualité de vie à INRAEEn rejoignant INRAE, vous bénéficiez (selon le type de contrat et sa durée) :jusqu'à 30 jours de congés + 15 RTT par an (pour un temps plein)d'un soutien à la parentalité : CESU garde d'enfants, prestations pour les loisirs ;de dispositifs de développement des compétences : formation, conseil en orientation professionnelle ;d'un accompagnement social : conseil et écoute, aides et prêts sociaux ;de prestations vacances et loisirs : chèque-vacances, hébergements à tarif préférentiel ;d'activités sportives et culturelles ;d'une restauration collective.Modalités pour postulerJ'envoie mon CV et ma lettre de motivationLes personnes accueillies à INRAE, établissement public de recherche, sont soumises aux dispositions du Code de la fonction publique notamment en ce qui concerne l'obligation de neutralité et le respect du principe de laïcité. A ce titre, dans l'exercice de leurs fonctions, qu'elles soient ou non au contact du public, elles ne doivent pas manifester leurs convictions, par leur comportement ou leur tenue, qu'elles soient religieuses, philosophiques ou politiques. > En savoir plus : sitefonction
-
Ingénieur.e recherche Analyse de donnees Bio-informatique
il y a 6 jours
Toulouse, Occitanie, France PERENNIS CONSULTING PRO&BEAUTY Temps pleinMISSION PRINCIPALE : L'ingénieur.e de recherche sera en charge de l'activité du plateau de Bio-informatique. La personne recrutée aura pour mission principale d'analyser les données issues des technologies de séquençage NGS (RNAseq cellules uniques ou bulk), du démultiplexage aux analyses et visualisation des résultats. La prise en charge et...
-
Technicien-Technicienne en virologie et génomique cliniques
il y a 4 jours
Toulouse, Occitanie, France ECOLE NATIONALE VETERINAIRE DE TOULOUSE Temps pleinÀ propos de nousCréée en 1825, l'École Nationale Vétérinaire de Toulouse (ENVT), la plus ancienne des grandes écoles toulousaines, s'est forgée de longue date une renommée nationale et internationale. C'est l'une des quatre Ecoles nationales vétérinaires françaises (ENVF) et l'un de 12 établissements publics d'enseignement supérieur...
-
Stage - Développement informatique et Analyse de Données F/H
il y a 6 jours
Toulouse, Occitanie, France Réseau de Transport d'Électricité Temps pleinRTE construit, transforme, exploite et maintient le réseau public de transport d'électricité́ français. Sur le plus grand réseau d'Europe, nous équilibrons la production et la consommation, acheminons l'électricité indispensable au quotidien de chacun et à l'activité des industries, et garantissons la solidarité électrique entre les territoires,...
-
Stage - Développement informatique et Analyse de Données F/H
il y a 4 jours
Toulouse, Occitanie, France RTE - Réseau de Transport d'Electricité Temps pleinDescription de l'entrepriseRTE construit, transforme, exploite et maintient le réseau public de transport d'électricité́ français. Sur le plus grand réseau d'Europe, nous équilibrons la production et la consommation, acheminons l'électricité indispensable au quotidien de chacun et à l'activité des industries, et garantissons la solidarité...
-
Toulouse, Occitanie, France INRAE Occitanie-Toulouse Temps pleinRetour à la liste des résultatsPrésentation INRAEL'Institut national de recherche pour l'agriculture, l'alimentation et l'environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE...
-
Assistant.e ingénieur.e en biologie animale et moléculaire
il y a 6 jours
Toulouse, Occitanie, France PERENNIS CONSULTING PRO&BEAUTY Temps pleinMISSION PRINCIPALE / La personne recrutée aura pour mission d'analyser la distribution à l'échelle du génome de protéines nucléaires, en relation avec le dysfonctionnement neuronal et les troubles cognitifs observés dans divers contextes pathologiques (infection neurotrope, neuroinflammation chronique ou maladie d'Alzheimer). Le/la candidat(e) aura...
-
Comptable Client et Trésorerie CDI
il y a 6 jours
Toulouse, Occitanie, France SEMECCEL - Cité de l'espace L'Envol des Pionniers Temps pleinLa SEMECCEL, exploitant de la Cité de l'espace et de L'Envol des Pionniers recrute un Comptable Client et Trésorerie (H/F) en CDI au sein de la Direction Administrative et Financière.Au sein du service comptabilité, vous participez aux missions suivantes :Garantir la fiabilité des données et des comptes du cycle ClientGarantir la fiabilité des...
-
Stagiaire de Master 2
il y a 2 semaines
Toulouse, Occitanie, France IRIT (Institut de Recherche en Informatique de Toulouse) Temps pleinOffre de stage – Simulation Multi-Agents, Apprentissage & Économie Circulaire (6 mois, Toulouse)L'IRIT (équipe SMAC) propose un stage M2/ingénieur au sein du projetMUTTEC, dédié à la modélisation de l'économie circulaire territoriale.Vous contribuerez à connecter unsimulateur multi-agentsà des données réelles : industrie, logistique, réseaux...
-
Responsable technique d'applications de gestion F/H
il y a 7 jours
Toulouse, Occitanie, France Université de Toulouse Temps pleinÀ propos de nousEtablissement d'enseignement supérieur et de recherche, l'Université de Toulouse III- Paul Sabatier devient l'Université de Toulouse le 1er janvier L'Université se classe aujourd'hui parmi les premières universités françaises par son rayonnement scientifique, la diversité de ses laboratoires et les formations qu'elle propose en...
-
Data Engineer
il y a 1 semaine
Toulouse, Occitanie, France Evotec Temps pleinTitre du poste :Data EngineerLieu :ToulouseDépartement :IT / Digital SystemsRelève de :Head of IT & Digital SystemsNous sommes ravis de vous informer que cette offre s'inscrit dans le cadre de l'acquisition de Just-Evotec Biologics par Sandoz à Toulouse. Cette opportunité vous permettra d'avoir un impact sur la vie de centaines de millions de personnes...