Doctorant F/H Analyse dynamique des données in situ et en transit pour l'Exascale Computing

il y a 2 semaines


Rennes, France INRIA Temps plein

Contexte et atouts du poste

Contexte

Le domaine du calcul hautes-performances vient d’atteindre une nouvelle étape, avec le dépassement du seuil exaflopique par les supercalculateurs les plus puissants du monde. Ces machines permettront de traiter de quantités de données à une échelle sans précédent, pouvant alimenter des simulations de phénomènes complexes avec une précision supérieure dans de nombreux domaines applicatifs : l’astrophysique, la physique des particules, la santé, la génomique, etc. A titre d’exemple, il est estimé que le projet SKA va traiter un exaoctet de données brutes par jour. En France, l’installation du premier supercalculateur exaflopique est prévue en 2025. Des acteurs majeurs de la communauté scientifique française du domaine du calcul haute performance (high-performance computing - HPC) se sont regroupés au sein du programme PEPR NumPEx ( style="font-weight: 400;"> pour des recherches visant à contribuer à la conception et à la mise en œuvre de l’infrastructure logicielle de cette machine. Cette thèse se déroulera dans le cadre du projet Exa-DoST de ce programme, qui s’intéresse aux défis liés à la gestion des données à l'échelle exaflopique.

Direction de thèse

Gabriel Antoniu (Inria, directeur de thèse) Laurent Colombet (CEA, co-directeur) Julien Bigot (co-encadrant, Maison de la Simulation, CEA)

Localisation, mobilité

La thèse, co-encadrée par l'Inria et le CEA, sera hébergée par l'équipe KerData au Centre de recherche Inria de l'Université de Rennes et comprendra des visites régulières au CEA à  Bruyères-le-Châtel et à la Maison de la Simulation . Rennes est la capitale de la Bretagne, dans l'ouest de la France. Elle est facilement accessible grâce à la ligne de train à grande vitesse vers Paris. Rennes est une ville dynamique, vivante et un centre important d'enseignement supérieur et de recherche : 25 % de sa population est étudiante.

Cette thèse comprendra également des collaborations avec des partenaires internationaux, notamment américains.

L'équipe KerData en quelques mots

KerData est une équipe à taille humaine composée actuellement de 5 chercheurs permanents, 2 chercheurs contractuels, 1 ingénieur et 5 doctorants. Vous travaillerez dans un environnement chaleureux, offrant un bon équilibre entre vie professionnelle et vie privée .

KerData mène de nombreux projets ambitieux dans des environnements collaboratifs nationaux et internationaux de haut niveau, notamment au sein du Joint-Laboratory on Extreme-Scale Computing :

Notre équipe privilégie fortement la recherche expérimentale , validée par la mise en œuvre et l'expérimentation de prototypes de logiciels avec des applications réelles sur des plates-formes réelles, y compris certains des superordinateurs les plus puissants au monde.

L'équipe de KerData s'engage à fournir des conseils et un coaching personnalisés, afin d'aider les candidats au doctorat à se former et à se développer dans toutes les directions qui sont essentielles pour devenir des chercheurs performants.

Pour en savoir plus sur l'équipe KerData, consultez notre site web :

Mission confiée

Introduction

Sans évolution majeure des pratiques, l’augmentation de la capacité de calcul des prochaines générations d’ordinateurs conduira à une explosion du volume des données produites par les simulations numériques. La gestion de ces données, de leur production à leur analyse, est un défi majeur.

L’exploitation des résultats des simulations repose sur un protocole calcul-stockage-calcul bien établi. Le différentiel d’évolution des capacités entre les calculateurs et les systèmes de fichiers rend inéluctable l’engorgement de ces derniers. S’il n’est pas envisageable de se passer d’un système de stockage, de nombreuses expérimentations visent à en réduire l’utilisation. Dans ce domaine, l’émergence d’un vocabulaire varié traduit la diversité des approches : in situ processing, in transit processing, staging node, helper cores. Toutes ces approches soulignent une volonté de remplacer le processus écriture-lecture, usuel pour l’enchaînement des applications, par une intervention en vol. Une analyse effectuée dans le même temps qu’une simulation est une capacité qui intéresse particulièrement les physiciens du CEA. Ce besoin a conduit à la réalisation des premières implantations de systèmes d’analyses in situ ou in transit dans les codes de simulation et à la création de middlewares spécifiques comme par exemple Damaris [1,2,3,4].

Contexte technologique et applicatif

Damaris  ( PDI est une API qui permet un couplage faible entre codes de simulation et bibliothèques de gestion de données pour le calcul intensif. L’approche consiste à instrumenter les codes pour identifier où et quand des données deviennent présentes en mémoire et où et quand la mémoire va être ré-utilisée pour y stocker de nouvelles valeurs. Cette instrumentation est entièrement indépendante des bibliothèques de gestion de données utilisées. Un fichier séparé au format Yaml permet de spécifier que faire des données du code et avec quelle bibliothèque. Cette approche correspond à une démarche de programmation orientée aspects. Les différents aspects pouvant ainsi être pris en compte sont nombreux et incluent par exemple la lecture des paramètres du code, l’initialisation des données, le post-traitement in situ, la visualisation ou le stockage des résultats sur disque, la tolérance aux pannes, l’inclusion dans un couplage de code ou dans une simulation d’ensemble. Tous ces aspects peuvent être gérés, chacun grâce à un plugin donnant accès à une bibliothèque dédiée différente. PDI ne fait que arbitrer entre ces différents plugins, mais n’offre aucune fonctionnalité propre telle que la mise à disposition de cœurs dédiés dans Damaris. PDI est utilisé dans des codes de production comme Gysela qui exploite les machines Petaflop les plus puissantes du moment telles que Fugaku, Adastra, ou Exa1-HF. L’architecture intra-processus de PDI assure que la scalabilité offerte est exactement celle des bibliothèques utilisées en back-end.

Défis

Un premier retour d’expérience d’utilisateurs d’applications, utilisant un système in situ, affiche clairement la nécessité de développer un système permettant de gérer dynamiquement l’ajout ou la suppression d’analyses pendant l’exécution d’une simulation. Par exemple, il est fréquent, lors d’une étude par simulation du comportement d’un matériau sous contraintes, de demander des observations et donc des analyses différentes en fonction de la progression temporelle de la simulation. En effet, les propriétés élastoplastiques d’un matériau peuvent changer au cours du temps et donc entraîner le déclenchement de nouvelles analyses pour comprendre les phénomènes physiques sous-jacents comme la propagation de dislocations et les éventuels changements de phases (solide vs liquide ou solide vs solide). Dans ce cadre, pour économiser du temps et des ressources de calcul, il est donc important de déclencher l’activation des nouvelles analyses au bon moment lors du déroulement de la simulation. A noter que la détection de l’événement peut être faite soit par le code de simulation soit par une analyse. Bien évidemment, pour conserver de bonnes performances de restitution des résultats, il est impératif de bien gérer le placement des nouvelles analyses sur les nœuds du calculateur. Ces capacités permettant une gestion dynamique des analyses ne sont pas encore disponibles efficacement dans Damaris.

Coddex est un code de simulation qui résout les équations de la mécanique des milieux continus en hyperélasticité dynamique (chocs ou sollicitations rapides). Il incorpore également la description des discontinuités de comportement ( cf. Figure 1 ) de changement ou maclage. Coddex est l’acronyme de Code de Dynamique des Discontinuités pour l'Étude des cristaux.

Figure 1  : Carte des déformations d’un polycristal de TATB, un matériau énergétique ultra anisotrope par le code Coddex

Exemple de scénarios pour la mise en œuvre du système in-situ dans Coddex via Damaris  :

Analyses « programmées » : l’utilisateur physicien définit une simulation physique complète et une liste d’analyses in-situ (liens Coddex-Damaris-Paraview) avec des fréquences d'exécution variables. Dans ce scénario les sorties sont réalisées sans l’aide d’opérateur (sorties programmées), sous forme de fichiers de statistiques ou de visuels 2D (images) ou 3D (par exemple sorties d'iso-surfaces 3D par Paraview sous forme de fichiers .obj). Analyses « à la volée » : l’utilisateur peut également (et indépendamment) lancer de nouvelles analyses via le système de pauses (attente de requêtes de l’orchestrateur). Une analyse déclenche la création et la mise en œuvre d’une nouvelle analyse avec une fréquence spécifique. De nouvelles sorties de données (initialement non-prévues) sont produites. La liste des analyses peut être modifiée à la volée par ce biais. Ce scénario créé « à la volée » pourra ensuite être incorporé dans une analyse « programmée ». Analyses « déclenchées » : le code détecte une discontinuité (création d’une nouvelle phase, par exemple) et déclenche une analyse adaptée, sélectionnée dans une banque d’analyses typiques.

Objectifs

Les travaux de recherches proposés dans le cadre de cette thèse, consistent à concevoir un modèle novateur de gestion dynamique des analyses in situ et in transit, d’en proposer une implémentation dans le middleware Damaris et de le valider grâce à des simulations réalisées via le code Coddex.

Principales activités

Après une étude de l’état de l’art et une prise en main de l’architecture de Damaris et du code Coddex, l'objectif est d'étudier, proposer et développer des solutions innovantes qui feront l'objet de publications dans les meilleures revues et conférences du domaine. La thèse se déroulera dans un environnement pluridisciplinaire (informatique et physique) grâce à la collaboration INRIA-CEA au sein du projet Exa-DoST du PEPR NumPEx. Ces activités permettront aussi un accès privilégié pour les expérimentations à de très grands calculateurs. 

Références

[1] M. Dreher, B. Raffin; “A Flexible Framework for Asynchronous In Situ and In Transit Analytics for Scientific Simulations”, 14th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing .

[2] M. Dorier, G. Antoniu, F. Cappello, M. Snir, and L. Orf, “Damaris : How to Efficiently Leverage Multicore Parallelism to Achieve Scalable, Jitter-free I/O”, in CLUSTER – IEEE. International Conference on Cluster Computing. IEEE, Sep. 2012.

[3] M. Dorier, M. Dreher, T. Peterka, J. Wozniak, G. Antoniu and B. Raffin, “Lessons Learned from Building In Situ Coupling Frameworks”, in Proceedings of the First Workshop on In Situ Infrastructures for Enabling Extreme-Scale Analysis and Visualization, Austin, 2015.

[4] E. Dirand, L. Colombet, B. Raffin, “TINS: A Task-Based Dynamic Helper Core Strategy for In Situ Analytics”, in Proceedings of Asian Conference on Supercomputing Frontiers, Singapore 2018.

Compétences

Un excellent master en informatique ou équivalent Solide connaissance des systèmes distribués Connaissance des systèmes de stockage et de fichiers (distribués) Capacité et motivation à mener des recherches de haute qualité, y compris à publier les résultats dans des revues spécialisées. Solides compétences en programmation (Python, C/C++) Une expérience professionnelle dans les domaines du calcul intensif et de la gestion des données massives (Big Data) est un avantage. Très bonnes capacités de communication en anglais, à l'oral et à l'écrit Ouverture d'esprit, fortes capacités d'intégration et esprit d'équipe.

Avantages

Restauration subventionnée Transports publics remboursés partiellement Possibilité de télétravail à hauteur de 90 jours annuels Prise en charge partielle du coût de la mutuelle

Rémunération

rémunération mensuelle brute de 2100 euros les deux premières années et 2200 euros la troisième année



  • Rennes, France INRIA Temps plein

    Contexte et atouts du poste About Inria, the team and the position Inria is the only French public research body fully dedicated to computational sciences. Inria's missions are to produce outstanding research in the computing and mathematical fields of digital sciences and to ensure its impact on the economy and society through technology transfer...


  • Rennes, France CNRS Temps plein

    Cette offre est disponible dans les langues suivantes: Date Limite Candidature : lundi 31 juillet 2023 **Informations générales**: **Intitulé de l'offre **:Doctorant en Physique Appliquée à l'Environement (H/F)** Référence : UMR6118-JORHEY-006 Nombre de Postes : 1 Lieu de travail : RENNES Date de publication : lundi 10 juillet 2023 Type de contrat :...


  • Rennes, France CNRS Temps plein

    Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : samedi 22 avril 2023 **Informations générales**: **Intitulé de l'offre **:Doctorant(e) H/F "Super-réseaux de moiré dans des hétérostructures de dichalcogénures de métaux de transition"** Référence : UMR6251-THOJAO-001 Nombre de Postes : 1 Lieu...


  • Rennes, France Rennes Ville et Métropole Temps plein

    Rennes Ville & Métropole et ses agents œuvrent au quotidien pour faire de leur territoire un lieu de vie dynamique, en phase avec les enjeux d’aujourd’hui et de demain. Nous rejoindre, c'est faire le choix d'intégrer une collectivité qui mise sur la diversité des profils, l'accompagnement des parcours et la qualité de vie au travail de ses...


  • Rennes, France CNRS Temps plein

    Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : lundi 14 août 2023 **Informations générales**: **Intitulé de l'offre **:H/F doctorant Hydrologie des systèmes montagneux** Référence : UMR6118-LAULON-004 Nombre de Postes : 1 Lieu de travail : RENNES Date de publication : lundi 24 juillet...


  • Rennes, France CNRS Temps plein

    Cette offre est disponible dans les langues suivantes: Date Limite Candidature : vendredi 15 septembre 2023 **Informations générales**: **Intitulé de l'offre **:H/F doctorant Hydrologie des systèmes montagneux** Référence : UMR6118-LAULON-004 Nombre de Postes : 1 Lieu de travail : RENNES Date de publication : lundi 24 juillet 2023 Type de contrat :...


  • RENNES, France In Extenso Temps plein

    In Extenso est un réseau d'expertise comptable et de conseil constitué de 250 agences réparties sur l'ensemble du territoire. Notre métier ? Conseiller et accompagner nos clients, des dirigeants d'entreprises, dans toutes les étapes de la vie de leur société.Les équipes d'In Extenso Bretagne sont fières d'avoir été certifiées...


  • Rennes, France INRIA Temps plein

    Contexte et atouts du poste Supervisory Team Silvina Caino-Lores, PhD (Inria, France) Gabriel Antoniu, PhD, HDR (Inria, France) Location and Mobility The thesis will be hosted by the KerData team at the Inria research center of Rennes. Rennes is the capital city of Britanny, in the western part of France. It is easy to reach thanks to...


  • Rennes, France CNRS Temps plein

    Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : vendredi 29 mars 2024 **Informations générales**: **Intitulé de l'offre **:Post doctorant.e en économie H/F** Référence : UMR6211-NAILOU-009 Nombre de Postes : 1 Lieu de travail : RENNES Date de publication : mercredi 6 mars 2024 Type de contrat :...


  • Rennes, Ille-et-Vilaine, France SIB [numérique, santé et secteur public] Temps plein

    ⭐ Partager nos valeurs : Respect, Equité, Solidarité, Honnêteté.‍ Rejoindre des collègues investis dans une mission d'utilité publique et innovante. Travailler avec des équipes motivées par la satisfaction client.Notre recherche :Anthony recherche un(e) DBA pour intégrer le Pôle Services Managés de la Direction Technique, des SI et de...


  • Rennes, France SIB [numérique, santé et secteur public] Temps plein

    ⭐ Partager nos valeurs : Respect, Equité, Solidarité, Honnêteté.‍ Rejoindre des collègues investis dans une mission d'utilité publique et innovante. Travailler avec des équipes motivées par la satisfaction client.Notre recherche :Anthony recherche un(e) DBA pour intégrer le Pôle Services Managés de la Direction Technique, des SI et de...


  • Rennes, France Inria Temps plein

    Le descriptif de l’offre ci-dessous est en Anglais_ **Type de contrat **:CDD**Niveau de diplôme exigé **:Bac + 5 ou équivalent**Fonction **:Doctorant**Niveau d'expérience souhaité **:Jeune diplôméA propos du centre ou de la direction fonctionnelle The Inria Centre at Rennes University is one of Inria's eight centres and has more than thirty...


  • Rennes, France Aftec Temps plein

    Le campus AFTEC de Rennes, propose des formations de BTS à Bac+5, en alternance ou en initiale, dans différents domaines tertiaires. Rejoignez un campus dynamique qui compte plus de 2800 étudiants.Un emploi ? Une formation ? Pourquoi pas les deux ? Pour notre entreprise partenaire, nous recherchons un Agent de Transit H/F dans le cadre d'un MBA...


  • Rennes, France Aftec Temps plein

    Le campus AFTEC de Rennes, propose des formations de BTS à Bac+5, en alternance ou en initiale, dans différents domaines tertiaires. Rejoignez un campus dynamique qui compte plus de 2800 étudiants.Un emploi ? Une formation ? Pourquoi pas les deux ? Pour notre entreprise partenaire, nous recherchons un Agent de Transit H/F dans le cadre d'un MBA...


  • Rennes, France CNRS Temps plein

    Cette offre est disponible dans les langues suivantes: - Français - Anglais Date Limite Candidature : vendredi 16 juin 2023 **Informations générales**: **Intitulé de l'offre **:Doctorant F/H Les paysages sous-marins et le cinéma (H/F)** Référence : UMR6590-LAULED-001 Nombre de Postes : 1 Lieu de travail : RENNES Date de publication : vendredi 26...


  • Rennes, France Groupe PLG Temps plein

    Missions et activités principales Rejoignez-nous dans le cadre en CDI en tant que Responsable base de données clients et analyse décisionnelle (F/H) . Vous rejoindrez notre équipe sur notre site de Nantes . MISSIONS Au titre de ces fonctions, vous encadrez la cellule comptes clients et, en lien avec les différents services de...


  • Rennes, France The Land Temps plein

    Le groupe The Land est un espace de formation, de réflexion, de culture, d’innovation sociale comme entrepreneuriale au service du développement des nouvelles ruralités. Cet écosystème est composé de 31 entités qui s’articulent autour de 5 pôles : enseignement secondaire, enseignement supérieur, développement économique, vie sociale et...

  • AGENT DU TRANSIT AÉRIEN

    Il y a 2 mois


    Rennes, France Armée de l'Air et de l'Espace Temps plein

    Description du posteVous réceptionnez le fret (réception des matériels, chargement et déchargement des avions…)Vous préparez le fret pour son transport (groupage des marchandises, palettisation, conditionnement)Vous assurez l'accueil des passagers (accueil, procédures…)Vous assurez l'accueil et le chargement des aéronefs (chasse, transport,...


  • Rennes, France Inria Temps plein

    Le descriptif de l’offre ci-dessous est en Anglais_ **Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **A propos du centre ou de la direction fonctionnelle**: The Inria Rennes - Bretagne Atlantique Centre is one of Inria's eight centres and has more than thirty research teams. The Inria Center is a...


  • Rennes, France Inria Temps plein

    **Type de contrat **:CDD **Niveau de diplôme exigé **:Bac + 5 ou équivalent **Fonction **:Doctorant **A propos du centre ou de la direction fonctionnelle**: Le centre Inria Rennes - Bretagne Atlantique est un des huit centres d’Inria et compte plus d'une trentaine d’équipes de recherche. Le centre Inria est un acteur majeur et reconnu dans le...