Les missions du poste

Après la grande vague du paradigme objet en programmation, qui conduit à une organisation des données de type AoS (pour “Array of Structures”), la communauté du calcul revient progressivement au SoA (pour “Structure of Arrays”) qui se prête plus efficacement à la parallélisation des calculs de type SIMD (CPU) et SIMT (GPU), nécessaires pour des performances optimales aujourd’hui. En allant un pas plus loin, on peut construire des AoSoA (pour “Array of SoA”), qui permettent notamment de s’adapter aux hiérarchies de caches des processeurs. Curieusement, bien que très pratiquées pour optimiser le calcul intensif, ces approches ont fait l’objet de peu de recherches et de publications dans le milieu de la recherche en informatique [1].
En physique des particules, chercheurs et ingénieurs étudient des optimisations similaires [2] en les adaptant aux problématiques spécifiques du calcul à haut débit (HTC), notamment en ayant fréquemment recours à des tableaux dits “jagged” [3] ou “awkward” [4], sortes d’hyper-matrices plutôt denses mais irrégulières.
Ce projet de thèse regroupe des acteurs du LISN (laboratoire de recherche en informatique), d’IJCLab et du CERN (laboratoires de physique), qui collaborent déjà sur le développement de la bibliothèque logicielle KIWAKU [5], qui permet de manipuler des vecteurs, des matrices, des tenseurs, etc.
Le doctorant sera chargé d’identifier les théories et pratiques les plus récentes en matière de AoSoA, et de voir si elles peuvent être adaptées aux structures de données irrégulières de la physique des particules. Enfin, il devra valider ses propositions dans KIWAKU ainsi que sur des cas d’usage en vraie grandeur pour la collaboration internationale LHCb, notamment pour la reconstruction des données du sous-détecteur Velo, Cette dernière ambitionne d’unifier les structures de données utilisées en variante CPU et en variante GPU, avec usage de SoA et de tableaux irréguliers multi-dimensionnels.
[1] Data layout and SIMD abstraction layers: decoupling interfaces from implementations. Sylvain Jubertie, Ian Masliah, Joel Falcou. https://hal.science/hal-01915529v1
[2] Fast and flexible data structures for the LHCb Run 3 software trigger. Sevda Esen, Arthur Marius Hennequin, Michel De Cian. https://doi.org/10.48550/arXiv.2307.03689
[3] Evolution of the ATLAS event data model for the HL-LHC. Attila Krasznahorkay, Paul Gessinger, Scott Snyder, Nicholas Swatman. https://indico.cern.ch/event/1338689/contributions/6010097/
[4] The Awkward World of Python and C++. Manasvi Goyal, Ianna Osborne, Jim Pivarski. https://arxiv.org/pdf/2303.02205
[5] Kiwaku, a C++20 library for multidimensional arrays Application to ACTS tracking. Sylvain Joube, Hadrien Grasland, David Chamont, Joël Falcou. https://hal.science/hal-04401240v1

Contexte de travail

La thèse sera rattachée à l’école doctorale STIC de l’Université Paris-Saclay. Le doctorant sera amené à travailler à la fois à IJCLab et au LISN.
Le laboratoire de Physique des 2 Infinis Irène Joliot-Curie est un laboratoire de physique des deux infinis sous tutelle du CNRS, de l'Université Paris-Saclay et de l'université de Paris. Il dispose de capacités techniques très importantes (environ 280 ingénieurs et techniciens) dans tous les grands domaines requis pour concevoir, mettre au point et en œuvre les dispositifs expérimentaux nécessaires à son activité scientifique. Le doctorant sera rattaché au Service Développement du Département Informatique.
IJCLAB fonde sa politique de recrutement sur la promotion de l'égalité, de la diversité et de l'inclusion. Valeurs essentielles, elles permettent le développement professionnel des agents, véritables acteurs d'une réussite collective, mais également le développement du laboratoire lui-même.

Le Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) implanté sur le campus de l’Université Paris-Saclay est un laboratoire de recherche pluridisciplinaire issu du regroupement des équipes des deux éminents laboratoires d’informatique de l’Université Paris-Saclay : le Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur (LIMSILaboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur, créé en 1972 et dont les équipes ont rejoint celles du LRI en 2021 pour fonder le LISN.) et le Laboratoire de Recherche en Informatique (LRI).

Administrativement, le LISN est une Unité Mixte de Recherche (UMR9015), et a pour tutelles principales le CNRS et l’Université Paris-Saclay et pour tutelles secondaires INRIA et CentraleSupélec.


Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.

Contraintes et risques

Le doctorant sera amené à travailler alternativement à IJCLab et au LISN (Orsay), selon différentes modalités au fil du temps, en fonction des nécessités de ses recherches. Il pourra aussi être sollicité pour se rendre au CERN (Genève) sur des périodes allant de quelques jours à quelques semaines.

Lieu : Orsay
Contrat : CDD