Recherchez une offre d'emploi
Apprentissage par Renforcement pour une IA Agentique Fiable - Stage H/F - 95
Description du poste
-
Assystem
-
Courbevoie - 95
-
Stage
-
Publié le 22 Octobre 2025
Trouver des solutions au dérèglement climatique est la priorité du 21ème siècle, et implique de switcher à l'énergie bas-carbone. Chez Assystem, on s'est donc donné pour mission d'accélérer la transition énergétique partout dans le monde. Et pour y parvenir, nos 8000 Switchers couplent leur expertise historique en ingénierie et en management de projet aux technologies digitales.
Présent dans 13 pays (Europe, Moyen-Orient, Asie), nous travaillons sur la production et la distribution d'électricité bas-carbone, à travers le développement des énergies nucléaires et renouvelables. Nous participons également à modernisation des réseaux électriques et l'électrification des usages, à travers l'hydrogène pour décarboner les secteurs des transports et de l'industrie.Nous recherchons un(e) stagiaire pour participer à la mise en place d'IA agentique sure et efficace pour des workflows d'ingénierie en contexte réglementé nucléaire. Vous appliquerez l'apprentissage par renforcement (RL) - associé à des garde fous solides à une évaluation rigoureuse - pour permettre à un agent LLM de planifier, d'utiliser les outils et de vérifier les résultats sur une infrastructure cloud et sur site.
Vous travaillerez main dans la main avec notre référent technique LLM pour appliquer des méthodes de RL de pointe (optimisation des préférences (DPO/IPO), bandits, RL hors ligne) à des cas d'usages concrets à destination des équipes d'ingénierie - tout en répondant aux attentes du secteur en matière de sécurité et de conformité.
Missions principales:
- Construire une boucle d'agents (planning appels outils vérification) avec garde-fous.
- Récompenses multi objectifs multi-objective rewards prenant en compte également latence, coût..
- Construire un pipeline preference/feedback RLHF/RLAIF.
- Explorer différentes méthodes RL : preference optimization (DPO/IPO), bandits;
- Sécuriser le pipeline: règles, provenance tracking, confidence, human-in-the-loop approvals.
- Appliquer à la réalisation d'un assistant pilote agentique démontrant un gain de temps sur des cas d'usage réels.
Pourquoi réaliser votre stage chez Assystem ? On a 3 bonnes raisons pour vous convaincre !
Travailler au sein d'une équipe engagée qui ramène expertise et croissants le matin !
Découvrir pourquoi 92% de nos stagiaires apprécient l'ambiance et leur environnement de travail
Gagner en compétences et développer votre expertise métier en échangeant au quotidien avec les collaborateurs Assystem, ainsi que le client en direct pour plus de proximité !
Offres similaires
Chef de Projet Active Directory H/F
-
Consort Group
-
Courbevoie - 92
-
CDI
-
24 Octobre 2025
Juriste Droit des Affaires Internationales H/F
-
Expert & Manager
-
Courbevoie - 92
-
CDI
-
24 Octobre 2025
Professeur de Physique Superieur pour Cours Particuliers H/F
-
Anacours
-
Courbevoie - 92
-
CDD
-
24 Octobre 2025
Déposez votre CV
Soyez visible par les entreprises qui recrutent à Argenteuil.
Chiffres clés de l'emploi à Argenteuil
- Taux de chomage : 13%
- Population : 111038
- Médiane niveau de vie : 18430€/an
- Demandeurs d'emploi : 11890
- Actifs : 53277
- Nombres d'entreprises : 8501
Sources :
Un site du réseaux :