Stage - Generative modeling for synthetic time-series via stochastic interpolant

Date: 30 oct. 2025

Lieu: Paris, 75, FR

Entreprise: Capital Fund Management

 

À PROPOS DE CFM

 

Fondés en 1991, nous sommes une société mondiale de gestion d’actifs quantitative et systématique appliquant une approche scientifique à la finance pour développer des stratégies d’investissement alternatives pour nos clients.

Nous valorisons l’innovation, l’engagement, l’aboutissement et l’intelligence collective en créant ensemble un environnement d’experts passionnés et talentueux dans les domaines de la recherche, des technologies et du business pour explorer de nouvelles idées et toujours remettre en question les hypothèses.

 

Résumé


Construisez et testez la résistance de modèles génératifs basés sur la correspondance de flux/interpolants stochastiques pour des séries chronologiques synthétiques. Vous créerez des ensembles de données synthétiques contrôlables (avec bruit réglable, non-linéarité, changements de régime et contrôles exogènes) et/ou adapterez des benchmarks tirés de la littérature, comparerez des architectures neuronales (MLP, Transformers, etc.) et des stratégies d'entraînement, et quantifierez :
1.    La complexité des échantillons et l'efficacité des données dans les différentes architectures
2.    Si l'apprentissage d'une distribution conditionnelle complète améliore la précision lorsque nous ne nous intéressons qu'aux moyennes conditionnelles
3.    La généralisation hors support avec des variables de contrôle (jusqu'où pouvons-nous extrapoler ?)


Motivation


Les modèles génératifs de type diffusion (correspondance de flux/interpolants stochastiques) fonctionnent remarquablement bien pour les images et le texte, mais leur comportement sur les séries chronologiques structurées, en particulier avec des contrôles et des entrées mixtes scalaires/séquentielles, est moins bien compris. De plus, dans des conditions réalistes, nous sommes confrontés à un régime de données limité, ce qui n'est pas le cas dans le domaine de la vision ou du traitement du langage naturel. Ce projet pose les questions suivantes : quelles architectures et quels choix de formation sont les plus efficaces en termes de données, quand la modélisation générative est-elle plus intéressante que les régressions simples, et dans quelle mesure ces modèles sont-ils robustes face aux changements dans les statistiques d'entrée ?
 
Ce sont là les principales questions qui nous intéressent ; le stage donnera la priorité à un sous-ensemble en fonction des progrès réalisés et des intérêts du stagiaire.
 
Prérequis : maîtrise de Python/PyTorch et des probabilités/ML de base. Curiosité pour la modélisation générative et la conception expérimentale rigoureuse.

 

DÉCLARATION SUR L’ÉGALITÉ DES CHANCES

 

Nous nous efforçons continuellement d’être un employeur offrant l’égalité des chances et nous interdisons toute forme de discrimination fondée sur le sexe, le handicap, l’origine, l’orientation sexuelle, l’identité de genre, l’âge, la race ou la religion. Nous croyons que notre diversité, nos apports diversifiés d’expérience et nos multiples points de vue sont les principaux facteurs de notre succès.

CFM est signataire des Women Empowerment Principles.

 

SUIVEZ-NOUS

Suivez-nous sur Twitter et LinkedIn ou visitez notre site Web pour en apprendre davantage sur CFM.