Mehdi Cherti

Postdoc at Jülich Supercomputing Centre (JSC) / LAION team, Germany

I received my PhD in Machine Learning from Université Paris Saclay in 2018. Currently, I am a postdoctoral researcher at Jülich Supercomputing Center (JSC) and co-founder of LAION.

I am interested in large scale training, generative models, models that can learn efficiently (transfer learning, few-shot learning, meta-learning) and generalize out of their training distribution (OOD generalization), enabling broader and more robust applicability.

Selected Publications

Scaling Laws for Robust Comparison of Open Foundation Language-Vision Models and Datasets

Marianna Nezhurina, Tomer Porian, Giovanni Pucceti, Tommie Kerssies, Romain Beaumont, Mehdi Cherti, Jenia Jitsev

Preprint (2025)

Code

A Good CREPE needs more than just Sugar: Investigating Biases in Compositional Vision-Language Benchmarks

Vishaal Udandarao, Mehdi Cherti, Shyamgopal Karthik, Jenia Jitsev, Samuel Albanie, Matthias Bethge

Short version: Eval-FoMo 2 CVPR 2025 Workshop

Alice in wonderland: Simple tasks showing complete reasoning breakdown in state-of-the-art large language models

Marianna Nezhurina, Lucia Cipolina-Kun, Mehdi Cherti, Jenia Jitsev

Preprint (2024)

Code

Reproducible scaling laws for contrastive language-image learning

Mehdi Cherti, Romain Beaumon, Ross Wightman, Mitchell Wortsman, Gabriel Ilharco, Cade Gordon, Christoph Schuhmann, Ludwig Schmidt, Jenia Jitsev

CVPR 2023

Code / Poster / Slides / Video

LAION-5B: An open large-scale dataset for training next generation image-text models

Christoph Schuhmann, Romain Beaumont, Richard Vencu, Cade Gordon, Ross Wightman, Mehdi Cherti, Theo Coombes, Aarush Katta, Clayton Mullis, Mitchell Wortsman, Patrick Schramowski, Srivatsa Kundurthy, Katherine Crowson, Ludwig Schmidt, Robert Kaczmarczyk, Jenia Jitsev

NeurIPS 2022 Datasets and Benchmarks track (Outstanding paper award)

OpenReview / Poster / Video