Hugo Academic CV Theme

Jean Mercat John

Research Scientist

About Me

I’m a machine learning research scientist at the Toyota Research Institute, where I specialize in transformers, large language models, vision language models, and large behavior models. My passion for ML has led me to explore a variety of fields, including self-driving cars, robotics, and language processing. Whether it’s making a language model smarter or teaching robots new tricks, I’m always on the lookout for the next big breakthrough!

Download CV

Interests

Artificial Intelligence
Natural Language Processing
Multi-modal Language Models

Education

PhD Machine Learning
Paris Saclay University, L2S and Renault
MEng in Scientific Computing
ENSEIRB-MatMéca, Bordeaux, France

📚 My Research

I’m a research scientist at Toyota Research Institute. I pre-train, uptrain, fine-tune, experiment, and do research with Large Language Models, Vision Language Models, and Large Behavior Models.

I attempt to understand and improve transformers. I apply large models to robotic manipulation to push the boundary of open-ended embodied intelligence.

Featured Publications

DataComp-LM: In Search of the Next Generation of Training Sets for Language Models

Jun 17, 2024

Linearizing Large Language Models

May 14, 2024

Language Models Scale Reliably with Over-Training and on Downstream Tasks

Mar 14, 2024

RAP: Risk-Aware Prediction for Robust Planning.

Dec 1, 2022

Recent Publications

Jeffrey Li, Alex Fang, Georgios Smyrnis, Maor Ivgi, Matt Jordan, Samir Gadre, Hritik Bansal, Etash Guha, Sedrick Keh, Kushal Arora, Saurabh Garg, Rui Xin, Niklas Muennighoff, Reinhard Heckel, Jean Mercat, Mayee Chen, Suchin Gururangan, Mitchell Wortsman, Alon Albalak, Yonatan Bitton, Marianna Nezhurina, Amro Abbas, Cheng-Yu Hsieh, Dhruba Ghosh, Josh Gardner, Maciej Kilian, Hanlin Zhang, Rulin Shao, Sarah Pratt, Sunny Sanyal, Gabriel Ilharco, Giannis Daras, Kalyani Marathe, Aaron Gokaslan, Jieyu Zhang, Khyathi Chandu, Thao Nguyen, Igor Vasiljevic, Sham Kakade, Shuran Song, Sujay Sanghavi, Fartash Faghri, Sewoong Oh, Luke Zettlemoyer, Kyle Lo, Alaaeldin El-Nouby, Hadi Pouransari, Alexander Toshev, Stephanie Wang, Dirk Groeneveld, Luca Soldaini, Pang Wei Koh, Jenia Jitsev, Thomas Kollar, Alexandros G. Dimakis, Yair Carmon, Achal Dave, Ludwig Schmidt, Vaishaal Shankar (2024). DataComp-LM: In Search of the Next Generation of Training Sets for Language Models.

PDF Cite Code Project DOI

Jean Mercat, Igor Vasiljevic, Sedrick Keh, Kushal Arora, Achal Dave, Adrien Gaidon, Thomas Kollar (2024). Linearizing Large Language Models. In COLM.

PDF Cite Code Project DOI

Alexander Khazatsky, Karl Pertsch, Suraj Nair, Ashwin Balakrishna, Sudeep Dasari, Siddharth Karamcheti, Soroush Nasiriany, Mohan Kumar Srirama, Lawrence Yunliang Chen, Kirsty Ellis, Peter David Fagan, Joey Hejna, Masha Itkina, Marion Lepert, Jason Ma, Patrick Tree Miller, Jimmy Wu, Suneel Belkhale, Shivin Dass, Huy Ha, Abraham Lee, Youngwoon Lee, Arhan Jain, Marius Memmel, Sungjae Park, Ilija Radosavovic, Kaiyuan Wang, Albert Zhan, Kevin Black, Cheng Chi, Kyle Hatch, Shan Lin, Jingpei Lu, Abdul Rehman, Pannag R Sanketi, Archit Sharma, Cody Simpson, Quan Vuong, Homer Walke, Blake Wulfe, Ted Xiao, Jonathan Yang, Arefeh Yavary, Tony Z. Zhao, Christopher Agia, Rohan Baijal, Mateo Guaman Castro, Daphne Chen, Qiuyu Chen, Trinity Chung, Jaimyn Drake, Ethan Paul Foster, Jensen Gao, David Antonio Herrera, Minho Heo, Kyle Hsu, Jiaheng Hu, Donovon Jackson, Charlotte Le, Yunshuang Li, Kevin Lin, Roy Lin, Zehan Ma, Abhiram Maddukuri, Suvir Mirchandani, Daniel Morton, Tony Nguyen, Abby O’Neill, Rosario Scalise, Derick Seale, Victor Son, Stephen Tian, Andrew Wang, Yilin Wu, Annie Xie, Jingyun Yang, Patrick Yin, Yunchu Zhang, Osbert Bastani, Glen Berseth, Jeannette Bohg, Ken Goldberg, Abhinav Gupta, Dinesh Jayaraman, Joseph J. Lim, Jitendra Malik, Roberto Martín-Martín, Subramanian Ramamoorthy, Dorsa Sadigh, Shuran Song, Jiajun Wu, Yuke Zhu, Thomas Kollar, Sergey Levine, Chelsea Finn (2024). DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset. In RSS 2024.

PDF Cite Code Project DOI

Samir Yitzhak Gadre, Georgios Smyrnis, Vaishaal Shankar, Suchin Gururangan, Mitchell Wortsman, Rulin Shao, Jean Mercat, Alex Fang, Jeffrey Li, Sedrick Keh, Rui Xin, Marianna Nezhurina, Igor Vasiljevic, Jenia Jitsev, Alexandros G. Dimakis, Gabriel Ilharco, Shuran Song, Thomas Kollar, Yair Carmon, Achal Dave, Reinhard Heckel, Niklas Muennighoff, Ludwig Schmidt (2024). Language Models Scale Reliably with Over-Training and on Downstream Tasks. In NeurIPS 2024.

PDF Cite Code Project DOI

Chenran Li, Chen Tang, Haruki Nishimura, Jean Mercat, Masayoshi Tomizuka, Wei Zhan (2023). Residual Q-Learning: Offline and Online Policy Customization without Value. In NeurIPS 2023.

PDF Cite Project

See all publications

Recent & Upcoming Talks

Deep Learning