9

Unifying Autoregressive and Diffusion-Based Sequence Generation

We take significant steps toward unifying autoregressive and diffusion-based sequence generation by extending the SEDD discrete …

Nima Fathi, Torsten Scholak, Pierre-André Noël

Workshop at the International Conference of Learning Representation (ICLR), 2025.

WebMMU: A Benchmark for Multimodal Multilingual Website Understanding and Code Generation

Understanding diverse web data and automating web development presents an exciting challenge for agentic AI. While existing benchmarks …

Rabiul Awal, Mahsa Massoud, Zichao Li, Aarash Feizi, Suyuchen Wang, Christopher Pal, Aishwarya Agrawal, David Vazquez, Siva Reddy, Juan A. Rodriguez, Perouz Taslakian, Spandana Gella, Sai Rajeswar Mudumba

Workshop at the International Conference of Learning Representation (ICLR), 2025.

EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision

EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision

This paper presents EarthView, a comprehensive dataset specifically designed for self-supervision on remote sensing data, intended to …

Diego Velazquez, Pau Rodriguez, Sergio Alonso, Josep M. Gonfaus, Jordi Gonzalez, Gerardo Richarte, Javier Marin, Yoshua Bengio, Alexandre Lacoste

Workshop at the Winter Conference on Applications of Computer Vision (WACV), 2025.

AgentMerge: Enhancing Generalization in Fine-Tuned LLM Agents

Recent advancements in large language models (LLMs) have spurred interest in developing autonomous agents capable of performing complex …

Megh Thakkar, Léo Boisvert, Thibault Le Sellier De Chezelles, Alexandre Piche, Maxime Gasse, Alexandre Lacoste, Massimo Caccia

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

BigDocs: A Permissively-Licensed Dataset for Training Vision-Language Models on Document and Code Tasks

Vision and language models that can accurately understand both images and text are crucial for deeper document understanding. These …

Juan A. Rodriguez, Xiangru Jian, Siba Smarak Panigrahi, Tianyu Zhang, Aarash Feizi, Abhay Puri, Akshay Kalkunte, Francois Savard, Amirhossein Abaskohi, Ahmed Masry, Shravan Nayak, Mahsa Massoud, Rabiul Awal, Pierre-André Noël, Mats L. Richter, Saverio Vadacchino, Shubham Agarwal, Sanket Biswas, Ying Zhang, Sathwik Tejaswi Madhusudhan, João Monteiro, Krishnamurthy (Dj) Dvijotham, Torsten Scholak, Nicolas Chapados, Sean Hughes, Tamer Özsu, Aishwarya Agrawal, Marco Pedersoli, Christopher Pal, Perouz Taslakian, David Vazquez, Issam H. Laradji, Spandana Gella, Sai Rajeswar Mudumba

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

BlockLLM: Memory-Efficient Adaptation of LLMs by Selecting and Optimizing the Right Coordinate Blocks

Training large language models (LLMs) for pretraining or adapting to new tasks and domains has become increasingly critical as their …

Issam H. Laradji, Amrutha Ramesh, Mark Schmidt

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

Context is Key: A Benchmark for Forecasting with Essential Textual Information

Forecasting is a critical task in decision making across various domains. While numerical data provides a foundation, it often lacks …

Andrew Williams, Arjun Ashok, Étienne Marcotte, Valentina Zantedeschi, Jithendaraa Subramanian, Roland Riachi, James Requeima, Alexandre Lacoste, Irina Rish, Nicolas Chapados, Alexandre Drouin

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

Evaluating Interventional Reasoning Capabilities of Large Language Models

Evaluating Interventional Reasoning Capabilities of Large Language Models

Numerous decision-making tasks require estimating causal effects under interventions on different parts of a system. As practitioners …

Tejas Kasetty, Divyat Mahajan, Gintare Karolina Dziugaite, Alexandre Drouin, Dhanya Sridhar

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

Fast Convergence of Softmax Policy Mirror Ascent for Bandits & Tabular MDPs

Fast Convergence of Softmax Policy Mirror Ascent for Bandits & Tabular MDPs

We analyze the convergence of a novel policy gradient algorithm (referred to as SPMA) for multi-armed bandits and tabular Markov …

Issam H. Laradji, Reza Asad, Sharan Vaswani

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

Fine-Tuning Web Agents: It Works, But It's Trickier Than You Think

Fine-Tuning Web Agents: It Works, But It's Trickier Than You Think

Recent advancements in large language models (LLMs) have sparked interest in developing autonomous web agents capable of performing …

Massimo Caccia, Megh Thakkar, Léo Boisvert, Thibault Le Sellier De Chezelles, Alexandre Piche, Nicolas Chapados, Alexandre Drouin, Maxime Gasse, Alexandre Lacoste

Workshop at the Neural Information Processing Systems (NeurIPS), 2024.