Bang Liu

Publications

AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Document Understanding. Ahmed Masry, Juan A. Rodriguez, Tianyu Zhang, Suyuchen Wang, Chao Wang, Aarash Feizi, Akshay Kalkunte, Abhay Puri, Xiangru Jian, Pierre-André Noël, Sathwik Madhusudhan, Marco Pedersoli, Bang Liu, Nicolas Chapados, Yoshua Bengio, Enamul Hoque Prince , Christopher Pal, Issam H. Laradji, David Vazquez, Perouz Taslakian, Spandana Gella, Sai Rajeswar Mudumba. At Neural Information Processing Systems (NeurIPS), 2025.

Article Citation Code Vidéo

AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Understanding. Ahmed Masry, Juan A. Rodriguez, Tianyu Zhang, Suyuchen Wang, Chao Wang, Aarash Feizi, Akshay Kalkunte, Abhay Puri, Xiangru Jian, Pierre-André Noël, Sathwik Madhusudhan, Marco Pedersoli, Bang Liu, Nicolas Chapados, Yoshua Bengio, Enamul Hoque Prince , Christopher Pal, Issam H. Laradji, David Vazquez, Perouz Taslakian, Spandana Gella, Sai Rajeswar Mudumba. At Workshop at the International Conference of Learning Representation (ICLR), 2025.

Article Citation Code

VCR: Visual Caption Restoration. Tianyu Zhang, Suyuchen Wang, Lu Li, Ge Zhang, Perouz Taslakian, Sai Rajeswar Mudumba, Jie Fu, Bang Liu, Yoshua Bengio. At International Conference of Learning Representations (ICLR), 2025.

Article Citation Code

VCR: Visual Caption Restoration. Tianyu Zhang, Suyuchen Wang, Lu Li, Ge Zhang, Perouz Taslakian, Sai Rajeswar Mudumba, Jie Fu, Bang Liu, Yoshua Bengio. At Workshop at the Neural Information Processing Systems (NeurIPS), 2024.

Article Citation Code