ITBench: Evaluating AI Agents across Diverse Real-World IT Automation Tasks

2025 ICML ICML 2025

👥 Mega-Team — 40 authors

Saurabh Jha , Rohan R. Arora , Yuji Watanabe , Takumi Yanagawa , Yinfang Chen , Jackson Clark , Bhavya Bhavya , Mudit Verma , Harshit Kumar , Hirokuni Kitahara , Noah Zheutlin , Saki Takano , Divya Pathak , Felix George , Xinbo Wu , Bekir O Turkkan , Gerard Vanloo , Michael Nidd , Ting Dai , Oishik Chatterjee , Pranjal Gupta , Suranjana Samanta , Pooja Aggarwal , Rong Lee , Jae-Wook Ahn , Debanjana Kar , Amit Paradkar , Yu Deng , Pratibha Moogi , Prateeti Mohapatra , Naoki Abe , Chandrasekhar Narayanaswami , Tianyin Xu , Lav R. Varshney , Ruchi Mahindru , Anca Sailer , Laura Shwartz , Daby Sow , Nicholas C. M. Fuller , Ruchir Puri

Related papers