← Back to papers

2025 ICML ICML 2025

Gandalf the Red: Adaptive Security for LLMs

👥 Mega-Team — 26 authors

Authors

Niklas Pfister , Václav Volhejn , Manuel Knott , Santiago Arias , Julia Bazinska , Mykhailo Bichurin , Alan Y. Commike , Janet Darling , Péter Dienes , Matthew Fiedler , David Haber , Matthias Kraft , Marco Lancini , Max Mathys , Damian Pascual-Ortiz , Jakub Podolak , Adrià Romero-López , Kyriacos Shiarlis , Andreas Signer , Zsolt Terek , Athanasios Theocharis , Daniel Timbrell , Samuel Trautwein , Samuel Watts , Yun-Han Wu , Mateo Rojas-Carulla

Related papers

Scaling Sparse Feature Circuits For Studying In-Context Learning 2025

Incremental Gradient Descent with Small Epoch Counts is Surprisingly Slow on Ill-Conditioned Problems 2025

SToFM: a Multi-scale Foundation Model for Spatial Transcriptomics 2025

Batch List-Decodable Linear Regression via Higher Moments 2025

GS-Bias: Global-Spatial Bias Learner for Single-Image Test-Time Adaptation of Vision-Language Models 2025