Takumi Tanabe

3 papers · 2022–2026 · 2 conferences · across top CS/AI conferences

Achievements

🌍 Conference Polyglot (2) 🌉 Interdisciplinary Bridge 🧭 Keyword Pioneer 🐝 Cross-Pollinator (15)

Conferences

NIPS (2) AAAI (1)

Top co-authors

Youhei Akimoto (3) Akifumi Wachi (2) Rei Sato (2) Kazuto Fukuchi (1) Mikoto Kudo (1) Thien Q. Tran (1) Shigeki Kusaka (1) Keita Saito (1) Jun Sakuma (1)

Keywords

robust optimization (1) reward modeling (1) policy optimization (1) sim-to-real transfer (1) convex optimization (1) model misspecification (1) preference learning (1) direct preference optimization (1) robust reinforcement learning (1) reinforcement learning from human feedback (1) off-policy learning (1) worst-case optimization (1) reward model (1) poisoning attack (1) safety constraint (1) label flipping (1) off-policy actor-critic (1) large language model (1) worst-case robustness (1)

Papers

Cost-Minimized Label-Flipping Poisoning Attack to LLM Alignment AAAI 2026

Stepwise Alignment for Constrained Language Model Policy Optimization NIPS 2024

Max-Min Off-Policy Actor-Critic Method Focusing on Worst-Case Robustness to Model Misspecification NIPS 2022