Paul F Christiano

3 papers · 2017–2022 · 1 conference · across top CS/AI conferences

Achievements

🧭 Keyword Pioneer 🏃 Academic Marathon (5) 🐝 Cross-Pollinator (15) 🌈 Renaissance Researcher (5) 🌉 Interdisciplinary Bridge 🐣 Hot Topic Early Bird 🗺️ Taxonomy Completionist (10) 📛 The Namer 👥 Mega-Team (20) 📈 Trend Setter

Conferences

NIPS (3)

Top co-authors

Jan Leike (2) Jeffrey Wu (2) Long Ouyang (2) Ryan Lowe (2) Dario Amodei (2) Jacob Hilton (1) Alec Radford (1) Diogo Almeida (1) Maddie Simens (1) Shane Legg (1)

Keywords

preference learning (2) reinforcement learning (2) instruction following (1) language model alignment (1) reinforcement learning from human feedback (1) model alignment (1) reward function (1) human feedback (1) language model (1) reward model (1) supervised fine-tuning (1) human preference (1) deep reinforcement learning (1) trajectory segment (1) reward modeling (1)

Papers

Training language models to follow instructions with human feedback NIPS 2022

Learning to summarize with human feedback NIPS 2020

Deep Reinforcement Learning from Human Preferences NIPS 2017