Privacy Regularization: Joint Privacy-Utility Optimization in LanguageModels

FatemehSadat Mireshghallah; Huseyin Inan; Marcello Hasegawa; Victor Rühle; Taylor Berg-Kirkpatrick; Robert Sim

2021 NAACL NAACL 2021

Privacy Regularization: Joint Privacy-Utility Optimization in LanguageModels

Abstract

AbstractNeural language models are known to have a high capacity for memorization of training samples. This may have serious privacy im- plications when training models on user content such as email correspondence. Differential privacy (DP), a popular choice to train models with privacy guarantees, comes with significant costs in terms of utility degradation and disparate impact on subgroups of users. In this work, we introduce two privacy-preserving regularization methods for training language models that enable joint optimization of utility and privacy through (1) the use of a discriminator and (2) the inclusion of a novel triplet-loss term. We compare our methods with DP through extensive evaluation. We show the advantages of our regularizers with favorable utility-privacy trade-off, faster training with the ability to tap into existing optimization approaches, and ensuring uniform treatment of under-represented subgroups.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Machine Learning

🧭 Keyword Pioneer — privacy regularization

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

FatemehSadat Mireshghallah , Huseyin Inan , Marcello Hasegawa , Victor Rühle , Taylor Berg-Kirkpatrick , Robert Sim

Topics

Artificial Intelligence > Core AI > Responsible AI Machine Learning > Application Areas > Privacy

Keywords

differential privacy language model triplet loss privacy regularization utility-privacy tradeoff

Download PDF

Related papers

Knowledge Router: Learning Disentangled Representations for Knowledge Graphs 2021

Cross-Task Instance Representation Interactions and Label Dependencies for Joint Information Extraction with Graph Convolutional Networks 2021

Abstract Meaning Representation Guided Graph Encoding and Decoding for Joint Information Extraction 2021

Beyond Fair Pay: Ethical Implications of NLP Crowdsourcing 2021

Probing Word Translations in the Transformer and Trading Decoder for Encoder Layers 2021