Scalable Deletion-Robust Submodular Maximization: Data Summarization with Privacy and Fairness Constraints

Ehsan Kazemi; Morteza Zadimoghaddam; Amin Karbasi

2018 ICML ICML 2018

Scalable Deletion-Robust Submodular Maximization: Data Summarization with Privacy and Fairness Constraints

Abstract

Can we efficiently extract useful information from a large user-generated dataset while protecting the privacy of the users and/or ensuring fairness in representation? We cast this problem as an instance of a deletion-robust submodular maximization where part of the data may be deleted or masked due to privacy concerns or fairness criteria. We propose the first memory-efficient centralized, streaming, and distributed methods with constant-factor approximation guarantees against any number of adversarial deletions. We extensively evaluate the performance of our algorithms on real-world applications, including (i) Uber-pick up locations with location privacy constraints; (ii) feature selection with fairness constraints for income prediction and crime rate prediction; and (iii) robust to deletion summarization of census data, consisting of 2,458,285 feature vectors. Our experiments show that our solution is robust against even $80%$ of data deletion.

🌉 Interdisciplinary Bridge — Machine Learning and Mathematics & Optimization

🧭 Keyword Pioneer — deletion robustness

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Data Science & Analytics, Deep Learning, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Security & Privacy

🐣 Hot Topic Early Bird — data privacy

Authors

Ehsan Kazemi , Morteza Zadimoghaddam , Amin Karbasi

Topics

Machine Learning > Application Areas > Fairness Machine Learning > Application Areas > Privacy Mathematics & Optimization > Optimization > Combinatorial Optimization Mathematics & Optimization > Optimization > Discrete Optimization

Keywords

data summarization data privacy submodular maximization approximation algorithm fairness constraint privacy constraint deletion robustness adversarial deletion

Download PDF

Related papers

Rectify Heterogeneous Models with Semantic Mapping 2018

Bayesian Optimization of Combinatorial Structures 2018

The Well-Tempered Lasso 2018

Approximation Algorithms for Cascading Prediction Models 2018

Classification from Pairwise Similarity and Unlabeled Data 2018