Estimation of Entropy in Constant Space with Improved Sample Complexity

Maryam Aliakbarpour; Andrew McGregor; Jelani Nelson; Erik Waingarten

2022 NIPS NeurIPS 2022

Estimation of Entropy in Constant Space with Improved Sample Complexity

Abstract

Recent work of Acharya et al.~(NeurIPS 2019) showed how to estimate the entropy of a distribution $\mathcal D$ over an alphabet of size $k$ up to $\pm\epsilon$ additive error by streaming over $(k/\epsilon^3) \cdot \text{polylog}(1/\epsilon)$ i.i.d.\ samples and using only $O(1)$ words of memory. In this work, we give a new constant memory scheme that reduces the sample complexity to $(k/\epsilon^2)\cdot \text{polylog}(1/\epsilon)$. We conjecture that this is optimal up to $\text{polylog}(1/\epsilon)$ factors.

🌉 Interdisciplinary Bridge — Computer Science and Machine Learning and Mathematics & Optimization

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Maryam Aliakbarpour , Andrew McGregor , Jelani Nelson , Erik Waingarten

Topics

Mathematics & Optimization > Mathematics > Information Theory Mathematics & Optimization > Mathematics > Statistics Mathematics & Optimization > Optimization > Stochastic Methods Computer Science > Foundations > Algorithms Mathematics & Optimization > Optimization > Theory Machine Learning > Optimization & Theory > Sample Complexity

Keywords

sample complexity entropy estimation streaming algorithm constant space

Download PDF

Related papers

Transferring Pre-trained Multimodal Representations with Cross-modal Similarity Matching 2022

A Theoretical View on Sparsely Activated Networks 2022

Prune and distill: similar reformatting of image information along rat visual cortex and deep neural networks 2022

Matryoshka Representation Learning 2022

Off-Policy Evaluation with Deficient Support Using Side Information 2022