Divergences and Risks for Multiclass Experiments

Dario García-García; Robert C. Williamson

2012 COLT COLT 2012

Divergences and Risks for Multiclass Experiments

Abstract

Csiszár’s $f$-divergence is a way to measure the similarity of two probability distributions. We study the extension of $f$-divergence to more than two distributions to measure their joint similarity. By exploiting classical results from the comparison of experiments literature we prove the resulting divergence satisfies all the same properties as the traditional binary one. Considering the multidistribution case actually makes the proofs simpler. The key to these results is a formal bridge between these multidistribution $f$-divergences and Bayes risks for multiclass classification problems.

🌉 Interdisciplinary Bridge — Machine Learning and Mathematics & Optimization

🧭 Keyword Pioneer — csiszár divergence

🐝 Cross-Pollinator — Artificial Intelligence, Computer Vision, Data Science & Analytics, Deep Learning, Interdisciplinary, Machine Learning, Mathematics & Optimization, Natural Language Processing, Speech & Audio

🐣 Hot Topic Early Bird — multiclass classification

Authors

Dario García-García , Robert C. Williamson

Topics

Machine Learning > Core Methods > Classification Mathematics & Optimization > Mathematics > Information Theory Mathematics & Optimization > Mathematics > Probability Machine Learning > Optimization & Theory > Statistics

Keywords

multiclass classification probability distribution bayes risk csiszár divergence experiment comparison

Download PDF

Related papers

Unsupervised SVMs: On the Complexity of the Furthest Hyperplane Problem 2012

Online Optimization with Gradual Variations 2012

Toward a Noncommutative Arithmetic-geometric Mean Inequality: Conjectures, Case-studies, and Consequences 2012

Computational Bounds on Statistical Query Learning 2012

Rare Probability Estimation under Regularly Varying Heavy Tails 2012