Computation of Similarity Measures for Sequential Data using Generalized Suffix Trees

Konrad Rieck; Pavel Laskov; Sören Sonnenburg

2006 NIPS NeurIPS 2006

Computation of Similarity Measures for Sequential Data using Generalized Suffix Trees

Abstract

We propose a generic algorithm for computation of similarity measures for se- quential data. The algorithm uses generalized sufﬁx trees for efﬁcient calculation of various kernel, distance and non-metric similarity functions. Its worst-case run-time is linear in the length of sequences and independent of the underlying embedding language, which can cover words, k-grams or all contained subse- quences. Experiments with network intrusion detection, DNA analysis and text processing applications demonstrate the utility of distances and similarity coefﬁ- cients for sequences as alternatives to classical kernel functions.

🚀 Conference Pioneer — NIPS 2006

🌉 Interdisciplinary Bridge — Computer Science and Data Science & Analytics

📈 Trend Setter — Data Mining

🧭 Keyword Pioneer — sequential data

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Interdisciplinary, Machine Learning, Mathematics & Optimization, Natural Language Processing, Robotics

Authors

Konrad Rieck , Pavel Laskov , Sören Sonnenburg

Topics

Machine Learning > Core Methods > Metric Learning Data Science & Analytics > Methods > Data Mining Computer Science > Foundations > Algorithms Machine Learning > Core Methods > Kernel Methods

Keywords

sequential data suffix trees sequential datum kernel function similarity measure string matching distance function generalized suffix tree

Download PDF

Related papers

Temporal Coding using the Response Properties of Spiking Neurons 2006

Parameter Expanded Variational Bayesian Methods 2006

Effects of Stress and Genotype on Meta-parameter Dynamics in Reinforcement Learning 2006

Ordinal Regression by Extended Binary Classification 2006

Blind source separation for over-determined delayed mixtures 2006