Research Explorer

Contextualized End-to-end Automatic Speech Recognition with Intermediate Biasing Loss

Muhammad Shakeel, Yui Sudo, Yifan Peng et al.

2024 INTERSPEECH

Continual Learning Optimizations for Auto-regressive Decoder of Multilingual ASR systems

Chin Yuen Kwok, Jia Qi Yip, Eng Siong Chng

2024 INTERSPEECH

Contrastive Feedback Mechanism for Simultaneous Speech Translation

Haotian Tan, Sakriani Sakti

2024 INTERSPEECH

Contrastive Learning and Inter-Speaker Distribution Alignment Based Unsupervised Domain Adaptation for Robust Speaker Verification

Zuoliang Li, Wu Guo, Bin Gu et al.

2024 INTERSPEECH

Contrastive Learning Approach for Assessment of Phonological Precision in Patients with Tongue Cancer Using MRI Data

Tomas Arias-Vergara, Paula Andrea Pérez-Toro, Xiaofeng Liu et al.

2024 INTERSPEECH

Controlling Emotion in Text-to-Speech with Natural Language Prompts

Thomas Bott, Florian Lux, Ngoc Thang Vu

2024 INTERSPEECH

ConvoCache: Smart Re-Use of Chatbot Responses

Conor Atkins, Ian Wood, Mohamed Ali Kaafar et al.

2024 INTERSPEECH

Convolution-Augmented Parameter-Efficient Fine-Tuning for Speech Recognition

Kwangyoun Kim, Suwon Shon, Yi-Te Hsu et al.

2024 INTERSPEECH

COSMIC: Data Efficient Instruction-tuning For Speech In-Context Learning

Jing Pan, Jian Wu, Yashesh Gaur et al.

2024 INTERSPEECH

CreakVC: a voice conversion tool for modulating creaky voice

Harm Lameris, Joakim Gustafson, Éva Székely

2024 INTERSPEECH

CrisperWhisper: Accurate Timestamps on Verbatim Speech Transcriptions

Mario Zusag, Laurin Wagner, Bernhad Thallinger

2024 INTERSPEECH

Cross-Attention-Guided WaveNet for EEG-to-MEL Spectrogram Reconstruction

Hao Li, Yuan Fang, Xueliang Zhang et al.

2024 INTERSPEECH

Crosslinguistic Comparison of Acoustic Variation in the Vowel Sequences /ia/ and /io/ in Four Romance Languages

Johanna Cronenberg, Ioana Chitoran, Lori Lamel et al.

2024 INTERSPEECH

Cross-Linguistic Intelligibility of Non-Compositional Expressions in Spoken Context

Iuliia Zaitova, Irina Stenger, Wei Xue et al.

2024 INTERSPEECH

Cross-Modal Denoising: A Novel Training Paradigm for Enhancing Speech-Image Retrieval

Lifeng Zhou, Yuke Li, Rui Deng et al.

2024 INTERSPEECH

Cross-modal Features Interaction-and-Aggregation Network with Self-consistency Training for Speech Emotion Recognition

Ying Hu, Huamin Yang, Hao Huang et al.

2024 INTERSPEECH

Cross-Modality Diffusion Modeling and Sampling for Speech Recognition

Chia-Kai Yeh, Chih-Chun Chen, Ching-Hsien Hsu et al.

2024 INTERSPEECH

Cross-transfer Knowledge between Speech and Text Encoders to Evaluate Customer Satisfaction

Luis Felipe Parra-Gallego, Tilak Purohit, Bogdan Vlasenko et al.

2024 INTERSPEECH

CTC-aligned Audio-Text Embedding for Streaming Open-vocabulary Keyword Spotting

Sichen Jin, Youngmoon Jung, Seungjin Lee et al.

2024 INTERSPEECH

CtrSVDD: A Benchmark Dataset and Baseline Analysis for Controlled Singing Voice Deepfake Detection

Yongyi Zang, Jiatong Shi, You Zhang et al.

2024 INTERSPEECH

Custom wake word detection

Kesavaraj V, Charan Devarkonda, Vamshiraghusimha Narasinga et al.

2024 INTERSPEECH

DAISY: Data Adaptive Self-Supervised Early Exit for Speech Representation Models

Tzu-Quan Lin, Hung-yi Lee, Hao Tang

2024 INTERSPEECH

Dataset-Distillation Generative Model for Speech Emotion Recognition

Fabian Ritter-Gutierrez, Kuan-Po Huang, Jeremy H. M. Wong et al.

2024 INTERSPEECH

DB3V: A Dialect Dominated Dataset of Bird Vocalisation for Cross-corpus Bird Species Recognition

Xin Jing, Luyang Zhang, Jiangjian Xie et al.

2024 INTERSPEECH

DBD-CI: Doubling the Band Density for Bilateral Cochlear Implants

Mingyue Shi, Huali Zhou, Qinglin Meng et al.

2024 INTERSPEECH

Papers