Publications

5 results at INTERSPEECH 2025

Spoken question answering for visual queries
- - Nimrod Shabtay
  - Zvi Kons
  - et al.
- 2025
- INTERSPEECH 2025
Exploring the Limits of Conformer CTC-Encoder for Speech Emotion Recognition using Large Language Models
- - Edmilson Da Silva Morais
  - Hagai Aronowitz
  - et al.
- 2025
- INTERSPEECH 2025
Voice Activity-based Text Segmentation for ASR Text Denormalization
- - Sashi Novitasari
  - Takashi Fukuda
  - et al.
- 2025
- INTERSPEECH 2025
Improving End-to-end Mixed-case ASR with Knowledge Distillation and Integration of Voice Activity Cues
- - Sashi Novitasari
  - Takashi Fukuda
  - et al.
- 2025
- INTERSPEECH 2025
SKIP-SALSA: Skip Synchronous Fusion of ASR LLM Decoders
- - Ashish Mittal
  - Darshan Prabhu
  - et al.
- 2025
- INTERSPEECH 2025