Duration modeling for speech recognition

Duration modeling for speech recognition Presented for BBN Dr. Andrey Nikiforov Department of Applied Mathematics and Statistics State University of New York at Stony Brook

Additional topics Computational and modeling issues improving the performance of speech recognition algorithms • Partial classification techniques • Tree-dependence covariance models in HMM • Fast search and computations for codebooks • Interpolation for acoustic space

State duration in HMM

Duration distributions

From …

… to

Progressive model

Time calculation A B t+1 t

Time calculation (continued) A B t+1 t

Probability calculations: from …

…to

Hazard function

Hazard function estimation

“Nonparametric estimate”

“Trajectories”

State duration correction (Fant et al., 1991)

Word duration

State duration correction

State duration correction (continued)

Conclusions • Representation of duration distribution via the hazard function is simple, effective and comfortable for programming • Speech recognition errors dropped by 20-25% in different tasks • Pure time spent in Viterbi search or full probability calculation increased in average by 20% compared to the conventional HMM (almost completely compensated by the reduction of computations due to more adequate modeling)

Partial classification techniques for speech recognition • Helps to create structure in speech HMMs • Useful in codebook(s) estimation • Initial estimates for HMMs and codebooks • More accurate estimates

Duration modeling for speech recognition

Duration modeling for speech recognition

Presentation Transcript

Speech Recognition

Speech Recognition

Using Speech Recognition for Speech Therapy

Speech Recognition

Speech recognition

Relevance Language Modeling For Speech Recognition

Combining Speech Attributes for Speech Recognition

Speech Recognition

Acoustic Modeling of Accented English Speech for Large-Vocabulary Speech Recognition

Speech Recognition

DTW for Speech Recognition

Speech Recognition

Problems of Modeling Phone Deletion in Conversational Speech for Speech Recognition

Speech Recognition

Speech Recognition

SPEECH RECOGNITION:

Speech Recognition

Speech Recognition

Speech Recognition

Language Modeling for Speech Recognition

Acoustic Modeling for Speech Recognition

Speech Recognition for Dummies