Audio Segmentation, Classification, and Retrieval

Audio Segmentation, Classification,and Retrieval Princeton Sound Lab Prof. Perry Cook George Tzanetakis, PhD ‘02 (CMU) Ari Lazier, ‘03 Ge Wang, G3 Tom Briggs, G2

Roadmap • Framework • MARSYAS • Demos: • Smart Sound Editor • Musical Genre Classification • Content-based Query

Audio Framework • MARSYAS (Tzanetakis, Cook, Lazier) • Feature Extraction • Source Segmentation • Content-based Retrieval • Classification • General Approach / Not Domain-specific • Highly Extensible

Smart Sound Editor • Automatic Segmentation • Music • Speech • Male • Female • …

Music Genre Classifiction • Training set: Large corpus of music and speech • How good? • 90% speech vs. music • 67% correct forced decision on genre (same agreement as humans)

Content-based Query • Distance in Multi-Dimensional Feature-space • Navigate Feature-space • Nearest Neighbor / Similarity Retrieval

Audio Segmentation, Classification, and Retrieval

Audio Segmentation, Classification, and Retrieval

Presentation Transcript

Audio Information Retrieval and Audio Search

Audio Information Retrieval and Audio Search

Audio classification Discriminating speech, music and environmental audio

Vorlesung Video Retrieval Kapitel 6 – Audio Segmentation

3D Motion Classification Partial Image Retrieval and Download

Detection, segmentation and classification of heart sounds

Segmentation and Classification

3D Shape Analysis for Quantification, Classification and Retrieval

FYP0202 Advanced Audio Information Retrieval System

Statistical Techniques for Unsupervised Segmentation and Classification

3D Shape Analysis for Quantification, Classification and Retrieval

IFT6255: Information Retrieval Text classification

Audio Meets Image Retrieval Techniques

Audio Retrieval

Audio Retrieval

Segmentation and Classification of Hyperspectral Images

Speech and Language Technologies for Audio Indexing and Retrieval

Vorlesung Video Retrieval Kapitel 6 – Audio Segmentation

Bayesian Frameworks for Deformable Pattern Classification and Retrieval

3D Motion Classification Partial Image Retrieval and Download