UNF Faculty Research and Scholarship

Using wavelets and Gaussian Mixture Models for audio classification

Ching Hua Chuan, University of North Florida
Susan Vasana, University of North Florida
Asai Asaithambi, University of North FloridaFollow

Document Type

Conference Proceeding

Publication Date

12-1-2012

Subject Area

ARRAY(0x55b0ef5492c0)

Abstract

In this paper, we present an audio classification system using wavelets for extracting low-level acoustic features. We perform multiple-level decomposition using Discrete Wavelet Transform to extract acoustic features at different scales and time from audio recordings. The extracted features are then translated into a compact vector representation. Gaussian Mixture Models with Expectation Maximization algorithm are then used to build models for sound classes. Specifically, three types of audio classification tasks are designed to evaluate the system, including speech/music classification, male/female speech classification, and music genre (classical, pop, jazz, and electronic) classification. By evaluating the system through 5-fold cross validation, the experimental result shows the promising capability of wavelets for speech and music analyses. © 2012 IEEE.

Publication Title

Proceedings - 2012 IEEE International Symposium on Multimedia, ISM 2012

First Page

421

Last Page

426

Digital Object Identifier (DOI)

10.1109/ISM.2012.86

ISBN

9780769548753

Citation Information

Ching-Hua Chuan, Vasana, S., & Asaithambi, A. (2012). Using Wavelets and Gaussian Mixture Models for Audio Classification. 2012 IEEE International Symposium on Multimedia, 421–426. https://doi.org/10.1109/ISM.2012.86

Link to Full Text

COinS

UNF Faculty Research and Scholarship

Using wavelets and Gaussian Mixture Models for audio classification

Document Type

Publication Date

Subject Area

Abstract

Publication Title

First Page

Last Page

Digital Object Identifier (DOI)

ISBN

Citation Information

Search

Links

Browse

Author Corner

UNF Faculty Research and Scholarship

Using wavelets and Gaussian Mixture Models for audio classification

Authors

Document Type

Publication Date

Subject Area

Abstract

Publication Title

First Page

Last Page

Digital Object Identifier (DOI)

ISBN

Citation Information

Share

Search

Links

Browse

Author Corner