Measure Comparison Distance on K-Means Clustering For Grouping Music on Mood
Abstract
Dalam bidang information retrieval , MIR (Music Informatiion Retrieval)merupakan bagian bidang keilmuan yang berhubungan dengan pencarian informasi dalam media berupa musik dengan penerapan algoritma data mining untuk penglompokan /clustering data music.
Penelitian ini diawali dengan tahap pra-pengolahan data yaitu mendapatkan nilai fitur pada music dengan feature extraction. Tahapan feature extraction terdiri dari tiga proses, yaitu pengambilan sampel lagu (bagian refrain), penrapan fast fourier transform, dan penerapan spectral feature yang menjaadi atribut dasar untuk dilakukannya pengelompokkan music terhadap suasana hati.
Proses clustering/pengelompokkan K-Means ini menggunakan 200 file musik ke dalam 4 jenis suasana hati model Thayer. Dalam proses pengelompokkan ini dilakukan perhitungan jarak swtiap cluster mengunakan distance measure yang terdiri dari euclidiean distance, city block distance, dan cosine distance. Selanjutnya dihitung nilai silhouette coefficient pada K-Means yang menunjukkan seberapa baik dan optimal suatu objek ditempatkan dalam suatu cluster. Akhirnya dari ketiga nilai distance measure Ini diperoleh nilai silhouette coefficient tertinggi yaitu 0,64018 dengan waktu pemrosesan tercepat yaitu 0,0789935 pada Euclidean distance