digilib@itb.ac.id +62 812 2508 8800

Pada tugas akhir ini, dilakukan penelitian penggunaan Support Vector Machines untuk mengidentifikasi delapan dialek dalam ucapan bahasa Indonesia. Kedelapan dialek itu dipilih berdasarkan penelitian sebelumnya, yakni dialek Aceh, Bali, Batak, Betawi, Jawa, Minangkabau, Sulawesi, dan Sunda. Data suara berasal dari pembicara yang sedang tinggal di Bandung. Dengan kata lain, dialek yang terdengar ada kemungkinan tidak terlalu jelas lagi karena telah terpengaruh lingkungan. Data suara kemudian disegmentasi, masing-masing menjadi 4 detik. Selanjutnya, dilakukan ekstraksi fitur MFCC, spectral flux, dan spectral centroid. Data berformat ARFF tersebut ditambahkan atribut dialek sebagai label dialek masing-masing. Eksperimen dan pengujian dilakukan dengan teknik all-at-once dan one-against-one. Fungsi kernel yang dipakai adalah linear kernel. Hasil rata-rata tertinggi adalah menggunakan teknik one-against-one dan dengan fitur MFCC, spectral flux, dan spectral centroid, yakni 55%. Sementara dengan fitur MFCC saja, hasilnya lebih rendah, yakni 53,5%. Dengan demikian, penggunaaan ketiga fitur tersebut lebih baik dibandingkan dengan MFCC saja.