Perpustakaan Digital ITB

Hasil Pencarian: 0

PENERAPAN SUPPORT VECTOR MACHINE UNTUK EKSTRAKSI INFORMASI DARI DOKUMEN TEKS

181 views

Penulis	:	PARAMITA (NIM 13504040)
Kontributor / Dosen Pembimbing	:	Pembimbing: Ir. Dwi Hendratmo Widyantoro, M.Sc., Ph.D.
Jenis Koleksi	:	Tugas Akhir
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	ekstraksi informasi, pembelajaran mesin, klasifikasi token, SVM uneven margin, Begin/End tagging, imbalanced dataset, dataset berbahasa campuran
Sumber	:
Staf Input/Edit	:	Vika Anastasya Kovariansi Ena Sukmana
File	:	7 file
Tanggal Input	:	09 Okt 2017

2008 TA PP PARAMITA 1-COVER.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP PARAMITA 1-BAB 1.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP PARAMITA 1-BAB 2.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP PARAMITA 1-BAB 3.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP PARAMITA 1-BAB 4.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP PARAMITA 1-BAB 5.pdf

PUBLIC Open In Flip Book Ena Sukmana

2008 TA PP PARAMITA 1-PUSTAKA.pdf

PUBLIC Open In Flip Book Ena Sukmana

Proses ekstraksi informasi (Information Extraction atau IE) adalah proses pengubahan dokumen teks tidak terstruktur dengan domain tertentu ke dalam sebuah struktur informasi yang relevan. Di dalam tugas akhir ini domain yang digunakan adalah lowongan pekerjaan. Kebanyakan iklan lowongan pekerjaan yang terdapat di berbagai website perusahaan maupun website khusus lowongan pekerjaan di Indonesia merupakan dokumen teks berbahasa campuran, Indonesia dan Inggris. Pada tugas akhir ini akan dikaji proses ekstraksi informasi pada dataset berbahasa campuran, dengan menerapkan teknik pembelajaran mesin. Pendekatan pembelajaran mesin yang digunakan adalah pendekatan statistik, dengan metode klasifikasi token. Algoritma klasifikasi yang digunakan adalah Support Vector Machine (SVM) dengan uneven margin, yang didesain khusus untuk imbalanced dataset. Sedangkan strategi tagging yang digunakan adalah strategi Begin/End (BE) tagging. Adapun eksperimen yang dilakukan mencakup analisis performansi SVM dengan uneven margin untuk ekstraksi informasi pada dataset berbahasa campuran, pengujian parameter pembelajaran terbaik, dan perbandingan dengan algoritma klasifikasi lain, yaitu Nave Bayes dan KNN. Hasil eksperimen menunjukkan bahwa performansi SVM dengan uneven margin untuk ekstraksi informasi pada dataset lowongan pekerjaan berbahasa campuran sangat baik, dengan akurasi mencapai 85%. Dengan demikian dapat disimpulkan bahwa sistem ekstraksi informasi yang diimplementasikan dapat diterapkan pada lingkungan bursa kerja di Indonesia. Selain itu, algoritma SVM dengan uneven margin juga memiliki performansi yang lebih unggul dibandingkan dengan kedua algoritma lainnya.