Judul berita online sering dibuat agar menarik untuk dibaca tetapi tidak merepresentasikan isi informasi berita
sebenarnya. Ringkasan artikel berita dapat membantu pembaca untuk mendapatkan isi informasi dari berita
tersebut secara efektif dan efisien. Pada penelitian ini sistem peringkasan teks otomatis menggunakan Support
Vector Machine (SVM) classifier untuk memilih kalimat yang dianggap paling relevan untuk dimasukan
kedalam ringkasan, dan disusun sebagai ringkasan ekstraktif. Fitur-fitur kalimat yang digunakan dalam proses
pembelajaran classifier adalah panjang kalimat, posisi kalimat, adanya data numerik, kata-kata thematic,
similaritas kalimat dengan judul, centroid kalimat, lexical bound dengan kalimat sebelum dan sesudahnya.
Karena persoalan data positif dan negatif yang tidak seimbang mempengaruhi pembentukan model klasifikasi,
distribusi kalimat positif dan kalimat negatif perlu diseimbangkan dengan menggunakan undersampling. Kinerja
terbaik diberikan oleh model yang dikembangkan dengan balancing data positif dengan akurasi pengujian
sebesar 78.94%.
Perpustakaan Digital ITB