digilib@itb.ac.id +62 812 2508 8800

Judul berita online sering dibuat agar menarik untuk dibaca tetapi tidak merepresentasikan isi informasi berita sebenarnya. Ringkasan artikel berita dapat membantu pembaca untuk mendapatkan isi informasi dari berita tersebut secara efektif dan efisien. Pada penelitian ini sistem peringkasan teks otomatis menggunakan Support Vector Machine (SVM) classifier untuk memilih kalimat yang dianggap paling relevan untuk dimasukan kedalam ringkasan, dan disusun sebagai ringkasan ekstraktif. Fitur-fitur kalimat yang digunakan dalam proses pembelajaran classifier adalah panjang kalimat, posisi kalimat, adanya data numerik, kata-kata thematic, similaritas kalimat dengan judul, centroid kalimat, lexical bound dengan kalimat sebelum dan sesudahnya. Karena persoalan data positif dan negatif yang tidak seimbang mempengaruhi pembentukan model klasifikasi, distribusi kalimat positif dan kalimat negatif perlu diseimbangkan dengan menggunakan undersampling. Kinerja terbaik diberikan oleh model yang dikembangkan dengan balancing data positif dengan akurasi pengujian sebesar 78.94%.