digilib@itb.ac.id +62 812 2508 8800

Abstrak
PUBLIC karya

Abstract
PUBLIC karya

Tujuan pengolahan bahasa alami adalah melakukan transformasi informasi dari bentuk kompleks menjadi lebih ringkas, mudah dipahami dan dapat pula dijadikan referensi analisis pada beberapa domain tertentu salah satunya adalah domain kesehatan. Informasi yang biasanya dimanfaatkan pada domain kesehatan adalah informasi tentang kausalitas atau sebab – akibat yaitu pengetahuan yang dibangun berdasarkan fakta-fakta khusus yang memiliki makna dan disimpulkan menjadi fakta-fakta umum yang memiliki makna , dan antara kedua makna tersebut memiliki hubungan yang saling menjelaskan. Jika diformulasikan hubungan sebab – akibat menjadi sebuah fungsi , untuk adalah makna , dan adalah makna , maka terlihat seperti berikut . Permasalahannya adalah tidak semua makna dan makna dijelaskan pada kalimat sederhana atau single sentences, tetapi terdapat juga kemungkinan makna dan makna dijelaskan pada kalimat kompleks atau multiple sentences yang posisinya dapat berada di awal kalimat atau di akhir dari sebuah kalimat. Selain itu, makna dan makna juga tidak selalu diabstraksikan secara eksplisit melainkan implisit. Penelitian ini memiliki tujuan menghasilkan metode template semantik, yaitu metode untuk melakukan identifikasi makna dan makna pada kalimat sederhana dan juga pada kalimat kompleks. Metode template semantik yang dikembangkan saat ini lebih difokuskan pada penggunaan template untuk melakukan identifikasi hubungan sebab – akibat yang tidak tergantung pada pembahasan topik yang khusus, melainkan bersifat terbuka untuk beragam pembahasan teks. Usulan yang terdapat pada template semantik yaitu mempertimbangkan , , , , dan penggunaan itu sendiri. Dataset yang digunakan ketika melakukan pelatihan dan pengujian berasal dari kumpulan contoh kalimat hubungan sebab – akibat pada publikasi penelitian lainnya dan berasal dari artikel media online sebanyak 1,017 kalimat. Pengujian kinerja sistem identifikasi dibedakan menjadi dua kategori evaluasi yaitu ekstrinsik dan pengujian intrinsik. Hasil evaluasi kinerja dari metode template semantik pada pengujian karakteristik teks single sentences yaitu 0,874; 0,747 dan 0,803, sedangkan pada pengujian karakteristik teks multiple sentences yaitu 0,877; 0,815 dan 0,845 untuk recall, precision dan f-measure sedangkan rata-rata error sebesar 0,280. Hasil evaluasi untuk kualitas informasi accuracy sebesar 0,719, sedangkan precision sebesar 0,781 dan hasil untuk completeness adalah 0,953. Metode template semantik yang dihasilkan telah berhasil diimplementasikan pada domain kesehatan yaitu sistem surveilans kesehatan masyarakat. Pada saat implementasi terdapat beberapa usulan yang dihasilkan yaitu transformasi bahasa alami ke anotasi elemen medis (LPpAJSFPePnGOD) untuk identifikasi pola hubungan sebab – akibat, pola anotasi paragraf untuk klasifikasi posisi kalimat pada paragraf artikel medis dan membangun pola keterhubungan semantic relationship untuk anotasi semantik.