Perpustakaan Digital - Digilib ITB

SEMANTIC TEXTUAL SIMILARITY (STS) UNTUK KALIMAT BAHASA INDONESIA MENGGUNAKAN SIAMESE NEURAL NETWORK

271 views

Save At List

Penulis	:	Agung Baptiso Sorlawan [13513043]
Kontributor / Dosen Pembimbing	:	Dr.techn. Saiful Akbar, S.T., M.T. Dr.techn. Muhammad Zuhri Catur Candra, S.T., M.T.
Jenis Koleksi	:	Tugas Akhir
Tahun Terbit	:
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	Semantic Textual Similarity, Siamese Neural Network, encoder, pooling, objective function
Sumber	:
Staf Input/Edit	:	karya
File	:	5 file
Tanggal Input	:	15 Mar 2021

Cover

PUBLIC Open In Flipbook karya

Abstrak

PUBLIC Open In Flipbook karya

Abstract

PUBLIC Open In Flipbook karya

Lembar Pengesahan
Terbatas karya
» ITB

Tugas Akhir
Terbatas karya
» ITB

Semantic Textual Similarity (STS) adalah sebuah task dalam pemrosesan bahasa alami yang digunakan untuk menentukan apakah dua kalimat memiliki makna yang sama. STS merupakan komponen yang penting dalam membantu menyelesaikan masalahmasalah pemrosesan bahasa alamai yang lain seperti semantic search, summarization, question answering, deteksi plagiarisme dan ekstraksi informasi. Salah satu arsitektur yang menjadi fokus tugas akhir ini yang dapat digunakan untuk menyelesaikan task STS adalah Siamese Neural Network (SNN). Salah satu komponen penting dalam model STS adalah encoder. Encoder berfungsi mengubah kalimat menjadi vektor numerik. Pada tugas akhir ini dilakukan eksperimen terhadap beberapa jenis encoder yang digunakan oleh SNN. Selain itu, dilakukan pula eksperimen pada komponenkomponen lain dari SNN yakni pooling dan objective function. Eksperimen dilakukan menggunakan dataset yang diperoleh dari Prosa.ai yang berisi kumpulan kalimat frequently asked questions (FAQ). Dari hasil eksperimen, diperoleh model STS terbaik dengan f1score 0,9723 yang mengungguli kinerja model baseline. Model tersebut adalah SNN dengan encoder IndoBERT, pooling MEAN + CLS dan regression objective function.

Perpustakaan Digital ITB

SEMANTIC TEXTUAL SIMILARITY (STS) UNTUK KALIMAT BAHASA INDONESIA MENGGUNAKAN SIAMESE NEURAL NETWORK

Artikel Terkait

Daftar Simpan Judul

SEMANTIC TEXTUAL SIMILARITY (STS) UNTUK KALIMAT BAHASA INDONESIA MENGGUNAKAN SIAMESE NEURAL NETWORK

Artikel Terkait