Perpustakaan Digital - Digilib ITB

TRANSFER SENTIMEN KALIMAT MENGGUNAKAN REINFORCEMENT LEARNING WITH HUMAN FEEDBACK

136 views

Penulis	:	Adzka Ahmadetya Zaidan [13520127]
Kontributor / Dosen Pembimbing	:	Dr. Masayu Leylia Khodra, S.T, M.T.
Jenis Koleksi	:	Tugas Akhir
Penerbit	:	Teknik Informatika
Fakultas	:	Sekolah Teknik Elektro dan Informatika
Subjek	:
Kata Kunci	:	transfer sentimen, fine-tuning, RLHF
Sumber	:
Staf Input/Edit	:	Dessy Rondang Monaomi
File	:	2 file
Tanggal Input	:	19 Agu 2024

Dokumen Asli
Terbatas Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Penelitian ini bertujuan untuk mengatasi keterbatasan kualitas pembangkitan teks Bahasa Indonesia dengan mengadaptasi metode reinforcement learning with human feedback (RLHF). Tugas yang dilakukan pada penelitian ini adalah menggunakan model pralatih untuk mengubah sentimen kalimat masukan positif menjadi sentimen negatif dan sebaliknya serta penggunaan reward model. Dengan menggunakan metode RLHF yang dikenal efektif, penelitian ini bertujuan untuk meningkatkan kualitas pembangkitan teks dengan gaya berupa transfer sentimen. Proses RLHF pada penelitian ini mencakup proses fine-tuning, reward training yang menggunakan human feedback, dan PPO training. Hasil evaluasi pada penelitian menunjukkan model pralatih dapat melakukan transfer sentimen positif ke negatif dan sebaliknya setelah di-fine-tuning. Setelah melalui proses RLHF lebih lanjut, hasil teks yang dibangkitkan dari model tersebut lebih dipilih atau disukai oleh manusia dibandingkan model yang hanya melakukan fine-tuning.

Perpustakaan Digital ITB

TRANSFER SENTIMEN KALIMAT MENGGUNAKAN REINFORCEMENT LEARNING WITH HUMAN FEEDBACK

Artikel Terkait