digilib@itb.ac.id +62 812 2508 8800

Transfer learning adalah metode dalam pembelajaran mesin untuk menggunakan pengetahuan yang sebelumnya didapat dari suatu task dan mengaplikasikannya pada task yang lain. Kinerja sistem named-entity recognition bahasa Indonesia saat ini belum cukup memuaskan. Sedangkan sistem part-of-speech tagging bahasa Indonesia sudah mendapat hasil yang cukup baik dengan skor F-1 92.62% pada korpus UD v1.3. Tugas Akhir ini menginvestigasi pengaruh dari transfer learning untuk pembuatan sistem NER bahasa Indonesia menggunakan transfer representasi fitur model POS tagging bahasa Indonesia. Model yang dibangun berupa model pelabelan sekuensial dengan Bidirectional GRU-CRF. Model dapat dibagi menjadi dua komponen, komponen ekstraksi fitur dan komponen pelabelan. Komponen ekstraksi fitur menggabungkan hasil ekstraksi fitur dua level data yang berbeda, level karakter dan level kata. Transfer learning yang dilakukan memanfaatkan komponen ekstraksi fitur ini untuk melakukan transfer representasi fitur. Pada Tugas Akhir ini, didapatkan model POS tagger terbaik dengan F-1 92.1% berdasarkan korpus UD v2 dan dilakukan transfer untuk pembangunan model NER tagger. Terdapat peningkatan F-1 sebesar 0.02 saat 100% data latih dipakai seluruhnya, sedangkan dalam kondisi data latih yang sedikit, peningkatan F-1 dengan menggunakan transfer learning dapat mencapai angka 0.15 untuk 1% data latih.