digilib@itb.ac.id +62 812 2508 8800

Dokumen Asli
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Large Languange Model (LLM) telah menunjukkan kinerja yang baik dalam melakukan tugas – tugas pada pemrosesan bahasa alami, termasuk penyelasaian soal matematika. Namun, model – model LLM yang populer saat ini seperti GPT, Llama, Claude, Gemini, bahkan Deepseek seringkali memberikan hasil yang tidak sesuai dengan proses logika matematika. Hal tersebut disebabkan oleh kesalahan dalam penafsiran dan logika matematika yang tidak tepat dalam menjawab soal matematika. Tugas akhir ini bertujuan untuk menganalisis jenis dan penyebab miskonsepsi dalam jawaban yang dihasilkan LLM terhadap soal – soal matematika. Hasil evaluasi yang dihasilkan dari beragam eksperimen terhadap model LLM dilakukan berdasarkan dataset yang mencakup berbagai tingkat kesulitan dan domain matematika tertentu. Selain itu, tugas akhir ini menyelidiki faktor – faktor yang menyebabkan terjadi miskonsepsi, seperti ambiguitas terhadap soal, keterbatasan data pelatihan, dan kekurangan dalam penalaran model. Hasil dari tugas akhir ini diharapkan dapat memberikan wawasan mengenai kelebihan dan kelemahan LLM dalam penalaaran matematika serta berkontribusi pada pengembangan model yang lebih andal dalam menangani pertanyaan matematika.