digilib@itb.ac.id +62 812 2508 8800

13519107 Daffa Ananda Pratama Resyaly.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Tugas akhir ini bertujuan untuk mengembangkan sistem pemahaman dokumen formal, yaitu BPKB, dan teks tulisan tangan menggunakan teknik optical character recognition (OCR). Sistem ini membutuhkan koneksi internet pada tahap pengenalan dokumen. Proses dalam sistem melibatkan tiga tahapan utama, yaitu pendeteksian teks, pengenalan teks, dan pengenalan entitas bernama. Pada tahap pendeteksian teks, sistem menggunakan algoritma pendeteksian teks untuk mengidentifikasi area di dokumen formal yang berpotensi mengandung teks. Kemudian, pada tahap pengenalan teks, algoritma OCR diterapkan untuk mengenali teks dalam setiap area yang terdeteksi sebelumnya. Selanjutnya, dalam tahap pengenalan entitas bernama, sistem menerapkan algoritma pemrosesan bahasa alami (Natural Language Processing) untuk mengenali entitas tertentu, seperti nama pemilik pada dokumen formal. Pengujian dilakukan menggunakan berbagai dokumen formal dengan variasi kualitas gambar, dan hasil pengujian menunjukkan tingkat akurasi dan waktu inferensi yang rasional. Dengan adanya sistem ini, diharapkan proses pemahaman dan ekstraksi informasi dari dokumen formal menjadi lebih efisien dan akurat. Sistem ini dapat digunakan dalam proses otomatisasi dan digitalisasi dokumen formal, meningkatkan aksesibilitas informasi, dan mengurangi kesalahan manusia dalam pemrosesan data.