digilib@itb.ac.id +62 812 2508 8800

13519105 Widya Anugrah Putra.pdf
Terbatas  Dessy Rondang Monaomi
» Gedung UPT Perpustakaan

Pekerjaan sebelumnya yang dilakukan oleh Adyatma (2022) berhasil membuat se- buah library untuk melakukan operasi join pada basis data Cassandra. Namun, terdapat beberapa permasalahan yang masih dialami, misalnya library masih me- lakukan operasi di dalam satu mesin saja. Selain itu, operasi yang bisa dilakukan hanyalah operasi join saja, padahal biasanya operasi join dilakukan dengan operasi lain, misalnya operasi selection. Untuk menyelesaikan permasalahan-permasalahan ini, perlu dilakukan analisis ten- tang bagaimana cara Cassandra mengkomunikasikan keadaan mesin-mesin dalam cluster-nya, bagaimana cara Cassandra menyimpan data di lingkungan terdistribusi, dan bagaimana cara Cassandra mengambil data di lingkungan terdistribusi. Setelah dianalisis, pengambilan data dari Cassandra dapat diperbaiki dengan memanfaat- kan token ranges yang ada di Cassandra. Selanjutnya dilakukan analisis terhadap beberapa alternatif solusi dalam pemilihan mesin yang melakukan pengerjaan. Di- antaranya adalah menggunakan mesin khusus, menggunakan load balancer, dan menggunakan banyak mesin pekerja. Agar lebih efektif, dipilih alternatif solusi yang terakhir. Selanjutnya solusi-solusi yang dipilih diimplementasikan ke dalam bentuk library. Setelah dilakukan pengujian, didapati bahwa library yang dikembangkan memiliki fungsional yang tepat serta memiliki kinerja yang lebih baik daripada library hasil pekerjaan Adyatma (2022). Dibandingkan dengan library Spark Cassandra Con- nector milik Datastax, library yang dikembangkan lebih baik kinerjanya di dataset ukuran kecil dan menengah, tetapi lebih buruk di dataset ukuran besar. Hal ini terja- di karena penggunaan memori masih belum dioptimasi, sehingga ketika menangani dataset ukuran besar, overhead yang dialami library menjadi jauh lebih signifikan.