OLAP cube adalah struktur data multidimensi yang memungkinkan analisis data
secara cepat dan efisien. OLAP cube dibentuk dengan melakukan operasi agregasi
pada setiap hierarki dimensi yang digunakan. Pemodelan operator agregasi OLAP
cube merujuk pada proses mendefinisikan bagaimana data harus disimpulkan atau
digabungkan pada berbagai tingkat cube. Penelitian sebelumnya telah memodelkan
operator agregasi OLAP cube berbasis kolom dengan menggunakan MapReduce.
Operator agregasi tersebut memiliki kekurangan dalam waktu komputasi yang
lambat. Penelitian ini bertujuan untuk mengembangkan model operator agregasi
OLAP cube yang dapat memberikan waktu komputasi yang lebih cepat dalam
lingkungan NoSQL berbasis kolom.
Penelitian ini memfokuskan pada analisa penggunaan pendekatan RDD (Resilient
Distributed Dataset) dalam memodelkan operator agregasi OLAP cube NoSQL
berbasis kolom untuk mencapai efisiensi dan waktu komputasi yang lebih cepat.
Analisis ini melibatkan penyesuaian konsep dan arsitektur logik operator agregasi
OLAP cube dengan karakteristik dan kemampuan RDD. Model yang dihasilkan
diimplementasikan menggunakan bahasa pemrograman Python untuk keperluan
pengujian.
Pengujian dilakukan dengan membandingkan waktu eksekusi operator agregasi
RDD dengan operator agregasi yang MapReduce. Dari hasil pengujian yang
mencakup fungsionalitas dan kinerja, operator agregasi RDD terbukti memberikan
waktu komputasi yang lebih singkat dan dapat diaplikasikan dalam beragam basis
data NoSQL berbasis kolom.