Dampak deforestasi telah menyulitkan banyak satwa saling berkomunikasi satu sama lain. Komunikasi yang dibangun biasanya melalui kemampuan memancarkan sinyal akustik yang dapat dipahami sesama spesies. Aktivitas suara alam yang bersumber dari suara hewan (biofoni) tersebut dapat digunakan sebagai indikator perubahan lingkungan habitatnya. Oleh karena itu, perlu adanya pemantauan suara hewan untuk mengetahui keberadaan spesies tersebut apakah dapat beradaptasi pada relung yang baru atau bermigrasi ke relung yang masih alami. Hingga saat ini sisa hutan konservasi yang melindungi spesies burung di Pulau Sumatera hanya 5 juta ha. Pada penelitian ini dilakukan modeling klasifikasi terhadap data suara burung di Pulau Sumatera dengan metode Convolution Neural Network (CNN) melalui implementasi transfer learning pada deep neural network. Model transfer learning yang digunakan adalah ResNet50, DenseNet169, dan VGG19 yang diuji pada tiga optimisasi yaitu Adam, RMSProp, dan SGD. Hasil yang didapat bahwa VGG19 merupakan model terbaik dengan memperoleh akurasi sebesar 91 persen untuk fitur ekstraksi mels spectrogram pada learning rate 10-4, dropout sebesar 50 persen, batch size 32 dan optimisasi Adam. Pada fitur ekstraksi Mels Frequency Ceptral Coefficient (MFCC) hasil akurasi yang diperoleh adalah 84 persen pada learning rate 10-3, dropout sebesar 20 persen, batch size 16 dan optimisasi Adam. Nilai klasifikasi skor F1 yang diperoleh pada kedua fitur ekstraksi mencapai 0,91 dan 0,84.