1 Bab I Pendahuluan I.1 Latar Belakang Fonetika merupakan tinjauan dari fonologi (studi tentang bunyi) yang didasarkan pada analisa terbentuknya bunyi. Salah satu kajian fonetika adalah fonetik akustik pada sifat fisis seperti amplitudo, frekuensi dan resonansi gelombang suara (Siti Mulyani, 2008). Maka dapat disimpulkan, jika fonetika dapat dianalisa menggunakan konsep fisika pada kajian fonetik akustik. Lebih detail, konsep fisika pada fonetik akustik berhubungan dengan bentuk vocal tract (saluran vokal) saat proses produksi suara yang dapat dianalogikan sebagai tabung akustik tertutup dari konsep gelombang (Lapoliwa, 1988). Beberapa parameter fonetik akustik adalah frekuensi dasar (pitch) dan frekuensi resonansi (forman). Pada saat pita suara bergetar, terbentuklah gelombang suara yang memiliki frekuensi dasar (pitch) akibat pembukaan dan penutupan pita suara, yang selanjutnya diteruskan ke faring, rongga mulut, dan hidung bersama – sama menyebabkan adanya resonansi frekuensi (forman) dan membentuk bunyi/suara yang dapat diidentifikasi (Surahman, 2021). Analisa fonetik akustik memiliki keberagaman manfaat. Seiring perkembangan teknologi, analisa fonetik akustik dapat dimanfaatkan pada bidang forensik digital yaitu melalui teknologi Voice Recognition (pengenal suara) - teknik forensik digital untuk mendeteksi rekaman suara dari pelaku kriminal yang belum terdeteksi identitasnya. Pelaku yang memiliki rekaman percakapan tanpa diketahui identitas dianalisa melalui pemeriksaan forensik audio untuk mengenali ucapan dengan metode perbandingan, yaitu, membandingkan suara-suara barang bukti rekaman (sampel tidak diketahui identitas) dengan sampel suara suspect (sampel yang diketahui identitas). Jika hasil voice recognition suara menunjukkan bahwa suara sampel yang tidak diketahui identitasnya identik dengan sampel suara yang diketahui identitasnya, maka rekaman suara yang dijadikan bukti untuk suspect dianggap valid, begitu juga sebaliknya (Septiyansyah, 2015). 2 Manfaat lain adalah adanya teknologi Speech Recognition (pengenal ucapan) sebagai pengenalan pengucapan tunawicara berdasarkan analisa fonetik akustik melalui automatic speech recognition (ASR). Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami huruf- huruf yang diucapkan dengan cara digitalisasi huruf dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Huruf-huruf yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka atau huruf yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasi huruf-huruf tersebut. Hasil dari identifikasi huruf yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah perintah untuk melakukan suatu pekerjaan (Angga Kurniawan, 2017). Dapat disimpulkan, jika frekuensi dasar dan frekuensi forman dapat dimanfaatkan pada beberapa bidang termasuk analisa forensik digital. Diperlukan pemetaan secara akustik baik berdasarkan frekuensi dasar (F0) dan frekuensi forman (F1, F2, F3 dan F4), agar masing – masing huruf pada pengenal ucapan dan pengenal suara dapat diidentifikasi. Pemetaan tersebut berupa nilai angka matematis dari subyek yang memiliki bahasa yang sama agar terjadi keseragaman. Hal ini dimaksudkan agar recognition rate yang dihasilkan oleh digitalisasi suara menjadi akurat dengan presisi tinggi. Pemetaan fonetik akustik yang dapat dilakukan adalah melalui pemetaan vokal bunyi. Hal ini disebabkan karena frekuensi dasar dan frekuensi forman dari huruf vokal relatif konstan karena posisi artikulator yang mudah dilakukan (Joe Wolfe, 2023). Namun, pada faktanya belum ada penelitian yang memetakan secara akustik nilai frekuensi dasar dan forman secara lengkap di Indonesia. Beberapa penelitian hanya terbatas pada pengucapan 5 atau 6 fonem vokal saja /a/, /i/, /u/, /e/, /ə/, dan /o/ (Chaer, 2007). Karena pada faktanya, terdapat 10 alofon (cara pelafalan bunyi) dari fonem vokal yang selama ini diketahui [i], [I], [e], [ɛ], [a], [ə], [ɔ], [o], [U], dan [u] (Marsono, 1999). Sehingga, memetakan vokal hanya pada 5 – 6 fonem vokal belum cukup agar akurasi data yang didapat lebih tinggi. 3 Pentingnya analisa vokal berdasarkan tinjauan alofon adalah karena masing – masing dari fonem memiliki variasi posisi dalam kata (depan – tengah – belakang) yang terdistribusi dalam suku kata tertutup dan terbuka (Lafamane, 2020), di mana variasi posisi tersebut berpengaruh pada nilai frekuensi yang dihasilkan (Ketut dkk., 2017). Misalnya, fonem segmen /i/ pada kata /ing/ berada pada frekuensi F1 589 Hz, F2 2268 Hz, F3 2769 Hz. Sementara, pada kata /mami/, segmen /i/ pada silabel /mi/ memiliki frekuensi F1 419Hz , F2 1681 Hz, F3 2770 Hz (Ketut dkk., 2017). Dalam tinjauan penggunaan berbagai bahasa daerah di Negara Indonesia, bahasa lokal dan formal menggunakan 10 alofon yang telah disebutkan. Dengan total 269.603.400 juta jiwa penduduk, Indonesia memiliki 742 macam bahasa suku di mana 737 bahasa yang masih digunakan aktif oleh penuturnya (Lewis dan Gary, 2013). Bahasa resmi yang digunakan adalah Bahasa Indonesia, sedangkan pengguna bahasa daerah terbanyak adalah adalah Bahasa Jawa dengan total penutur aktif sebanyak 68.8 juta (Lewis dan Gary, 2013). Diperlukan subyek penelitian dengan minim mobilisasi, agar pemetaan frekuensi yang didapat minim interfensi dari bahasa daerah luar, agar tidak memiliki keberagaman dialektika (Ulfah, 2019). Semakin minim mobilitas penduduk, maka kecenderungan pada interfensi bahasa karena faktor eksternal akan semakin sedikit. Dalam kata lain, wilayah tersebut merupakan wilayah yang memiliki akurasi pemetaan akustik fonetik dalam berbahasa. Salah satu wilayah yang memiliki kriteria tersebut adalah wilayah Pati dengan penduduk berbahasa Jawa. Pati merupakan daerah dengan mobilitas penduduk yang rendah.