Vtuber adalah salah satu pembuat konten (content creator) pada media sosial selain youtuber maupun streamer. Berbeda dengan youtuber maupun streamer, vtuber merupakan pembuat konten yang menggunakan karakter visual (avatar) bergaya anime sebagai representasi diri. Di antara para vtuber dan viewer terbentuk sebuah relasi bersifat virtual, yang viewer berhadapan secara virtual dengan avatar tersebut. Dalam merepresentasikan dirinya sebagai avatar, vtuber juga berperan sebagai karakter avatar-nya. Dengan kata lain, ia juga harus meyakinkan viewer melalui kemampuannya dalam memainkan avatar nya. Kapasitas dan kemampuan ini yang disebut sebagai modalitas, baik modalitas bahasa, visual, maupun gestural. Penggunaan modalitas merupakan bagian dari cara kerja wacana, yaitu peristiwa penggunaan bahasa, tanda dan simbol di dalam konteks komunikasi, yang berpengaruh pada pembentukan makna. Objek penelitian ini adalah siaran streaming HoloId Cup 2022 yang diselenggarakan oleh vtuber Hololive Indonesia. Tujuan penelitian ini adalah untuk mengetahui makna sosial budaya dari elemen- elemen visual dan bahasa yang membangun siaran streaming vtuber tersebut. Dalam metode analisis wacana terhadap siaran streaming vtuber, terdapat tiga langkah analisis elemen-elemen wacana, baik elemen bahasa maupun visual, yaitu deskripsi, relasi, dan interpretasi. Dalam menginterpretasikan elemen bahasa, penelitian ini menggunakan teori tindak tutur (speech acts). Kemudian, dalam menginterpretasikan elemen visual, penelitian ini menggunakan teori representasi metonimi maupun metafora. Dari hasil interpretasi elemen bahasa dan visual, akan dianalisis lebih lanjut bagaimana peran modalitas bahasa maupun visual dalam menyampaikan pesan atau merepresentasikan bentuk visual. Selanjutnya, bagaimana peran multimodalitas dari siaran streaming vtuber dalam merepresentasikan ideologi budaya lokal sebagai konteks yang melatari wacana. Elemen visual adalah pilihan gambar yang digunakan, yaitu visualisasi avatar, properti yang ditampilkan; dan simbol-simbol lainnya. Sementara, elemen verbal adalah pilihan kata (lexical) yang digunakan melalui tuturan atau teks partisipan dalam wacana. Dari hasil analisis, peneliti menghasilkan beberapa temuan riset. Pertama, elemen bahasa yang digunakan oleh beberapa partisipan adalah bahasa Indonesia yang merupakan bagian dari kebudayaan lokal Indonesia, sementara beberapa bahasa lainnya merupakan campuran dari bahasa Jepang dan Inggris. Kemudian, elemen visual yang ditampilkan pada siaran adalah properti berupa gerbang, bangunan, dan arena lomba, aksesori avatar yang digunakan vtuber, serta tipografi. Setiap elemen visual yang ditampilkan adalah representasi dari wujud asal properti-properti tersebut, baik dalam bentuk metaforik maupun metonimik. Kedua, HoloId Cup memiliki modalitas bahasa yang tinggi dalam menyampaikan pesan, hal ini karena seluruh partisipan menggunakan ekspresi bahasa tindak tutur yang sesuai dengan konteks yang terjadi. Tindak tutur yang digunakan oleh partisipan siaran streaming adalah pemberian informasi, pemberian penilaian kepada orang lain, dukungan atau suruhan, dan penyampaian emosi diri. Kemudian, modalitas visual yang tinggi dalam merepresentasikan bentuk visual asalnya. Pilihan-pilihan gambar yang digunakan merupakan representasi metonimik dari kebudayaan Jawa berupa aksesoris, Minangkabau berupa rumah adat, dan Bali berupa arsitektur adat. Selain itu, pilihan gambar juga merepresentasikan secara metonimik maupun metaforik berbagai lomba sebagai tradisi budaya di Indonesia, yaitu kolam ikan sebagai metafora lomba menangkap lele atau belut, kue sebagai metafora dari lomba makan kerupuk, melompat sebagai metonimi lomba balap karung, pancingan sebagai metafora lomba tarik tambang, dan tiang sebagai metonimi dari lomba panjat pinang. Kemudian, modalitas yang sedang dalam merepresentasikan konteks asal kebudayaan lokal. Ukuran modalitas ini dihasilkan karena adanya konteks yang berubah atau menghilang sebagai konsekuensi dari pilihan teknik gambar yang tidak merepresentasikan secara utuh konteks asal dari kebudayaan lokal. Konteks yang hilang adalah konteks budaya dalam pernikahan, perjuangan tim, sejarah, kekuasaan, keagamaan dan kepercayaan. Sementara itu, konteks yang masih bertahan adalah semangat perjuangan, kerja sama tim, dan kekeluargaan. Kemudian, konteks yang ditambahkan adalah budaya perayaan, kemerdekaan, keberagaman, perjuangan individu, dan profanitas. Ketiga, siaran streaming vtuber memiliki multimodalitas yang sedang dalam merepresentasikan budaya lokal Indonesia, hal ini karena budaya lokal yang direpresentasikan mengalami perubahan konteks atau makna dalam wacana. Dengan demikian, budaya lokal yang direpresentasikan tidak menjadi utuh, meskipun HoloId Cup dapat merepresentasikan sebagian dari budaya lokal Indonesia, yaitu melalui visual.