Abstrak:
Social network merupakan pola-pola interaksi sosial yang terjadi antar individu di dalam komunitas tertentu. Untuk mengungkapkan social network yang terjadi di dalam suatu komunitas, maka diperlukan Social Network Extraction (SNE) dari sumber data tertentu, misalnya dokumen web. SNE dapat dilakukan dengan menggunakan pendekatan web mining dan prinsip co-occurrence nama individu pada dokumen web hasil pencarian search engine. Penentuan jenis relasi antar individu dapat diselesaikan melalui teknik Text Classification (TC). Social network tersebut kemudian dapat dianalisis strukturnya dengan menggunakan berbagai metode statistik yang disebut Social Network Analysis (SNA). Penerapan SNA terdapat dalam bidang pemasaran, medis, dan sosiologi. Tugas Akhir ini bertujuan untuk melakukan SNE dari dokumen web dengan bantuan search engine Google serta melakukan analisis terhadap social network yang diperoleh. Teknik SNE yang diimplementasikan menggunakan properti Google hit dan Google top, serta kombinasi keduanya. Pada Tugas Akhir ini juga dikaji teknik TC sebagai bagian dari proses SNE. Algoritma TC yang dikaji adalah Naive Bayes dan Support Vector Machine (SVM). Melalui Tugas Akhir ini diharapkan akan didapatkan teknik SNE dan teknik TC yang memberikan performansi maksimum. Dari hasil eksperimen yang dilakukan, disimpulkan bahwa teknik SNE yang memberikan performansi maksimum sebesar 69,59persen adalah teknik SNE yang menggunakan parameter Google top. Hal ini menunjukkan bahwa Google top lebih tepat dalam menentukan keberadaan relasi antara sepasang individu. Namun, akurasi yang didapatkan berbanding lurus dengan banyak dokumen dan relasi yang benar terdapat pada dokumen-dokumen awal hasil perankingan search engine. Selain itu, algoritma TC yang memberikan performansi maksimum sebesar 93.99persen adalah SVM. SVM juga lebih tangguh daripada Naive Bayes dari segi feature selection. Walaupun demikian perbedaan performansi SVM dan Naive Bayes tidak signifikan.