Perpustakaan
DESKRIPSI DATA LENGKAP
JudulANALISIS SENTIMEN PEMILIHAN CAGUB DAN CAWAGUB DKI JAKARTA 2024 DENGAN PENDEKATAN SUPPORT VECTOR MECHINE
Nama: MARIANI
Tahun: 2025
Abstrak
ABSTRAK Pemilihan Gubernur DKI Jakarta 2024 menarik perhatian publik karena posisinya yang strategis sebagai ibu kota negara dan pusat ekonomi Indonesia. Opini publik terhadap calon Gubernur menjadi faktor penting dalam membentuk persepsi masyarakat, terutama melalui media sosial seperti platform X (Twitter). Tujuan dari pengamatan ini adalah untuk menganalisis sentimen publik terhadap calon Gubernur dengan menggunakan algoritma SVM (Support Vector Machine), dengan fokus khusus pada klasifikasi sentimen positif, negatif, dan netral. Tantangan dalam pengamatan ini meliputi volume data yang besar, keberagaman gaya bahasa, serta penggunaan bahasa informal di media sosial. Data dikumpulkan dengan menggunakan kata kunci yang relevan dan diproses melalui tahap prapemrosesan seperti pembersihan, tokenisasi, stemming, normalisasi, dan penghapusan stopword. Dengan menerapkan metode di atas, penelitian ini memastikan bahwa preprocessing tidak hanya berfokus pada teknik standar tetapi juga mempertimbangkan tantangan khusus dalam teks bahasa Indonesia. Hasil pengujian menunjukkan bahwa penggunaan kamus slang, deteksi kode campur, dan koreksi typo dapat meningkatkan kualitas data sebelum pelatihan model, yang berdampak positif terhadap akurasi analisis sentimen. Teknik TF-IDF digunakan untuk ekstraksi fitur dan konversi teks ke dalam representasi numerik. Model SVM dilatih menggunakan pembagian data 70:30. Pemilihan rasio 70:30 dalam penelitian ini didasarkan pada beberapa studi sebelumnya yang menunjukkan bahwa rasio ini dapat memberikan hasil yang cukup baik untuk dataset dengan ukuran terbatas. Namun, kami menyadari bahwa dalam dataset yang lebih besar, penggunaan rasio 80:10:10 dapat membantu menghindari overfitting dengan adanya validation set. Oleh karena itu, dalam penelitian lanjutan, kami akan mempertimbangkan pembagian yang lebih optimal sesuai dengan standar akademis yang umum digunakan. Akurasi yang didapatkan dalam penelitian ini sebesar 70%. Penelitian ini bertujuan untuk mengembangkan model klasifikasi sentimen menggunakan teknik pembelajaran mesin pada data yang tidak seimbang. Model yang diuji mencapai akurasi sebesar 70%, dengan metrik evaluasi lainnya menunjukkan hasil sebagai berikut: precision 75%, recall 60%, dan F1-score 66.67%. Meskipun akurasi model menunjukkan hasil yang cukup baik, metrik precision, recall, dan F1-score memberikan gambaran lebih mendalam mengenai performa model, terutama dalam menangani ketidakseimbangan antar kategori sentimen. Analisis lebih lanjut dengan menggunakan confusion matrix menunjukkan bahwa model lebih sering salah mengklasifikasikan sentimen negatif sebagai netral, yang mengindikasikan adanya bias dalam klasifikasi. Hasil ini menyoroti pentingnya penggunaan metrik evaluasi yang lebih komprehensif untuk menilai kualitas model secara lebih akurat, serta memberikan arahan untuk perbaikan model di masa depan dalam mengatasi masalah ketidakseimbangan data. Untuk pengembangan lebih lanjut, teknologi seperti deep learning dapat digunakan untuk meningkatkan pemahaman konteks dan kualitas analisis. Studi ini menegaskan pentingnya analisis sentimen dalam memahami opini publik serta kontribusi media sosial dalam membentuk pandangan terhadap pemilihan politik. Kata kunci : Sentimen Analysis, Media Sosial, Pilgub dki jakarta, Sentimen Analisis Target, Twitter.

Sign In to Perpus

Don't have an account? Sign Up