JudulKLASIFIKASI BERITA PALSU POLITIK BERBAHASA INDONESIA MENGGUNAKAN RANDOM FOREST BERBASIS INDOBERT EMBEDDING |
Nama: DANIEL IRWANSYAH |
Tahun: 2025 |
Abstrak ABSTRAK Daniel Irwansyah, Klasifikasi Berita Palsu Politik Berbahasa Indonesia Menggunakan Random Forest Berbasis IndoBERT Embedding Dibimbing oleh :Dr. Anita Ahmad Kasim, S.Kom., M.Cs. Penelitian ini bertujuan untuk mengklasifikasikan berita palsu bertopik politik berbahasa Indonesia dengan menggabungkan algoritma Random Forest dan teknik ekstraksi fitur IndoBERT embedding. Latar belakang penelitian adalah tingginya penyebaran berita hoaks politik di Indonesia yang berdampak pada opini publik dan stabilitas demokrasi. Penelitian ini menggunakan pendekatan kuantitatif dengan data sebanyak 2.262 berita dari portal terpercaya (Kompas, CNN Indonesia, Detik) dan TurnBackHoax.id. Teks berita diolah melalui tahapan pra-pemrosesan dan diekstraksi menggunakan IndoBERT menjadi vektor berdimensi 768. Model Random Forest dibangun dalam dua versi: baseline (tanpa tuning) dan model hasil tuning menggunakan GridSearchCV dengan validasi silang. Hasil penelitian menunjukkan bahwa model baseline mencapai akurasi 91,33?n F1-score 0,9123, sedangkan model hasil tuning meningkat menjadi akurasi 92,72%, F1-score 0,9252, dan AUC-ROC 0,9753. Model juga menunjukkan tingkat keyakinan tinggi berdasarkan distribusi probabilitas prediksi. Kombinasi IndoBERT dan Random Forest terbukti efektif dan stabil dalam mengklasifikasikan berita palsu politik secara otomatis. Kata Kunci: Berita Palsu, Random Forest, IndoBERT, Klasifikasi, Politik. |