Perpustakaan
DESKRIPSI DATA LENGKAP
JudulANALISIS KOMPARATIF ALGORITMA ENSEMBLE LEARNING (RANDOM FOREST DAN XGBOOST) BERBASIS EKSTRAKSI FITUR SINTAKSIS UNTUK DETEKSI ANOMALI NOMOR PONSEL
Nama: ANDI FATURRAHMAN
Tahun: 2026
Abstrak
Kualitas basis data alumni merupakan aset krusial bagi institusi pendidikan dan pelatihan untuk menjamin kelancaran komunikasi dan validitas informasi. Namun, masalah anomali nomor ponsel akibat kesalahan input (human error) sering kali menurunkan integritas data. Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma Ensemble Learning, yaitu Random Forest dan XGBoost, dalam mendeteksi anomali nomor ponsel secara otomatis. Data yang digunakan dalam penelitian ini bersumber dari dataset alumni LKP GIMB Foundation. Penelitian ini menggunakan 11 fitur sintaksis yang mencakup dimensi struktural, validitas, dan pola keacakan melalui Shannon Entropy. Untuk mengatasi masalah ketidakseimbangan data antara kelas valid dan anomali, teknik Synthetic Minority Over-sampling Technique (SMOTE) diterapkan pada data pelatihan. Eksperimen dilakukan dalam dua skenario utama: Skenario 1 menggunakan fitur berbasis aturan (rule-based) dan Skenario 2 menggunakan fitur struktural yang lebih granular. Hasil menunjukkan bahwa XGBoost pada Skenario 2 memberikan performa paling optimal dengan Akurasi 99,90%, Precision 1,00, dan Recall 0,99. Selain unggul dalam metrik evaluasi, XGBoost terbukti efisien dengan waktu inference sebesar 0,0025 detik. Penelitian ini menyimpulkan bahwa kombinasi fitur struktural granular dan teknik penyeimbangan data SMOTE mampu menciptakan sistem deteksi anomali yang sangat akurat untuk pembersihan data alumni.

Sign In to Perpus

Don't have an account? Sign Up

#