| JudulPERBANDINGAN METODE SUPPORT VEKTOR MACHINE, RANDOM FOREST DAN MULTILAYER PERCEPTRON DALAM KLASIFIKASI DIABETES MELLITUS BERDASARKAN DNA |
| Nama: FITRA RAMADHAN |
| Tahun: 2025 |
| Abstrak Diabetes Mellitus (DM) merupakan masalah kesehatan global dengan prevalensi yang terus meningkat. Analisis genetik melalui sekuens DNA dan kemajuan teknologi bioinformatika memungkinkan penerapan pembelajaran mesin untuk diagnosis DM yang lebih akurat. Penelitian ini membandingkan tiga metode klasifikasi, yaitu Support Vector Machine (SVM), Multilayer Perceptron (MLP), dan Random Forest (RF), dalam mengklasifikasikan penyakit Diabetes Mellitus (DM) tipe 1 dan tipe 2 berdasarkan data DNA. Hasil penelitian menunjukkan bahwa RF memiliki performa yang lebih stabil, dengan akurasi tertinggi mencapai 76,83% pada dimensi 10. Sementara itu, MLP mencatatkan akurasi tertinggi sebesar 76,93% pada dimensi 8, namun mengalami penurunan signifikan pada dimensi yang lebih tinggi. SVM mencapai akurasi tertinggi 76,08% pada dimensi 8, namun menunjukkan penurunan drastis pada dimensi tinggi akibat overfitting. Faktor yang memengaruhi performa antara lain adalah komposisi data dan dimensi fitur, dengan RF terbukti lebih tahan terhadap perubahan tersebut. Dengan demikian, secara keseluruhan, RF lebih unggul dalam hal stabilitas dan keandalan dalam mengklasifikasikan data sekuens DNA, terutama pada dimensi tinggi dan variasi komposisi data. Kata kunci: Diabetes Mellitus, Klasifikasi, DNA, Principal Component Analysis, Support Vector Machine, Multilayer Perceptron, Random Forest.Diabetes Mellitus (DM) merupakan masalah kesehatan global dengan prevalensi yang terus meningkat. Analisis genetik melalui sekuens DNA dan kemajuan teknologi bioinformatika memungkinkan penerapan pembelajaran mesin untuk diagnosis DM yang lebih akurat. Penelitian ini membandingkan tiga metode klasifikasi, yaitu Support Vector Machine (SVM), Multilayer Perceptron (MLP), dan Random Forest (RF), dalam mengklasifikasikan penyakit Diabetes Mellitus (DM) tipe 1 dan tipe 2 berdasarkan data DNA. Hasil penelitian menunjukkan bahwa RF memiliki performa yang lebih stabil, dengan akurasi tertinggi mencapai 76,83% pada dimensi 10. Sementara itu, MLP mencatatkan akurasi tertinggi sebesar 76,93% pada dimensi 8, namun mengalami penurunan signifikan pada dimensi yang lebih tinggi. SVM mencapai akurasi tertinggi 76,08% pada dimensi 8, namun menunjukkan penurunan drastis pada dimensi tinggi akibat overfitting. Faktor yang memengaruhi performa antara lain adalah komposisi data dan dimensi fitur, dengan RF terbukti lebih tahan terhadap perubahan tersebut. Dengan demikian, secara keseluruhan, RF lebih unggul dalam hal stabilitas dan keandalan dalam mengklasifikasikan data sekuens DNA, terutama pada dimensi tinggi dan variasi komposisi data. Kata kunci: Diabetes Mellitus, Klasifikasi, DNA, Principal Component Analysis, Support Vector Machine, Multilayer Perceptron, Random Forest. |