Pengembangan Model Prediksi Risiko Diabetes Menggunakan Pendekatan AdaBoost dan Teknik Oversampling SMOTE
Abstract
Diabetes mellitus merupakan penyakit kronis yang prevalensinya terus meningkat dan menjadi masalah kesehatan serius di berbagai negara, termasuk Indonesia. Salah satu tantangan utama dalam pengembangan model prediksi risiko diabetes adalah ketidakseimbangan data, di mana jumlah sampel kelas minoritas (penderita diabetes) jauh lebih sedikit dibandingkan kelas mayoritas (bukan penderita diabetes). Penelitian ini bertujuan untuk mengatasi masalah ketidakseimbangan data dengan mengintegrasikan metode AdaBoost dan teknik oversampling SMOTE untuk membangun model prediksi risiko diabetes yang akurat dan andal. Metode AdaBoost dipilih karena kemampuannya dalam meningkatkan akurasi prediksi melalui perbaikan kesalahan secara iteratif, sedangkan SMOTE digunakan untuk meningkatkan representasi kelas minoritas dengan menghasilkan data sintetis. Hasil penelitian menunjukkan bahwa model AdaBoost tanpa SMOTE memiliki akurasi sebesar 81,87% dan nilai ROC-AUC sebesar 0,9031, tetapi performanya cenderung lebih tinggi pada kelas mayoritas dibandingkan kelas minoritas. Setelah menerapkan AdaBoost dengan SMOTE, performa model pada kelas minoritas meningkat signifikan, dengan precision, recall, dan F1-score yang lebih seimbang antara kedua kelas. Akurasi keseluruhan model meningkat menjadi 82,83%, dan nilai ROC-AUC menjadi 0,9058. Kombinasi AdaBoost dan SMOTE terbukti efektif dalam menangani ketidakseimbangan data, memberikan prediksi yang lebih seimbang antara kelas mayoritas dan minoritas. Penelitian ini berkontribusi dalam pengembangan pendekatan prediktif berbasis machine learning untuk mendukung upaya preventif di bidang kesehatan.
Downloads
References
E. Retta, H. Kusumajaya, and A. Arjuna, “Faktor-Faktor Yang Berhubungan Dengan Pemilihan Pengobatan Herbal Pada Pasien Diabetes Mellitus,” J. Penelit. Perawat Prof., vol. 5, no. 4, pp. 1541–1552, 2023.
E. F. Santika, “Prevalensi Diabetes Indonesia Naik Jadi 11,7% pada 2023,” Databoks. [Online]. Available: https://databoks.katadata.co.id/layanan-konsumen-kesehatan/statistik/8a95a31a9cb29b4/prevalensi-diabetes-indonesia-naik-jadi-117-pada-2023
E. Erika, “Meningkatkan Pemahaman Masyarakat Pentingnya Deteksi Dini Diabetes Melitus Melalui Penyuluhan Dan Pengukuran Gula Dan Tekanan Darah,” EJOIN, vol. 1, no. 7, pp. 685–697, 2023.
P. N. Sabrina and A. Komarudin, “Prediksi Penyakit Diabetes Dengan Metode K-Nearest Neighbor (KNN) dan Seleksi Fitur Information Gain,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 6, pp. 11320–11326, 2024.
G. A. Putri, A. Trimaysella, and A. Khoiriah, “Penerapan Klasifikasi Data Mining pada Diabetes Menggunakan Metode Naive Bayes,” J. Ilmu Komput. Teknol. Terap., vol. 1, no. 14, pp. 1–9, 2024.
N. Nurdiana and A. Algifari, “Studi Komparasi Algoritma ID3 dan Algoritma Naive Bayes Untuk Klasifikasi Penyakit Diabetes Mellitus,” Infotech J., vol. 6, no. 2, pp. 18–23, 2020.
M. I. Gunawan, D. Sugiarto, and I. Mardianto, “Peningkatan Kinerja Akurasi Prediksi Penyakit Diabetes Mellitus Menggunakan Metode Grid Seacrh pada Algoritma Logistic Regression,” J. Edukasi dan Penelit. Inform., vol. 6, no. 3, p. 280, 2020, doi: 10.26418/jp.v6i3.40718.
A. Syukron, “Penerapan Metode SMOTE Untuk Mengatasi Ketidakseimbangan Kelas Pada Prediksi Gagal Jantung,” J. Teknol. Inf. dan Terap., vol. 10, no. 1, pp. 47–50, 2023.
A. Franseda, “Integrasi Metode Decision Tree dan SMOTE untuk Klasifikasi Data Kecelakaan Lalu Lintas,” JUSTIN (Jurnal Sist. dan Teknol. Informasi), vol. 08, no. 3, pp. 282–290, 2020, doi: 10.26418/justin.v8i3.40982.
I. Ayuningtyas and E. U. Kasanah, “Penerapan Synthetic Minority Oversampling Technique (SMOTE) Pada Kasus Dampak Covid-19 Terhadap Penduduk Usia Kerja di Kalimantan Timur,” BESTARI Bul. Statisitikan dan Apl. Terkini, vol. 1, no. 1, pp. 1–7, 2021.
R. Rousyati, A. N. Rais, E. Rahmawati, and R. F. Amir, “Prediksi Pima Indians Diabetes Database Dengan Ensemble Adaboost Dan Bagging,” Evolusi J. Sains dan Manaj., vol. 9, no. 2, pp. 36–42, 2021.
A. Arifin et al., “Klasifikasi Dalam Mendeteksi Penyakit Hipoglikemia Dengan Menggunakan Metode Random Forest dan Adaboost,” in Seminar Nasional Mahasiswa Ilmu Komputer dan Aplikasinya (SENAMIKA), Jakarta, 2022, pp. 542–549.
A. Byna and M. Basit, “Penerapan Metode Adaboost Untuk Mengoptimasi Prediksi Penyakit Stroke Dengan Algoritma Naïve Bayes,” J. SISFOKOM (Sistem Inf. dan Komputer), vol. 09, no. 03, pp. 407–411, 2020.
R. I. Borman and M. Wati, “Penerapan Data Maining Dalam Klasifikasi Data Anggota Kopdit Sejahtera Bandarlampung Dengan Algoritma Naïve Bayes,” J. Ilm. Fak. Ilmu Komput., vol. 9, no. 1, pp. 25–34, 2020.
J. Dasilva, “Diabetes Dataset,” Kaggle. [Online]. Available: https://www.kaggle.com/datasets/johndasilva/diabetes
R. I. Borman, R. Napianto, N. Nugroho, D. Pasha, Y. Rahmanto, and Y. E. P. Yudoutomo, “Implementation of PCA and KNN Algorithms in the Classification of Indonesian Medicinal Plants,” in International Conference on Computer Science, Information Technology and Electrical Engineering (ICOMITEE), IEEE, 2021, pp. 46–50.
E. Sutoyo and M. A. Fadlurrahman, “Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network,” JEPIN (Jurnal Edukasi dan Penelit. Inform. Edukasi dan Penelit. Inform., vol. 6, no. 3, pp. 379–385, 2020.
M. P. Pulungan, A. Purnomo, and A. Kurniasih, “Penerapan Smote Untuk Mengatasi Imbalance Class Dalam Klasifikasi Kepribadian MBTI Menggunakan Naive Bayes Classifier,” J. Teknol. Inf. dan Ilmu Komput., vol. 11, no. 5, pp. 1033–1042, 2024, doi: 10.25126/jtiik.2024117989.
G. A. Mursianto, M. Falih, M. Irfan, T. Sakinah, D. Sandya, and P. Prasvita, “Perbandingan Metode Klasifikasi Random Forest dan XGBoost Serta Implementasi Teknik SMOTE pada Kasus Prediksi Hujan,” in Seminar Nasional Mahasiswa Ilmu Komputer dan Aplikasinya (SENAMIKA), Jakarta, 2021, pp. 41–50.
T. H. Saragih, M. Muliadi, M. R. Faisal, and M. A. I. N. R. Said, “AdaBoost Classifier untuk Klasifikasi Tanaman Jarak Pagar,” J. Komputasi, vol. 9, no. 2, pp. 60–66, 2021.
R. I. Borman, F. Rossi, Y. Jusman, A. A. A. Rahni, S. D. Putra, and A. Herdiansah, “Identification of Herbal Leaf Types Based on Their Image Using First Order Feature Extraction and Multiclass SVM Algorithm,” in International Conference on Electronic and Electrical Engineering and Intelligent System (ICE3IS), IEEE, 2021, pp. 12–17.
R. I. Borman, Y. Fernando, and Y. Egi Pratama Yudoutomo, “Identification of Vehicle Types Using Learning Vector Quantization Algorithm with Morphological Features,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 6, no. 2, pp. 339–345, 2022, doi: 10.29207/resti.v6i2.3954.
J. Wang, A. R. Isnain, R. R. Suryono, Y. Rahmanto, M. Mesran, and S. Setiawansyah, “Decision Support System for Platform Selection in E-Commerce Using the OWH-TOPSIS Method,” J. Comput. Syst. Informatics, vol. 6, no. 1, pp. 172–181, 2024, doi: 10.47065/josyc.v6i1.5990.
J. Wang, D. Darwis, S. Setiawansyah, and Y. Rahmanto, “Implementation of MABAC Method and Entropy Weighting in Determining the Best E-Commerce Platform for Online Business,” JiTEKH, vol. 12, no. 2, pp. 58–68, 2024, doi: 10.35447/jitekh.v12i2.1000.
Copyright (c) 2025 Sofian Sidiq, Alfian Alfian, Nur Shobi Mabrur

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


.png)









