Penanganan Ketidakseimbangan Data pada Pemodelan Risiko Diabetes Tipe 2 Menggunakan SMOTE-MARS

Canada Mewa Fizkadana, Nur Chamidah, Ardi Kurniawan, Naufal Ramadhan Al Akhwal Siregar

Abstract


Diabetes Melitus Tipe 2 (DMT2) merupakan tantangan kesehatan kritis di Indonesia, namun pemodelan faktor risikonya sering terhambat oleh ketidakseimbangan kelas di mana individu sehat melebihi jumlah kasus positif. Penelitian ini memodelkan risiko DMT2 menggunakan pendekatan hybrid yang menggabungkan Synthetic Minority Over-sampling Technique (SMOTE) dan Multivariate Adaptive Regression Splines (MARS). Penelitian ini menggunakan data medis dengan ketidakseimbangan awal 62% sehat dan 38% kasus DMT2. SMOTE diterapkan untuk menyeimbangkan distribusi training, diikuti dengan pemodelan MARS untuk menangkap interaksi non-linear. Hasil penelitian menunjukkan bahwa model SMOTE-MARS secara signifikan mengungguli MARS standar, mencapai Akurasi 0,70 dan AUC 0,73, dibandingkan dengan AUC model standar yang hanya 0,458. Model optimal mengidentifikasi Berat Badan, Tinggi Badan, dan Konsumsi Gula sebagai prediktor utama. Secara spesifik, berat badan di bawah 48 kg teridentifikasi sebagai faktor protektif yang kuat (OR 0,22), sedangkan tinggi badan kurang dari 165 cm (OR 1,22) dan interaksi berat badan berlebih (>62 kg) dengan konsumsi gula (OR 1,12) merupakan faktor risiko signifikan. Tingginya nilai sensitivitas mengindikasikan bahwa model SMOTE-MARS sangat potensial digunakan sebagai instrumen deteksi dini untuk mengidentifikasi pasien yang berisiko tinggi terkena diabetes.

Keywords


Diabetes Melitus Tipe 2, Ketidakseimbangan Data, SMOTE, MARS, Pemodelan Risiko.

References


Barron, A. R., & Xiao, X. (1991). Discussion: Multivariate adaptive regression splines. The Annals of Statistics, 19(1), 67–82.

Chamidah, N., Hasyim, M., Saifudin, T., & Lestari, B. (2025). Nonparametric Bi-Response Ordinal Logistic Regression Model for Diabetes Mellitus and Hypertension Risks Based on Multivariate Adaptive Regression Spline. Data and Metadata, 4, 912.

Chamidah, N., & Lestari, B. (2022). Analisis Regresi Nonparametrik dengan Perangkat Lunak R. Airlangga University Press.

Chang, H.-Y., Li, X., & Karniadakis, G. E. (2017). Modeling of biomechanics and biorheology of red blood cells in type 2 diabetes mellitus. Biophysical journal, 113(2), 481–490.

Fatarona, A., Cahyono, H. D., & Martiana, I. (2025). Upaya Pengendalian Diabetes Mellitus (DM) dengan Education Implementation pada Kelompok DM dan Kelompok Beresiko DM pada Masyarakat Urban. Bhakti Patrika, 1(1), 8–13.

Friedman, J. H. (1991). Multivariate adaptive regression splines. The annals of statistics, 19(1), 1–67.

Hasyim, M., Chamidah, N., & Saifudin, T. (2025). Hypertension modelling using nonparametric ordinal logistic regression based on multivariate adaptive regression spline. Commun. Math. Biol. Neurosci., 2025, Article-ID.

Jannoo, Z., Wah, Y. B., Lazim, A. M., & Hassali, M. A. (2017). Examining diabetes distress, medication adherence, diabetes self-care activities, diabetes-specific quality of life and health-related quality of life among type 2 diabetes mellitus patients. Journal of clinical & translational endocrinology, 9, 48–54.

Li, J., Bao, Y., Chen, X., & Tian, L. (2021). Decision models in type 2 diabetes mellitus: a systematic review. Acta Diabetologica, 58(11), 1451–1469.

Mushtaq, Z., Ramzan, M. F., Ali, S., Baseer, S., Samad, A., & Husnain, M. (2022). Voting Classification‐Based Diabetes Mellitus Prediction Using Hypertuned Machine‐Learning Techniques. Mobile Information Systems, 2022(1), 6521532.

Organization, W. H. (2018). Noncommunicable diseases country profiles 2018. Dalam Noncommunicable diseases country profiles 2018.

Pradipta, G. A., Wardoyo, R., Musdholifah, A., Sanjaya, I. N. H., & Ismail, M. (2021). SMOTE for handling imbalanced data problem: A review. 2021 sixth international conference on informatics and computing (ICIC), 1–8.

Rahman, S. (2021). [BUKU] Diabetes Melites Tipe 2 dan Akses Pelayanan Kesehatan.

Rahmawati, D. (2024). Kualitas Hidup Pasien Diabetes Melitus dan Hipertensi dalam Program Penyakit Kronis (Prolanis) di Indonesia: Narative Review. Jurnal Mandala Pharmacon Indonesia, 10(1), 116–122.

Safitri, L. R., Chamidah, N., & Saifudin, T. (2025). Modeling of stroke risk using synthetic minority oversampling technique in multivariate adaptive regression spline model. Commun. Math. Biol. Neurosci., 2025, Article-ID.

Salam, A., Azhari, L., Septarini, R. S., & Heriyani, N. (2025). Pendekatan Hybrid K-Means SMOTE dan Logistic Regression Untuk Deteksi Dini Diabetes Mellitus Pada Imbalanced Data. Bulletin of Computer Science Research, 5(3), 219–227.

Sayadi, M., Zibaeenezhad, M. J., & AYATOLLAHI, S. M. T. (2017). Simple prediction of type 2 diabetes mellitus via decision tree modeling.

Sidiq, S., Alfian, A., & Mabrur, N. S. (2025). Pengembangan Model Prediksi Risiko Diabetes Menggunakan Pendekatan AdaBoost dan Teknik Oversampling SMOTE. Jurnal Ilmiah Informatika dan Ilmu Komputer (JIMA-ILKOM), 4(1), 13–23.

Tjahjono, E., Mardianto, M. F. F., & Chamidah, N. (2018). Prediction of electricity consumption using Fourier series estimator in bi-response nonparametric regression model. Far East J. Math. Sci, 103, 1251–1263.

Wahidin, M., Achadi, A., Besral, B., Kosen, S., Nadjib, M., Nurwahyuni, A., Ronoatmodjo, S., Rahajeng, E., Pane, M., & Kusuma, D. (2024). Projection of diabetes morbidity and mortality till 2045 in Indonesia based on risk factors and NCD prevention and control programs. Scientific reports, 14(1), 5424.

Wang, X., Zhai, M., Ren, Z., Ren, H., Li, M., Quan, D., Chen, L., & Qiu, L. (2021). Exploratory study on classification of diabetes mellitus through a combined Random Forest Classifier. BMC medical informatics and decision making, 21(1), 105.

Yasmirullah, S. D. P., Otok, B. W., Purnomo, J. D. T., & Prastyo, D. D. (2021). Modification of multivariate adaptive regression spline (MARS). Journal of Physics: Conference Series, 1863(1), 012078.




DOI: https://doi.org/10.30998/semnasristek.v10i1.8891

Refbacks

  • There are currently no refbacks.


Prosiding SEMNAS RISTEK indexed by: