Classification of Diabetes Mellitus Using Logistic Regression and MLP
Abstract
Abstrak
Diabetes melitus atau penyakit kencing manis, adalah penyakit kronis yang berlangsung seumur hidup. Secara global, prevalensi diabetes pada orang dewasa berusia 20–79 tahun diperkirakan mencapai 10,5% atau sekitar 536,6 juta jiwa, dan diprediksi meningkat menjadi 12,2% atau sekitar 783,2 juta jiwa pada tahun 2045. Peningkatan tersebut menjadikan diabetes salah satu penyebab utama kematian di dunia. Penelitian bertujuan untuk mengembangkan model klasifikasi untuk skrining awal diabetes melitus dengan menggunakan metode Regresi Logistik dan MultiLayer Perceptron (MLP). Pendekatan yang digunakan meliputi perbandingan optimasi hyperparameter melalui Grid Search dan default model. Data yang digunakan berasal dari Rumah Sakit Bali Mandara dan Rumah Sakit Umum Tabanan Bali, dengan 2.203 data sampel dan 9 atribut. Berdasarkan hasil evaluasi, MultiLayer Perceptron (MLP) menunjukkan akurasi validasi terbaik sebesar 93,20% pada rasio pembagian data 80:20 tanpa optimasi, sementara regresi logistik memperoleh akurasi validasi 88,21% pada rasio 80:20 dengan optimasi.
Kata kunci: Diabetes melitus, regresi logistik, MultiLayer Perceptron, skrining dini, optimasi hyperparameter.
Abstract
Diabetes mellitus, or diabetes, is a chronic disease that lasts a lifetime. Globally, the prevalence of diabetes in adults aged 20-79 years is estimated at 10.5% or around 536.6 million people, and is predicted to increase to 12.2% or around 783.2 million people by 2045. This increase makes diabetes one of the leading causes of death in the world. The study aims to develop a classification model for early screening of diabetes mellitus using logistic regression and MultiLayer Perceptron (MLP) methods. The approach used includes comparison of hyperparameter optimization through grid search and default model. The data used came from Bali Mandara Hospital and Tabanan Bali General Hospital, with 2,203 sample data and 9 attributes. Based on the evaluation results, MultiLayer Perceptron (MLP) showed the best validation accuracy of 93.20% at a data division ratio of 80:20 without optimization, while logistic regression obtained a validation accuracy of 88.21% at a ratio of 70:30 with optimization.
Keywords: Diabetes mellitus, logistic regression, MultiLayer Perceptron, early screening, hyperparameter optimization.