Prediksi Risiko Diabetes Tahap Awal Menggunakan Machine Learning dengan Algoritma K-Nearest Neighbor

Authors

  • Novi Trisna Universitas Putra Indonesia "YPTK" Padang
  • Raja Ayu Mahessya Universitas Putra Indonesia "YPTK" Padang

DOI:

https://doi.org/10.55382/jurnalpustakadata.v5i2.1550

Keywords:

Diabetes mellitus, Prediksi Risiko, K-Nearest Neighbor, Klasifikasi, Nilai K, Percentage Split

Abstract

Diabetes mellitus merupakan penyakit metabolik kronis yang prevalensinya terus meningkat dan berkontribusi signifikan terhadap beban kesehatan masyarakat global akibat komplikasinya yang bersifat progresif dan sering terdeteksi pada tahap lanjut. Oleh karena itu, deteksi dini risiko diabetes berdasarkan gejala awal dan riwayat kesehatan pasien menjadi penting untuk mendukung intervensi preventif yang tepat waktu. Perkembangan machine learning memungkinkan pemanfaatan data kesehatan untuk membangun model prediksi yang lebih cepat, konsisten, dan objektif dibandingkan pendekatan manual konvensional. Penelitian ini bertujuan untuk mengembangkan model klasifikasi risiko diabetes menggunakan algoritma K-Nearest Neighbor (KNN) berdasarkan dataset Early Stage Diabetes Risk Prediction. Dataset tersebut terdiri dari 520 data dengan 17 atribut, termasuk fitur numerik seperti usia dan fitur kategorikal yang merepresentasikan gejala awal diabetes, seperti polyuria, polydipsia, weakness, dan polyphagia, dengan label kelas positif dan negatif diabetes. Tahap pra-pemrosesan data dilakukan dengan mentransformasikan atribut kategorikal menjadi nilai numerik (Yes=1, No=0; male=1, female=0) agar mendukung perhitungan jarak pada algoritma KNN. Model klasifikasi diimplementasikan menggunakan bahasa pemrograman Python pada Google Colab dan dievaluasi melalui empat skenario percentage split, yaitu 60:40, 70:30, 80:20, dan 90:10. Nilai K diuji pada rentang K=2 hingga K=9 menggunakan metrik jarak Euclidean untuk menentukan parameter optimal. Hasil eksperimen menunjukkan bahwa K=3 secara konsisten memberikan performa terbaik dengan akurasi tertinggi sebesar 97% pada skenario pembagian data 60:40. Temuan ini menunjukkan bahwa model KNN yang diusulkan efektif untuk mendeteksi risiko diabetes pada tahap awal.

Downloads

Download data is not yet available.

References

Daftar Rujukan

F. Ruziq and M. R. Wayahdi, “Web-Based Diabetes Risk Prediction System Using K-NN on Kaggle Early Stage Diabetes Dataset,” vol. 6, no. 5, pp. 3217–3229, 2025.

O. M. Haq, A. Ridwan, and T. G. Pratama, “Analisis Perbandingan Kinerja Algoritma Naïve Bayes Dan KNN Untuk Memprediksi Penyakit Diabetes,” pp. 193–201.

N. P. Korina, B. Prasetiyo, A. A. Hakim, and M. R. A. Septian, “Journal of Information System The Influence of Determining the K-Value on Improving the Diabetes Classification Model using the K-NN Algorithm,” vol. 2, no. 2, pp. 69–76, 2024.

F. Rahman, S. Hossain, and J. Tiang, “Diabetes Prediction Using Feature Selection Algorithms and Boosting-Based Machine Learning Classifiers,” pp. 1–24, 2025.

S. Afolabi, N. Ajadi, A. Jimoh, and I. Adenekan, “Informatics and Health Predicting diabetes using supervised machine learning algorithms on E-health records,” Informatics Heal., vol. 2, no. 1, pp. 9–16, 2025, doi: 10.1016/j.infoh.2024.12.002.

S. Yadu, R. Chandra, and V. K. Sinha, “Comparing Different Machine Learning Techniques in Predicting Diabetes on Early Stage †,” pp. 1–9, 2024.

L. Jiang et al., “Diabetes risk prediction model based on community follow-up data using machine learning,” Prev. Med. Reports, vol. 35, no. August, p. 102358, 2023, doi: 10.1016/j.pmedr.2023.102358.

R. Pratama et al., “IMPLEMENTATION OF DIABETES PREDICTION MODEL USING RANDOM IMPLEMENTASI MODEL PREDIKSI DIABETES MENGGUNAKAN ALGORITMA,” vol. 5, no. 4, pp. 1165–1174, 2024.

A. Oktaviana, D. P. Wijaya, A. Pramuntadi, and D. Heksaputra, “Prediction of Type 2 Diabetes Mellitus Using The K-Nearest Neighbor ( K-NN ) Algorithm Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor ( K-NN ),” vol. 4, no. July, pp. 812–818, 2024.

N. Agustus, R. N. Fitria, W. Sugianto, and A. Cemara, “Prediksi Penyakit Diabetes Mellitus Tipe I dan Tipe II Menggunakan Metode KNN di Klinik Dharma Husada Universitas PGRI Yogyakarta , Indonesia,” vol. 2, no. 3, 2024.

L. Nuril, Z. Fatah, and I. Yunita, “KLASIFIKASI PENYAKIT DIABETES MENGGUNAKAN METODE K-NEAREST NEIGHBORS,” vol. 1, no. 4, pp. 41–46, 2024.

V. No, Z. Amri, M. Rodi, M. N. Wathani, A. Bagja, and V. No, “Infotek?: Jurnal Informatika dan Teknologi Prediksi Diabetes Menggunakan Algoritma K-Nearest ( KNN ) Teknik SMOTE-ENN Infotek?:

P. N. Sabrina and A. Komarudin, “PREDIKSI PENYAKIT DIABETES DENGAN METODE K-NEAREST NEIGHBOR ( KNN ) DAN SELEKSI FITUR INFORMATION GAIN,” vol. 8, no. 6, pp. 11320–11326, 2024.

R. Ajeng, M. Farhan, and A. Cahyani, “Prediksi Terkena Diabetes menggunakan Metode K- Nearest Neighbor ( KNN ) pada Dataset UCI Machine Learning Diabetes Abstract?: Abstrak?:,” vol. 3, no. 2, pp. 15–19, 2023, doi: 10.35472/indojam.v3i2.1577.

Published

2025-12-31

How to Cite

Trisna, N., & Ayu Mahessya, R. (2025). Prediksi Risiko Diabetes Tahap Awal Menggunakan Machine Learning dengan Algoritma K-Nearest Neighbor. Jurnal Pustaka Data (Pusat Akses Kajian Database, Analisa Teknologi, Dan Arsitektur Komputer), 5(2), 481–487. https://doi.org/10.55382/jurnalpustakadata.v5i2.1550