Optimasi Algoritma K-Nearest Neighbor (k-NN) dengan Wrapper Forward Selection untuk Deteksi Penderita Breast Cancer
DOI:
https://doi.org/10.53416/jurmik.v5i1.324Keywords:
Data Mining, Kanker Payudara, Feature Selection, Wrapper, Forward SelectionAbstract
Breast cancer atau kanker payudara adalah penyakit yang disebabkan karena adanya pertumbuhan sel-sel tubuh yang tidak normal dan mengambil alih sel yang masih sehat pada daerah payudara. Breast cancer sangat diperlukan penanganan dini agar sel kanker pada payudara tidak menyebar secara luas, karena breast cancer dapat menyebabkan kematian. Data mining dapat menjadi salah satu opsi solusi dalam membantu diagnosis kanker payudara. Data mining dapat berperan dalam membantu pengambilan keputusan, karena data yang sudah diolah dapat digunakan dalam analisis sebelum pengambilan keputusan. Analisis data dalam penelitian ini menggunakan algoritma klasifikasi k-Nearest Neighbor (k-NN) yang dioptimasi menggunakan teknik feature selection, yaitu wrapper forward selection. Hasil penelitian menunjukkan bahwa data mining sangat berguna dan bermanfaat dalam menganalisis dan mendiagnosis penyakit breast cancer. Hasil penelitian menunjukkan bahwa nilai persentase akurasi, presisi, dan recall pada model yang menggunakan forward selection menghasilkan persentase yang lebih tinggi daripada yang tidak menggunakan forward selection, yaitu sebesar 96,19%. Sedangkan model yang tidak menggunakan teknik forward selection menghasilkan tingkat akurasi sebesar 84,16%. Sehingga dalam penelitian ini, teknik forward selection sangat berpengaruh dalam meningkatkan akurasi pada model yang terbentuk.
References
Putra SR. Buku Lengkap Kanker Payudara. Yogyakarta: Laksana; 2015.
Rejani YIA, Selvi ST. Early Detection of Breast Cancer using SVM Classifier Technique. IJCSE: International Journal on Computer Science and Engineering [Internet]. 2009;1(3):127–30. Available from: https://www.enggjournals.com/ijcse/abstract.html?file=09-01-03-03
Chimed T, Sandagdorj T, Znaor A, Laversanne M, Tseveen B, Genden P, et al. Cancer Incidence and Cancer Control in Mongolia: Results from the National Cancer Registry 2008-12. IJC: International Journal of Cancer. 2016;140(2):302–9.
Bray F, Laversanne M, Sung H, Ferlay J, Siegel RL, Soerjomataram I, et al. Global Cancer Statistics 2022: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. American Cancer Society Journal. 2024;74(3):229–63.
Alfalah R. Jenis Histopatologi Berdasarkan Stadium pada Pasien Kanker Payudara di RSUCM Aceh Utara Tahun 2020. Matriks: Jurnal Sosial dan Sains. 2022;4(1):21–300.
Farahdiba BA, Nugroho YS. Klasifikasi Kanker Payudara Menggunakan Algoritma Gain Ratio. Jurnal Teknik Elektro. 2016;8(2):43–6.
Narulita S, Prihati, Oktaga AT, Widyantoro AE. Performansi Algoritma Clustering K-Means untuk Penentuan Status Malnutrisi pada Balita. ISAINTEK: Jurnal Informasi, Sains, dan Teknologi. 2023;6(1):188–202.
Gbenga DE, Christopher N, Yetunde DC. Performance Comparison of Machine Learning Techniques for Breast Cancer Detection. Nova Journal of Engineering and Applied Sciences. 2017;6(1):1–8.
Henderi, Wahyuningsih T, Rahwanto E. Comparison of Min-Max Normalization and Z-Score Normalization in the K-Nearest Neighbor (KNN) Algorithm to Test the Accuracy of Types of Breast Cancer. Bright: International Journal of Informatics and Information Systems. 2021;4(1):13–20.
Enriko IKA, Melinda, Sulyani AC, Astawa IGB. Breast Cancer Recurrence Prediction System using k-Nearest Neighbor, Naive-Bayes, and Support Vector Machine Algorithm. Jurnal Infotel: Informatics, Telecommunication, and Electronics. 2021;13(4):185–8.
Atthalla IN, Jovandy A, Habibie H. Klasifikasi Penyakit Kanker Payudara Menggunakan Metode K Nearest Neighbor (KNN). In: Prosiding Annual Research Seminar 2018 [Internet]. Palembang: Fakultas Ilmu Komputer UNSRI; 2018. p. 148–51. Available from: https://seminar.ilkom.unsri.ac.id/index.php/ars/article/view/1981
Alfian G, Syafrudin M, Fahrurrozi I, Fitriyani NL, Atmaji FTD, Widodo T, et al. Predicting Breast Cancer from Risk Factors using SVM and Extra-Trees-Based Feature Selection Method. Computers. 2022;11(9):1–14.
R MT, Kaladevi AC, M BJ, Vivek V, Prabu M, Muthukumaran V. An Efficient Ensemble Method using K-Fold Cross Validation for the Early Detection of Benign and Malignant Breast Cancer. International Journal of Integrated Engineering [Internet]. 2022;14(7):204–16. Available from: https://publisher.uthm.edu.my/ojs/index.php/ijie/article/view/10810
Fitrianingsih, Zuraeni B. Analisis Ramalan Cuaca di Sekupang, Kota Batam Menggunakan Algoritma Decision Tree dan Confusion Matrix. Ekosphere: Jurnal Ekonomi Pembangunan dan Manajemen [Internet]. 2024;1(3):15–26. Available from: https://ibnusinapublisher.org/index.php/EKOSPHERE/article/view/21
Narulita S, Prihati P, Priyambodo A. Analisis dan Komparasi Algoritma Klasifikasi untuk Prediksi Kerugian Tower Provider Akibat Penalti yang Diberikan oleh Operator Telekomunikasi karena Keterlambatan Penyelesaian Pekerjaan oleh Tower Provider. Cakrawala Informasi [Internet]. 2022;2(2):1–14. Available from: https://itbsemarang.ac.id/sijies/index.php/jci/article/view/233
Yulianto LD, Triayudi A, Sholihati ID. Implementation Educational Data Mining for Analysis of Student Performance Prediction with Comparison of K-Nearest Neighbor Data Mining Method and Decision Tree C4.5. Jurnal Mantik [Internet]. 2020;4(1):441–51. Available from: https://iocscience.org/ejournal/index.php/mantik/article/view/770
Sitompul N. Rapid Miner Testing with the KNN Algorithm. Journal of Data Science [Internet]. 2023;1(2):30–6. Available from: https://ejournal.seaninstitute.or.id/index.php/visualization/article/view/2834
Tarigan LRA, Dahlan. Optimalisasi Fitur dengan Forward Selection pada Estimasi Tingkat Penyakit Paru-Paru Menggunakan Algoritma Klasifikasi Random Forest. JATI: Jurnal Mahasiswa Teknik Informatika. 2024;8(5):10341–8.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Jurnal Rekam Medis & Manajemen Infomasi Kesehatan

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.











