Perbandingan Metode Tree Based Classification untuk Masalah Klasifikasi Data Body Mass Index

Authors: RN Alifah, MK Najib, S Nurdiati, AP Sari, K Herlambang, Noval, DTPB Ginting, SN Sya’adah. 

Abstrak: Body mass index (BMI) atau indeks massa tubuh merupakan salah satu indikator yang dapat mengawasi dan menjelaskan status gizi seseorang. Penelitian ini bertujuan untuk mengklasifikasikan BMI berdasarkan gender, tinggi badan, dan berat badan dengan menggunakan metode Tree Based Classification yang terdiri atas model Decision Tree Classifier, Random Forest Classifier, Gradient Boosting Classifier, dan XGBoost menggunakan bahasa pemrograman python. Model Tree Based classification tersebut akan mengklasifikasikan BMI kedalam 6 kelas indeks. Hasil penelitian menunjukkan model klasifikasi XGBoost memiliki akurasi terbaik setelah dilakukan tuning hyperparameter dengan nilai akurasi data test 83.7%. Performa model terbaik sebelum tuning hyperparameter dihasilkan model Random Forest dengan nilai F1-score (macro) untuk data test sebesar 88%. Sementara itu, performa model terbaik setelah tuning hyperparameter dihasilkan model XGBoost dengan nilai F1-score (macro) untuk data test dan data train masing-masing sebesar 79% dan 85%. Berdasarkan model XGBoost, variabel prediktor yang paling berkontribusi terhadap BMI adalah berat badan dengan nilai permutation importance 68.1%.

Kata kunci: Confusion Matrix, F1-Score, Permutation Importance, Tree Based Classification, True Positive Rate


Dipublikasikan pada Indonesian Journal of Mathematics and Natural Sciences, vol. 47(1): 49-65. 

Posting Komentar

0 Komentar