Life Expectancy Prediction Using Decision Tree, Random Forest, Gradient Boosting, and XGBoost Regressions

Authors: G Chairunisa, MK Najib, S Nurdiati, SF Imni, W Sanjaya, RD Andriani, RSP Putri, D Ekaputri. 

Abstrak: Angka harapan hidup menggambarkan rata-rata lamanya waktu seseorang hidup sejak lahir di dunia. Angka harapan hidup menjadi salah satu aspek dalam menentukan indeks pembangunan manusia. Semakin tinggi Angka harapan hidup maka akan semakin tinggi nilai IPM. Tujuan penelitian ini adalah memprediksi angka harapan hidup melalui model yang paling akurat dengan menggunakan model decision tree regression, random forest regression, gradient boosting regression, dan XGBoost regression, serta analisis variabel penjelas yang paling mempengaruhi angka harapan hidup. Data yang digunakan dalam penelitian ini adalah dataset Global Country Information Dataset 2023. Data diperoleh dari situs Kaggle. Berdasarkan analisis diperoleh bahwa model random forest regression menunjukkan kinerja yang lebih unggul dalam memprediksi hasil, yang ditunjukkan dengan nilai RMSE yang lebih rendah dan nilai R² yang lebih tinggi. Kematian bayi dan rasio kematian ibu secara konsisten diidentifikasi sebagai prediktor yang signifikan di semua model, sedangkan populasi merupakan prediktor yang kurang memprengaruhi angka harapan hidup.

Kata kunci: Harapan Hidup, Decision Tree, Gradient Boosting


Dipublikasikan pada JURNAL SINTAK, vol. 2(2): 71–82. 

Posting Komentar

0 Komentar