Prediksi Angka Harapan Hidup Menggunakan Regresi Linear Berganda, Lasso, Ridge, Elastic Net, dan Kuantil Lasso

Authors: MD Fauzan, MK Najib, S Nurdiati, N Khoerunnisa, SD Maulia, RRC Triwulandari, MF Aziz. 

Abstrak: Angka harapan hidup mejadi salah satu indikator penting dalam mengevaluasi kesejahteraan dan kualitas hidup suatu populasi atau negara. Metode yang biasa digunakan untuk memprediksi adalah regresi linear berganda. Terdapat banyak perkembangan model regresi linear berganda, seperti regresi lasso, ridge, elastic net, kuantil, serta kuantil lasso. Untuk melihat kontribusi setiap variabel independen pada model, digunakan metode Mean Absolute Shapley Values (MASV). Oleh karena itu, tujuan dari penelitian ini adalah membandingkan model regresi linear berganda, lasso, ridge, elastic net, kuantil, serta kuantil lasso dalam memprediksi nilai angka harapan hidup. Penelitian diawali dengan melakukan eksplorasi data. Selanjutnya, model-model regresi tersebut dilatih. Pelatihan model tersebut juga dilakukan berulang kali dengan mengacak data pada pembagian data latih dan data uji. Terakhir, kontribusi setiap variabel independen diukur. Performa model regresi linear berganda pada iterasi pertama cukup baik dengan nilai r-square lebih besar dari 85% baik pada data latih dan data uji. Namun, Performa model lasso, ridge, elastic net, kuantil, dan kuantil lasso tidak jauh berbeda dengan performa model regresi linear berganda. Ketika dilakukan pengacakan data latih dan data uji.  Model regresi kuantil lasso memiliki performa yang lebih konsisten dalam memprediksi nilai angka harapan hidup dibandingkan model lainnya. Pada setiap model regresi, tingkat kelahiran dan tingkat kematian bayi merupakan variabel yang memiliki kontribusi terbesar dalam memprediksi nilai angka harapan hidup, sedangkan persentase orang yang mengikuti sekolah formal dan persentase populasi yang tinggal di perkotaan bukan variabel independen yang cukup baik untuk memprediksi angka harapan hidup.

Kata kunci: angka harapan hidup, model regresi, data latih, data uji


Dipublikasikan pada Jurnal Sains Matematika dan Statistika, vol. 10(2): 192-206. 

Posting Komentar

0 Komentar