Medical Informatics IV
Improving Cardiovascular Disease Prediction Using Ensemble Learning Techniques and Dimensionality Reduction
Hatice Koç, Ali Zıdelkhır, Seda Tolun Tayalı, Çiğdem Selçukcan ErolCardiovascular diseases (CVDs) represent a significant global health challenge, leading to heart failure in numerous cases. Addressing this issue requires the development of effective strategies. In this study, we employ ensemble learning models, specifically “Bagging” and “Boosting”, to predict the risk of cardiovascular diseases using a Kaggle dataset comprising 11 features and 70,000 observations. Our investigation focuses on exploring the potential of ensemble models such as AdaBoost, Random Forest, Gradient Boosting, and Gaussian Naive Bayes to enhance the prediction performance for a medical dataset. Additionally, we highlight the importance of dimensionality reduction through Principal Component Analysis (PCA). The findings underscore the critical role of dimensionality reduction. Applying the Bagging and Boosting models with dimensionality reduction results in higher accuracy, precision, recall, F1-score, and Area under Curve (AUC). Leveraging dimensionality reduction significantly improves the model performance, yielding substantial enhancements in predictive capabilities.
Topluluk Öğrenme Tekni̇kleri̇ ve Boyut Azaltma Kullanılarak Kardi̇yovasküler Hastalık Tahmi̇ni̇ni̇n İyi̇leşti̇ri̇lmesi̇
Hatice Koç, Ali Zıdelkhır, Seda Tolun Tayalı, Çiğdem Selçukcan ErolKardiyovasküler hastalıklar, birçok vakada kalp yetmezliğine neden olan önemli bir küresel sağlık sorununu ifade etmektedir. Bu sorunla ilgilenmek etkili stratejiler geliştirilmesini gerektirmektedir. Bu çalışmada, 11 öznitelik ve 70,000 gözlemden oluşan bir Kaggle veri seti kullanılarak kardiyovasküler hastalıklar riskini tahmin etmek için özellikle “Torbalama” ve “Arttırma” olmak üzere topluluk öğrenme modelleri kullanılmaktadır. Çalışmamız tıbbi bir veri setinde tahmin performansını artırmak amacıyla Uyarlanabilir Yükseltme, Rassal Orman, Gradyan Artırma ve Gauss Naive Bayes gibi topluluk modellerinin potansiyellerinin keşfedilmesine odaklanmaktadır. Ek olarak, Temel Bileşen Analizi ile boyut indirgemenin önemini vurgulamaktayız. Bulgular, boyut indirgemenin kritik rolünün önemini vurgulamaktadır. Torbalama ve Arttırma modellerinin boyut indirgeme ile beraber uygulanması daha yüksek doğruluk, kesinlik, duyarlılık, f1 puanı ve AUC ile sonuçlanmaktadır. Boyutsal indirgemeden yararlanmak tahmin yeteneklerinde önemli gelişmeler sağlanarak model performansı önemli ölçüde arttırmaktadır.