DG

HakkımdaProjelerYeteneklerDeneyimMühendislik DüşüncesiYol Haritası
Tamamlandı

Diyabet Tahmin Sistemi

Makine öğrenmesi ile diyabet risk tahminlemesi yapan sınıflandırma modeli.

01. Problem

Erken teşhis için diyabet risk faktörlerini analiz eden bir sistem gerekli. Sağlık verilerinden anlamlı tahminler üretebilmeli.

Kısıtlamalar

  • Sınırlı veri seti (Pima Indians Diabetes Dataset)
  • Dengesiz sınıf dağılımı problemi
  • Tıbbi alanda yüksek precision gereksinimi
  • Yorumlanabilirlik önemli (kara kutu model yetersiz)

02. Yaklaşım

Çeşitli ML algoritmalarının karşılaştırmalı analizi yapıldı. Kapsamlı feature engineering ve veri ön işleme uygulandı. Ensemble yöntemler ile en iyi sonuç elde edildi.

Model Seçimi

Seçilen Model

Random Forest / XGBoost

Gerekçe

Ensemble yöntemler daha iyi genelleme sağlıyor. Feature importance analizi ile hangi faktörlerin etkili olduğu yorumlanabiliyor.

03. Sonuçlar ve Değerlendirme

%82
Accuracy
0.78
F1-Score
0.85
AUC-ROC

Değerlendirme Yaklaşımı

K-fold cross-validation ve confusion matrix analizi ile model performansı değerlendirildi.

Sonuç

Tıbbi karar destek sistemi prototipi geliştirildi. Feature importance analizi ile en etkili risk faktörleri belirlendi.

Öğrenilen Dersler

01

Tıbbi verilerde precision çok kritik - yanlış pozitifler ciddi sonuçlar doğurabilir

02

Feature engineering, ham veriden çok daha iyi sonuçlar alınmasını sağlıyor

03

Ensemble yöntemler genellikle tek modellere göre daha güçlü

04

Veri kalitesi, model karmaşıklığından daha önemli

Teknoloji Yığını

PythonScikit-learnPandasNumPyMatplotlib

Etiketler

Machine LearningClassificationHealthcare
Diyabet Tahmin Sistemi | Duran Gezer