Başarılı Bir ML Projesi Nasıl Olmalı?

Şekil Resim Bir
Başarılı Bir ML Projesi Nasıl Olmalı?

Birçok veri bilimi projesinde geliştirilen bir makine öğrenmesi modelinin ne kadar başarılı olduğunu tespit edebilmek için genellikle çalışılan problemin türüyle ilgili hata metrikleri incelenir ve elde edilen sonuçlara göre modelin geliştirilmeye ihtiyacı olup/olmadığına karar verilir.

Peki sadece bu parametrelere bakmak bizim için yeterli mi?

  • Cevap kesinlikle HAYIR!

Makine öğrenmesi kendi içerisinde hepsi birbirinden önemli bazı işlem adımlarından oluşur. Şimdi de tam olarak ihtiyacımızı belirlemek için bu işlem adımlarının üzerinden tekrar geçelim.

1. Şirketin Sizden Talebini Anlama

Genellikle herkesin bildiği ancak özellikle temel seviye çalışmalarda birçok defa gözardı edilen bir aşamadır. Yapılan projenin gerçek hayatta kullanılabilir olması için bir sorunu çözmeye yardımcı olması veya hali hazırda yapılan bir işi daha kolay bir hale getirmesi gerektiğini asla unutmayın!

Görsel Cispros sitesinden alınmıştır

2. Veri Kaynağının Elde Edilmesi

Birçok veri bilimi projesinin internet üzerinden bulunan bir veri setiyle ya da ilgili veritabanındaki bilgiler kullanılarak yapıldığını görürüz. Ancak burada oldukça dikkat edilmesi gereken bir nokta var. Yaptığınız tüm çalışmalarda kendinize şu soruyu sormayı hiçbir zaman ihmal etmeyin:

  • Benim proje amacıma göre elimdeki veri seti ihtiyacımı karşılıyor mu?

Tek bir veri kaynağından yararlanarak proje yapmak bu işin en kolayı, ancak probleminize farklı bakış açıları katarak, çözüm önerinizi çok farklı bir seviyeye çıkarabilirsiniz. Burada da kritik olan nokta çevremizdeki veri kaynaklarının farkında olmak ve onlara hangi yollarla ulaşabileceğimizi bulmak!

Örneğin bir müşteri segmentasyonu çalışması yapıyorsanız yalnızca, veritabanınızda bulunan müşterilerinizle ilgili bilgileri kullanmakla kalmayıp gerçekten müşterilerinizi birbirinden ayırabilecek özellikleri tespit etmek için bir beyin fırtınası yapın.

İPUCU: Sosyal medya hareketlerinin, uğraşılan hobilerin, farklı yerlere yapılan seyahatlerin araştırılması gibi…

Görsel SAP sitesinden alınmıştır

3. Veri Kaynağının Uygunluğunun İrdelenmesi

Pekala, hangi bilgilere ihtiyacımız olduğunu araştırmamız gerektiğini de anlamış olduk. Ama burada çok dikkat etmemiz gereken bazı konular daha var. Bunlar nedir peki?

  • Kullandığınız veri kaynağının güncelliğini kontrol etmek! 2023 yılında yapacağınız bir çalışma için 2000’li yılların başlarında oluşturulan verileri kullanmak pek hoş sonuçlar doğurmayabilir 🙂
  • Dönemsellik faktörünü göz ardı etmeyin! Biz insanlar gün içerisinde bile bu kadar sık karar değiştirirken, tek düze üretilen çıktılar bizim amacımızı yeteri kadar nasıl destekleyebilir ki 🙂 Doğru anda doğru kişiye ulaşmak bu işin sırrı 🙂
  • Veri setinizde bulunan gözlemlerin gerçek hayattaki tüm senaryoları ne kadar başarılı temsil ettiğini incelemeyi unutmayın! Doğru hazırlanmış bir veri setinin sağlayacağı etkiyi hiçbir algoritmanın sağlayamayacağını aklınızdan çıkarmayın 🙂

4. Oluşturulan Modelin Başarısını Değerlendirme

İşte şimdi modellerimizin ürettiğini sonuçları inceleyerek kullanıma en uygun modele karar verebilir ve yolumuza devam edebiliriz.

NOT: Başarılı bir modeli sadece 1 kere üretmek de bizim için yeterli değil. Yukarıda da bahsettiğimiz gibi bu kadar hızlı değişen bir dünyada modellerin kendilerini yenilemesi, güncel kalması oldukça önemli 🙂

5. Ürünü Pazarlama

Muhtemelen bugüne kadar en azından bir kaç kere benim çalışmam onun çalışmasından daha iyiydi veya ödülü ben hakediyordum gibi sitemleriniz olmuştur. Tam da bu sebeple, en iyi projeyi geliştirmek de çoğu durumda beklenen başarılara ulaşılmasını sağlayamayabiliyor.

Bundan dolayı, geliştirdiğiniz ürüne kimlerin ihtiyacı olacağını ve bu ihtiyacı olan insanlara nasıl ulaşabilirim sorularını sormak da oldukça kritik bir eşik. Kendinizi her daim müşterinin yerine koyarak empati yapmak ya da potansiyel müşterilerinin taleplerini anlamak ise bunun en kolay çözüm yöntemi 🙂

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir