Machine Learning
Apache Ignite Machine Learning (ML), maliyetli veri aktarımları olmadan tahmine dayalı Makine Öğrenimi modellerinin oluşturulmasına olanak tanıyan, basit ve ölçeklenebilir bir araçtır.
Apache Ignite'a makine ve derin öğrenme (DL) eklemenin mantığı oldukça basittir. Günümüzün veri bilimcileri, makine öğrenimini genel kabul görmesini engelleyen iki ana faktörle uğraşmak zorundadır:
- İlk olarak, modeller eğitilir ve (eğitim bittikten sonra) farklı sistemlerde devreye alınır. Veri bilimcileri, verileri bir eğitim amacıyla Apache Mahout veya Apache Spark gibi bir sisteme taşımak için ETL veya başka bir veri aktarım sürecini beklemek zorundadır. Ardından, bu süreç tamamlanana kadar beklemeleri ve modelleri bir üretim ortamında yeniden dağıtmaları gerekir. Tüm süreç terabaytlarca veriyi bir sistemden diğerine taşımak saatler alabilir. Ayrıca eğitim kısmı genellikle eski veri seti üzerinden gerçekleşir.
- İkinci faktör ölçeklenebilirlik ile ilgilidir. Artık tek bir sunucu birimine sığmayan veri kümelerini işlemek zorunda olan ML ve DL algoritmaları sürekli olarak büyümektedir. Bu, veri bilimciyi sofistike çözümler bulmaya veya Apache Spark ve TensorFlow gibi dağıtılmış bilgi işlem platformlarına yönelmeye teşvik ediyor. Bununla birlikte, bu platformlar çoğunlukla yapbozun model eğitimi olan yalnızca bir bölümünü çözmektedir ve bu da, modellerin daha sonra üretimde nasıl konuşlandırılacağına karar vermeyi geliştiricilerin yükü haline getirmektedir.
Zero ETL and Massive Scalability
Ignite Machine Learning, Ignite'ın makine öğrenimi ve DL görevleri için büyük ölçeklenebilirlik sağlayan ve farklı sistemler arasında ETL tarafından dayatılan beklemeyi ortadan kaldıran bellek merkezli depolamasına dayanır. Örneğin, kullanıcıların bir Ignite kümesinde bellekte ve diskte depolanan veriler üzerinde doğrudan makine öğrenimi/öğrenim öğrenimi eğitimi ve çıkarımı yapmasına olanak tanır. Daha sonra, Ignite, Ignite'ın ortak konumlu dağıtılmış işlemesi için optimize edilmiş bir dizi makine öğrenimi ve DL algoritması sağlar. Bu uygulamalar, verilerin başka bir depoya taşınmasını gerektirmeden, büyük veri kümelerine karşı yerinde veya artımlı olarak gelen veri akışlarına karşı çalışırken bellek içi hız ve sınırsız yatay ölçeklenebilirlik sağlar. Veri hareketini ve uzun işlem bekleme sürelerini ortadan kaldıran Ignite Machine Learning, gerçek zamanlı olarak gelen en son verilere dayalı kararları iyileştirebilen sürekli öğrenmeyi mümkün kılar.Fault Tolerance and Continuous Learning
Apache Ignite Machine Learning, node hatalarına karşı toleranslıdır. Bu, öğrenme sürecindeki node arızaları durumunda, tüm kurtarma prosedürlerinin kullanıcı için şeffaf olacağı, öğrenme süreçlerinin kesintiye uğramayacağı ve tüm nodeların düzgün çalıştığı duruma benzer sürelerde sonuç alacağımız anlamına gelir. Daha fazla bilgi için lütfen Partition Based Dataset bölümüne bakın. Daha fazla bilgi için…