sadece rx 7900 xt-xtx,
ve rx 9070-xt sürümünde çalışan 6.3.3 sürümüyle modellerin yüklenme süresi,
ve saniye başına düşen iterasyonda müthiş bir artış söz konusu.
rdna 4.0 bu konuda çığır açmış.
avarel gibi windows ta destekleniyor diye uğraşmayın boşuna. benim çabam tamamen hüsranla neticelendi. üçüncü parti uygulamalar, şirket tarafından desteklenmediği için, yazılımların kendi içinde istediği python, pip, xformers, onnx modülleri bile sürekli olarak çakışıyor ve error veriyor. venv le yatıp venvle kalkıyorsunuz.
grafik yönüyle rtx 4080, rtx 4070 ti muadili ekran kartım sırf bu yüzden ai uygulamalarında düşük performans sergiliyor.
nvidia nın cuda sını kullanmak yerine, microsoft un directml si ile cebelleştim bayağı bir süre.
ROCm (Radeon Open Compute), AMD tarafından geliştirilmiş bir açık kaynak yazılım platformudur. ROCm, yüksek performanslı hesaplama (HPC) ve derin öğrenme gibi alanlarda AMD GPU'larının kullanılmasını sağlar. Aşağıda ROCm'in temel bileşenlerini, kullanım alanlarını ve kurulumu hakkında detaylı bilgi bulabilirsiniz.
ROCm'in Temel Bileşenleri
HIP (Heterogeneous-Compute Interface for Portability):
HIP, CUDA kodlarının AMD GPU'larında çalıştırılabilmesi için geliştirilmiş bir API'dir. HIP sayesinde CUDA tabanlı uygulamalar, minimum değişiklikle AMD GPU'larında çalıştırılabilir.
ROCr Runtime:
ROCr, ROCm'nin temel çalışma zamanı (runtime) bileşenidir. Bu bileşen, GPU'nun düşük seviyeli kontrolünü sağlar ve GPU üzerinde çalışan uygulamalara erişim sunar.
ROCm Libraries:
ROCm, çeşitli bilimsel ve derin öğrenme uygulamaları için optimize edilmiş kütüphaneler sunar. Bu kütüphaneler arasında ROCm BLAS, ROCm FFT, ROCm Random Number Generation (RNG) ve ROCm Sparse bulunur.
MIOpen:
AMD'nin derin öğrenme için optimize edilmiş kütüphanesidir. MIOpen, Convolutional Neural Networks (CNN'ler) gibi derin öğrenme modellerinin hızlandırılması için kullanılır.
ROCm Compiler (HCC ve LLVM):
ROCm, hem HCC (Heterogeneous Compute Compiler) hem de LLVM derleyicisini kullanır. Bu derleyiciler, HIP kodlarını ve diğer ROCm bileşenlerini AMD GPU'ları için derler.
ROCm Kernel Support:
ROCm, Linux kerneline eklenmiş ROCm sürücüleri ve modüllerle uyumlu çalışır. Bu sürücüler, GPU donanımıyla etkileşimi sağlar.
ROCm'in Kullanım Alanları
Derin Öğrenme:
ROCm, TensorFlow, PyTorch gibi popüler derin öğrenme framework'leriyle entegre çalışabilir. ROCm üzerinde çalışan MIOpen ve ROCm DNN gibi kütüphaneler, GPU performansını optimize eder.
Yüksek Performanslı Hesaplama (HPC):
ROCm, HPC uygulamaları için geniş çapta kullanılabilir. ROCm, paralel hesaplama gerektiren büyük veri analizleri, simülasyonlar ve bilimsel hesaplamalar için optimize edilmiştir.
Bilimsel Hesaplamalar:
ROCm, biyoinformatik, finansal modelleme ve diğer bilimsel hesaplamalar için kullanılabilir. ROCm, büyük veri kümelerini hızlı bir şekilde işlemek için GPU gücünü kullanır.