amd wmma komut seti nvidia tensor core a yanıttır

entry2 galeri1
    1.
  1. AMD'nin RDNA3 grafik fikri mülkiyeti (IP) çok yakın ve yaklaşan mimari hakkında daha fazla bilgi ediniyoruz. Tarihsel olarak, GPU'lar geliştikçe, şirketlerin belirli bir görevi hızlandırmak için özel donanım blokları eklemesi alışılmadık bir durum değildi. AMD mühendisleri bugün, LLVM derleyicisinin arka ucunu Dalga Matris Çarpma-Biriktirme (WMMA) adlı yeni bir talimatı içerecek şekilde güncelledi. Bu talimat, RDNA3 GPU mimarisi olan GFX11'de mevcut olacak. WMMA ile AMD, FP16 ve BF16 hassasiyet formatlarında 16x16x16 boyutundaki tensörlerin işlenmesi için destek sunacak. Bu talimatlarla AMD, matris çarpma-biriktirme işlemlerinin işlenmesini desteklemek için yeni düzenlemeler ekliyor. Bu, NVIDIA'nın Tensör Çekirdekleriyle yaptığı işi yakından taklit ediyor.

    AMD ROCm 5.2 API güncellemesi, aşağıda görebileceğiniz bu talimat türünün kullanım durumunu listeliyor:
    rocWMMA, matris çarpma ve biriktirme problemlerini parçalara ayırmayı ve bunları GPU dalga cepheleri arasında paralel olarak dağıtılan blok bazlı işlemlerde kullanmayı kolaylaştırmak için bir C++ API'si sağlar. API, GPU aygıt kodunun bir başlık kütüphanesidir; yani matris çekirdek hızlandırması doğrudan çekirdek aygıt kodunuza derlenebilir. Bu, çekirdek derlemesinin oluşturulmasında derleyici optimizasyonundan faydalanabilir ve harici çalışma zamanı kütüphanelerine bağlanma veya ayrı çekirdekler başlatma zorunluluğu gibi ek maliyetler doğurmaz.

    rocWMMA bir başlık kütüphanesi olarak yayınlanır ve C++ API'sinin örnek kullanımlarını doğrulamak ve göstermek için test ve örnek projeler içerir. Kütüphanenin yoğun geçmişi göz önüne alındığında, GEMM matris çarpımı birincil doğrulama olarak kullanılır. Ancak, kullanım portföyü önemli ölçüde büyümekte ve rocWMMA'nın farklı şekillerde tüketilebileceğini göstermektedir.
    https://galeri.uludagsozluk.com/r/2434579/+
    0 ...
  2. 2.
© 2025 uludağ sözlük