| google amcada biraz gezindim kimse mimd olduğunu idaa etmiyo ama simd olduğunu söyleyen çok var |
| Hesap gücüne baktığımızda SIMD şeklinde çalışan çekirdeklere sahip olduğu anlaşılıyor. |
Hesap gücüyle simd ilişkisini açıklayabilirmisin? Yada elinde bununla ilgili bi kaynak varsa oda olabilir. |
|
Bu MIMD denen çoklu veri paralelliği sağlayan çok çevrimli komut sistemi (tam Türkçe'si bu mu bilmiyorum), tek hassasiyetli işlemlerde 6 katın üzerinde performans sağlıyor gpu'ya. Çift hassasiyetli işlemlerde ise bu durum geçerli değil diye biliyorum. Zaten Fermi mimarisindeki soru işareti de burada doğuyor. Yaklaşık 3 TFlops işlem gücüne sahip gtx480. Ancak bu işlem gücü, çift hassasiyetli işlemler baz alınarak mı söyleniyor yoksa tek hassasiyetli işlemler mi? Bunu bilemiyorum. Şuan hd5870'in tek hassasiyetli işlem gücü 2,7 TFlops ve çift hassasiyetli işlem gücü ise 0,55 TFlops. Ati'nin akış işlemci sayısı çok yüksek olduğu için hd4800 serisi kartlar bile tek hassasiyetli işlem gücü baz alındığında gtx200'leri geçiyordu (hd4870 için 1,2 TFlops denirken gtx280 için 0,98 TFlops gibi bir rakam telaffuz ediliyordu. Tabi bu durum teorikti). Şuanda da benzer bir durum yaşanıyor. Tek gpu'da iki kartın da aritmatik işlem gücü benzer. Ama şu bir gerçek ki; Ati kartların önüne geçmiş olsaydı Nvidia, sağır sultana bile duyururdu bunu. Konuyla ilgili yazılmış makale vs. var mı bilmiyorum. Daha önce sanırım bir haberde bu konuya değinilmişti. |
| Demek istedğini anladım,okadar transistörle mimd kulansaydı arada performans olarak uçurum olurdu diyorsun yani özet olarak,yanlız şu tek kassasiyet çift hassasiyet olayını uzun zamandır merak ediyorum,nette çok araştırdım ama bununla ilgili bişey bulamadım yada gözümden kaçtı,bi bilgin varmı bu konuda,işlem yapılan veri tipi boyutuyla alakalı bişeymi?Yani 32bit uzunluğundaki veri tipiyle 64bit uzunluğundaki veri tipi gibi? |
|
|
O konuda ufak da olsa bir bilgim var ama grafik işlemcilerin yapabildiği işlemler için de geçerli mi tam bilmiyorum. Yazılım dilinde sayısal veriler için hassasiyet kavramı vardır. Bir aritmatik işleminde bulunan sayılar tam sayı değil ise programın çalışabilmesi için işlenecek sayı bilgisinin hassasiyeti belirlenmelidir. Tek hassasiyetli sayı verilerine virgülden sonra 8 sayı, çift hassasiyetli sayı verilerine ise virgülden sonra 15 sayı ile değişken atamak ve işleme sokmak mümkündür (yanlış hatırlıyor olabilirim). Yani çift hassasiyetli sayılar karmaşık yapıları sebebiyle daha fazla işlem gücünü gereksinim duyarlar. Ancak günümüzde ekran kartları (esas isimleri çizim kartıdır), çizim yaparken matris kullanırlar. Matris kayar nokta hesaplamaları için gerekli olan işlemdir. Tabi bir de poligon olarak adlandırdığımız, değişken üçgenler vardır ki bunlarda analitik düzlemde oluşturulur. Şöyle: x, y olarak bildiğimiz analitik düzlemde 3 boyutlu görüntünün oluşabilmesi için derinlik bilgisini verecek z düzlemi bulunur. Üçgenin üç noktasının da koordinatları matris ile hesaplanır ve analitik düzlemdeki yerini alır. Bir nokta yer değiştirdiğinde, değişen koordinatlar otomatik olarak diğer noktaların koordinatlarının da değişmesini matris ile sağlar. Bu nokta da hesaplama gücü oldukça önemlidir. Şöyle söyleyeyim; GT5 adlı PS3 oyununda her araç 200.000 poligon ile oluşturulmaktadır. Bu sebepten ekranda gördüğümüz tüm araç ve nesneler için çok yüksek sayılarda poligon hesaplaması yapılır ki, bunlar da zaten belirttiğim üzere değişen (koordinatları değişmekte olan/noktaları kayan) üçgenlerdir. Kayan nokta hesaplama deyimi de buradan gelir (Flops [FLoating Point Operations Per Second/Saniye başına düşen kayan nokta işlemi]). Bu hesabı yapan birimlere de MADD ve MULL adı veriliyor. MADD denen birimde 2 adet aritmatik işlemci vardır, MULL'da ise tektir ve bildiğim kadarıyla her durumda çalışmaz (Bu bahsettiğim birimler Nvidia'nın 8 ve sonraki serileri için geçerlidir). Hızları, shader hızına bağlıdır (nv40 ve g70 [GeForce 6 ve 7] mimarisinde vertex shader'ların hızına bağlıydılar). Ati de ise MULL denen bir birim yok diye biliyorum. Aritmatik işlem gücü akış işlemcilerindeki MADD birimleri ile sağlanıyor ki bu da Nvidia'da 3 birim olabilecekken Ati'de 2 olduğunu gösteriyor. Tabi mimari farkları da bu işlem gücünü belirliyor. Diğer mesajımda söylemiştim, Ati kartların akış işlemci sayısı oldukça fazladır. Her iş hattında biri kapsamlı olmak üzere 5 adet akış işlemcisi bulunur Ati'nin R600 (şuan hâlâ kullandığı) mimarisinde iş hattı başına 2(MADD) x 5(akış işlemcisi) x 850(işlemci hızı) şeklinde hesaplanır. Toplamda ise 320 adet iş hattına sahip olması sebebiyle hd5870 için 320 x 5 x 2 x 850 = 2720000 MFlops işlem gücü bulunur. Bu da o bahsettiğimiz tek hassasiyetli işlem gücü olmaktadır. Nvidia'da ise unified shader (tümleşik tarayıcı/karartıcı) mimarisi ile biraz daha farklı bir tablo çizer. 480(CUDA çekirdeği) x (2(MADD) + 1(MULL)) x 1400(shader hızı) = 2016000 MFlops değerini buluruz. Tabi bir de MULL biriminin kullanılamadığı hesaplamalar var ki o zaman bu işlem gücü daha da düşecektir. Yapılarının farkı, oyunlardaki kullanımı veya programlardaki kullanımı, durumlarını belirler vs... Tabi bir de doku kaplama vs. hadiseler var ki; taaa ilk nesil ekran kartlarına kadar konuyu taşımamız gerekir. Ayrıntıya girersek çıkamayız. @Mete Can Karahasan Gecenin bir vakti yazınca, oluyor öyle yanlışlar. |
two 16-way SIMD units (the 32 “cores”): 32 FMA FP32s, 32 ADD INT32s, 16 MUL INT32s, 16 FMA FP64s - a quadruple SFU unit: 4 FP32 special functions or 16 interpolations - a 16-way 32-bit Load/Store unit fermilerde 1sm kümesinde 32core x16 küme olduğundan =512cuda 1tanesi kapatıldı biliyorsunuz gtx 480de=480 gtx 470de=448 gtx 460da=336 gtx 480 ve 470 16 PolyMorph motoruna sahip gtx 460da 8adet var PolyMorph buda yarı yarıya tess performansı kaybı demektir ama real testlerde vs böyle kayıp yok nvidia bunu nasıl aştı bilmiyorum @anni nerdesin jensene sor şunu sanırım 1920x1080çöznlükten sonra asıl kaybı daha etkin görcez tess performansda gpu hızlarına çok iyi tepki veriyor oyunlarda çünkü gpuları çok verimli asıl gücü daha iyi tek döngüde 336 sm daha iyi gpu hızıyla shader üniteleirn daha iyi tess performansını artırcağını hesapladılar ve bu yeterli görüldü sanırım... |
|
mimd yok benim bildigim ve ati şu anda mimd uzerine calisiyor galiba oyle bir soylenti vardi eger mimd basarilabilirse ben cok yuksek performans artisi bekliyorum bu arada bu kelimelerin acilimlari bilmeyenler icin Single instruction, multiple data (SIMD) (tek komut coklu veri) MIMD (Multiple Instruction stream, Multiple Data stream) (coklu komut coklu veri inanilmaz zor basarmasi fakat cok yüksek verim ve performans) |
|
birisi fermilerin mimd gibi davranan simd olduğundan bahsediyordu |
blacksmoke kardeşim bu tür faydalı konular açarak bilgilenmemizi sağladığın için teşekkür ederim |
|
Internet'de GF100'deki çekirdek yapısının MIMD olduğundan pek bahsedilmiyor, SIMD olsada GT200'dekinden farklı elbette. @ M@U Ati'deki akış işlemcilerinden 1 tanesi kapsamlı diğerleri daha ufak. HD 5870'in 2.7 teraflop işlem gücü üretmesi için diğer 4 tanesinin herbiri kapsamlı ile aynı hesaplama gücünü üretiyor olması lazım, orasıda biraz karışık. |
Fermiler mimd arkadaşlar, Nvidia'nın daha erken olarak sunduğu bir avantaj ama çok bir farkını gördüğümüzü sanmıyorum. Demircibu şu tablolardan ne anlamamız gerektiğini anlatabilir misin? < Resime gitmek için tıklayın >< Resime gitmek için tıklayın >< Resime gitmek için tıklayın > Bu da fermilerin tflops gücünü görebileceğiniz tablo, gtx480 2tflops bile değil: < Resime gitmek için tıklayın >< Resime gitmek için tıklayın > < Resime gitmek için tıklayın > < Resime gitmek için tıklayın > < Resime gitmek için tıklayın > Burada da antialiasing ayarları kıyaslandığında kartların z örnekleme performansı - ne ilginçtir ki ATilerin performansı 2x-4x-8x diye gittikçe %40 artıyor: < Resime gitmek için tıklayın > |
|
Mete Can verdiğin linkler boş çıkıyor sanırım linkler kırık tabloda veri olmadığından yorum yapamıcam yazıları yaz yorumlarız yine fr uzantılı site fransızcamda yok |
| Bağlantıları tinypic'e yükledim, açılıyorlar şimdi. |
| Fermiler MIMD nvidia ilk kullandı bu özelliği hatta fx57 haberlerindede geçiyordu fermiler çıkmadan önce |
|
Ben de MIMD diye biliyorum. CUDA da programlama yaparken kernel denen c programlama dilinde kullanılan fonksiyon tipine benzeyen ozel bir fonksiyon kullanılıyor. Fermı de kart uzerınde ıkı farklı kernel ıslem yapabılıyor. Örneğın işlemcilerin bir kısmı toplama yaparken diğerleri çarpma işlemi yapabiliyor. GTX200 ler de ve Radeonlarda tek bir kernel kullanabiliyorsunuz, yanı önce toplamayı bitirmeniz gerekiyor, sonra carpma işlemini yapan kernel yükleniyor. Birden fazla kernel kullanmak Multıple Instructıon Multı Data olmasını sağlıyor. Diğer kartlar tek kernel çalıştırabildiği için single instructıon Multiple Data olarak adlandırılıyor |
Fx57 nin haberi Gt300 mimarisi cikacak seklindeydi. O zaman bu teknolojinin gelecegini söylüyorlardi. Ama bu gerceklesmedi sanirim. Gf100 ler geldi piyasaya. O zaman cok haberler dönüyordu piyasada. |
| Bende MIMD diye bilyiorum fermileri. |
DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.
Üye Ol Şimdi DeğilÜye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.