Fermi Ekran Kartları MIMD mi SIMD mi?

15 yıl (9326 mesaj)

Yarbay

Konu Sahibi

internette araştırdım kesin ve net bilgiye ulaşamadım. bu işin uzmanı arkadaşlar fermi mimarisinde mimd kullanıyor mu yoksa bir başka bahara mı kaldı?

DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.

Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.

Üye Ol Şimdi Değil

Bir Daha Gösterme

A

atyay

15 yıl (1348 mesaj)

Binbaşı

google amcada biraz gezindim kimse mimd olduğunu idaa etmiyo ama simd olduğunu söyleyen çok var

M

M@U

15 yıl (6946 mesaj)

Yarbay

Hesap gücüne baktığımızda SIMD şeklinde çalışan çekirdeklere sahip olduğu anlaşılıyor.

Bu mesaja 1 cevap geldi.

A

atyay

15 yıl (1348 mesaj)

Binbaşı

quote:

Orijinalden alıntı: M@U

Hesap gücüne baktığımızda SIMD şeklinde çalışan çekirdeklere sahip olduğu anlaşılıyor.

Hesap gücüyle simd ilişkisini açıklayabilirmisin?
Yada elinde bununla ilgili bi kaynak varsa oda olabilir.

M

M@U

15 yıl (6946 mesaj)

Yarbay

Bu MIMD denen çoklu veri paralelliği sağlayan çok çevrimli komut sistemi (tam Türkçe'si bu mu bilmiyorum), tek hassasiyetli işlemlerde 6 katın üzerinde performans sağlıyor gpu'ya. Çift hassasiyetli işlemlerde ise bu durum geçerli değil diye biliyorum. Zaten Fermi mimarisindeki soru işareti de burada doğuyor. Yaklaşık 3 TFlops işlem gücüne sahip gtx480. Ancak bu işlem gücü, çift hassasiyetli işlemler baz alınarak mı söyleniyor yoksa tek hassasiyetli işlemler mi? Bunu bilemiyorum. Şuan hd5870'in tek hassasiyetli işlem gücü 2,7 TFlops ve çift hassasiyetli işlem gücü ise 0,55 TFlops. Ati'nin akış işlemci sayısı çok yüksek olduğu için hd4800 serisi kartlar bile tek hassasiyetli işlem gücü baz alındığında gtx200'leri geçiyordu (hd4870 için 1,2 TFlops denirken gtx280 için 0,98 TFlops gibi bir rakam telaffuz ediliyordu. Tabi bu durum teorikti). Şuanda da benzer bir durum yaşanıyor. Tek gpu'da iki kartın da aritmatik işlem gücü benzer. Ama şu bir gerçek ki; Ati kartların önüne geçmiş olsaydı Nvidia, sağır sultana bile duyururdu bunu.

Konuyla ilgili yazılmış makale vs. var mı bilmiyorum. Daha önce sanırım bir haberde bu konuya değinilmişti.

< Bu mesaj bu kişi tarafından değiştirildi M@U -- 24 Temmuz 2010; 0:38:25 >
Bu mesaja 1 cevap geldi.

A

atyay

15 yıl (1348 mesaj)

Binbaşı

Demek istedğini anladım,okadar transistörle mimd kulansaydı arada performans olarak uçurum olurdu diyorsun yani özet olarak,yanlız şu tek kassasiyet çift hassasiyet olayını uzun zamandır merak ediyorum,nette çok araştırdım ama bununla ilgili bişey bulamadım yada gözümden kaçtı,bi bilgin varmı bu konuda,işlem yapılan veri tipi boyutuyla alakalı bişeymi?Yani 32bit uzunluğundaki veri tipiyle 64bit uzunluğundaki veri tipi gibi?

Bu mesaja 2 cevap geldi.

M

Mete Can Karahasan

15 yıl (21124 mesaj)

Yarbay

quote:

Yaklaşık 3 TFlops işlem gücüne sahip gtx480

Bu kısmı kanıtlarsan çok iyi olur çünkü yanlış olduğunu biliyorum

M

M@U

15 yıl (6946 mesaj)

Yarbay

O konuda ufak da olsa bir bilgim var ama grafik işlemcilerin yapabildiği işlemler için de geçerli mi tam bilmiyorum.

Yazılım dilinde sayısal veriler için hassasiyet kavramı vardır. Bir aritmatik işleminde bulunan sayılar tam sayı değil ise programın çalışabilmesi için işlenecek sayı bilgisinin hassasiyeti belirlenmelidir. Tek hassasiyetli sayı verilerine virgülden sonra 8 sayı, çift hassasiyetli sayı verilerine ise virgülden sonra 15 sayı ile değişken atamak ve işleme sokmak mümkündür (yanlış hatırlıyor olabilirim). Yani çift hassasiyetli sayılar karmaşık yapıları sebebiyle daha fazla işlem gücünü gereksinim duyarlar.

Ancak günümüzde ekran kartları (esas isimleri çizim kartıdır), çizim yaparken matris kullanırlar. Matris kayar nokta hesaplamaları için gerekli olan işlemdir. Tabi bir de poligon olarak adlandırdığımız, değişken üçgenler vardır ki bunlarda analitik düzlemde oluşturulur. Şöyle:

x, y olarak bildiğimiz analitik düzlemde 3 boyutlu görüntünün oluşabilmesi için derinlik bilgisini verecek z düzlemi bulunur. Üçgenin üç noktasının da koordinatları matris ile hesaplanır ve analitik düzlemdeki yerini alır. Bir nokta yer değiştirdiğinde, değişen koordinatlar otomatik olarak diğer noktaların koordinatlarının da değişmesini matris ile sağlar. Bu nokta da hesaplama gücü oldukça önemlidir. Şöyle söyleyeyim; GT5 adlı PS3 oyununda her araç 200.000 poligon ile oluşturulmaktadır. Bu sebepten ekranda gördüğümüz tüm araç ve nesneler için çok yüksek sayılarda poligon hesaplaması yapılır ki, bunlar da zaten belirttiğim üzere değişen (koordinatları değişmekte olan/noktaları kayan) üçgenlerdir. Kayan nokta hesaplama deyimi de buradan gelir (Flops [FLoating Point Operations Per Second/Saniye başına düşen kayan nokta işlemi]). Bu hesabı yapan birimlere de MADD ve MULL adı veriliyor. MADD denen birimde 2 adet aritmatik işlemci vardır, MULL'da ise tektir ve bildiğim kadarıyla her durumda çalışmaz (Bu bahsettiğim birimler Nvidia'nın 8 ve sonraki serileri için geçerlidir). Hızları, shader hızına bağlıdır (nv40 ve g70 [GeForce 6 ve 7] mimarisinde vertex shader'ların hızına bağlıydılar).

Ati de ise MULL denen bir birim yok diye biliyorum. Aritmatik işlem gücü akış işlemcilerindeki MADD birimleri ile sağlanıyor ki bu da Nvidia'da 3 birim olabilecekken Ati'de 2 olduğunu gösteriyor. Tabi mimari farkları da bu işlem gücünü belirliyor. Diğer mesajımda söylemiştim, Ati kartların akış işlemci sayısı oldukça fazladır. Her iş hattında biri kapsamlı olmak üzere 5 adet akış işlemcisi bulunur Ati'nin R600 (şuan hâlâ kullandığı) mimarisinde iş hattı başına 2(MADD) x 5(akış işlemcisi) x 850(işlemci hızı) şeklinde hesaplanır. Toplamda ise 320 adet iş hattına sahip olması sebebiyle hd5870 için 320 x 5 x 2 x 850 = 2720000 MFlops işlem gücü bulunur. Bu da o bahsettiğimiz tek hassasiyetli işlem gücü olmaktadır.

Nvidia'da ise unified shader (tümleşik tarayıcı/karartıcı) mimarisi ile biraz daha farklı bir tablo çizer. 480(CUDA çekirdeği) x (2(MADD) + 1(MULL)) x 1400(shader hızı) = 2016000 MFlops değerini buluruz. Tabi bir de MULL biriminin kullanılamadığı hesaplamalar var ki o zaman bu işlem gücü daha da düşecektir.

Yapılarının farkı, oyunlardaki kullanımı veya programlardaki kullanımı, durumlarını belirler vs...

Tabi bir de doku kaplama vs. hadiseler var ki; taaa ilk nesil ekran kartlarına kadar konuyu taşımamız gerekir. Ayrıntıya girersek çıkamayız.

@Mete Can Karahasan

Gecenin bir vakti yazınca, oluyor öyle yanlışlar.

< Bu mesaj bu kişi tarafından değiştirildi M@U -- 24 Temmuz 2010; 3:23:23 >

D

demircibu

15 yıl (51160 mesaj)

Yarbay

quote:

Orijinalden alıntı: blacksmoke

internette araştırdım kesin ve net bilgiye ulaşamadım. bu işin uzmanı arkadaşlar fermi mimarisinde mimd kullanıyor mu yoksa bir başka bahara mı kaldı?

two 16-way SIMD units (the 32 “cores”): 32 FMA FP32s, 32 ADD INT32s, 16 MUL INT32s, 16 FMA FP64s
- a quadruple SFU unit: 4 FP32 special functions or 16 interpolations
- a 16-way 32-bit Load/Store unit

fermilerde 1sm kümesinde 32core x16 küme olduğundan =512cuda 1tanesi kapatıldı biliyorsunuz

gtx 480de=480
gtx 470de=448
gtx 460da=336

gtx 480 ve 470 16 PolyMorph motoruna sahip

gtx 460da 8adet var PolyMorph buda yarı yarıya tess performansı kaybı demektir ama real testlerde vs böyle kayıp yok nvidia bunu nasıl aştı bilmiyorum @anni nerdesin jensene sor şunu

sanırım 1920x1080çöznlükten sonra asıl kaybı daha etkin görcez tess performansda
gpu hızlarına çok iyi tepki veriyor oyunlarda çünkü gpuları çok verimli asıl gücü daha iyi tek döngüde

336 sm daha iyi gpu hızıyla shader üniteleirn daha iyi tess performansını artırcağını hesapladılar ve bu yeterli görüldü sanırım...

< Bu mesaj bu kişi tarafından değiştirildi demircibu -- 24 Temmuz 2010; 4:11:49 >
Bu mesaja 2 cevap geldi.

C

CeFurkan

15 yıl (17432 mesaj)

Yarbay

mimd yok benim bildigim ve ati şu anda mimd uzerine calisiyor galiba

oyle bir soylenti vardi

eger mimd basarilabilirse ben cok yuksek performans artisi bekliyorum

bu arada bu kelimelerin acilimlari bilmeyenler icin

Single instruction, multiple data (SIMD) (tek komut coklu veri)

MIMD (Multiple Instruction stream, Multiple Data stream) (coklu komut coklu veri inanilmaz zor basarmasi fakat cok yüksek verim ve performans)

Bu mesaja 1 cevap geldi.

R

Rusty

15 yıl (2038 mesaj)

Binbaşı

birisi fermilerin mimd gibi davranan simd olduğundan bahsediyordu

, birazdan gelir konuya

Bu mesaja 1 cevap geldi.

E

El Mukteda

15 yıl (21000 mesaj)

Yarbay

blacksmoke kardeşim bu tür faydalı konular açarak bilgilenmemizi sağladığın için teşekkür ederim

Bu mesaja 1 cevap geldi.

C

Cpt. Miller

15 yıl (16789 mesaj)

Yarbay

Internet'de GF100'deki çekirdek yapısının MIMD olduğundan pek bahsedilmiyor, SIMD olsada GT200'dekinden farklı elbette.

@ M@U
Ati'deki akış işlemcilerinden 1 tanesi kapsamlı diğerleri daha ufak. HD 5870'in 2.7 teraflop işlem gücü üretmesi için diğer 4 tanesinin herbiri kapsamlı ile aynı hesaplama gücünü üretiyor olması lazım, orasıda biraz karışık.

< Bu mesaj bu kişi tarafından değiştirildi Cpt. Miller -- 25 Temmuz 2010; 7:55:37 >

M

Mete Can Karahasan

15 yıl (21124 mesaj)

Yarbay

quote:

Orijinalden alıntı: demircibu

quote:

Orijinalden alıntı: blacksmoke

internette araştırdım kesin ve net bilgiye ulaşamadım. bu işin uzmanı arkadaşlar fermi mimarisinde mimd kullanıyor mu yoksa bir başka bahara mı kaldı?

two 16-way SIMD units (the 32 “cores”): 32 FMA FP32s, 32 ADD INT32s, 16 MUL INT32s, 16 FMA FP64s
- a quadruple SFU unit: 4 FP32 special functions or 16 interpolations
- a 16-way 32-bit Load/Store unit

fermilerde 1sm kümesinde 32core x16 küme olduğundan =512cuda 1tanesi kapatıldı biliyorsunuz

gtx 480de=480
gtx 470de=448
gtx 460da=336

gtx 480 ve 470 16 PolyMorph motoruna sahip

gtx 460da 8adet var PolyMorph buda yarı yarıya tess performansı kaybı demektir ama real testlerde vs böyle kayıp yok nvidia bunu nasıl aştı bilmiyorum @anni nerdesin jensene sor şunu
sanırım 1920x1080çöznlükten sonra asıl kaybı daha etkin görcez tess performansda
gpu hızlarına çok iyi tepki veriyor oyunlarda çünkü gpuları çok verimli asıl gücü daha iyi tek döngüde

336 sm daha iyi gpu hızıyla shader üniteleirn daha iyi tess performansını artırcağını hesapladılar ve bu yeterli görüldü sanırım...

Fermiler mimd arkadaşlar, Nvidia'nın daha erken olarak sunduğu bir avantaj ama çok bir farkını gördüğümüzü sanmıyorum.
Demircibu şu tablolardan ne anlamamız gerektiğini anlatabilir misin?
< Resime gitmek için tıklayın >< Resime gitmek için tıklayın >< Resime gitmek için tıklayın >
Bu da fermilerin tflops gücünü görebileceğiniz tablo, gtx480 2tflops bile değil:
< Resime gitmek için tıklayın >< Resime gitmek için tıklayın >
< Resime gitmek için tıklayın >
< Resime gitmek için tıklayın >
< Resime gitmek için tıklayın >
Burada da antialiasing ayarları kıyaslandığında kartların z örnekleme performansı - ne ilginçtir ki ATilerin performansı 2x-4x-8x diye gittikçe %40 artıyor:
< Resime gitmek için tıklayın >

< Bu mesaj bu kişi tarafından değiştirildi Mete Can Karahasan -- 24 Temmuz 2010; 18:32:08 >
Bu mesaja 1 cevap geldi.

D

demircibu

15 yıl (51160 mesaj)

Yarbay

Mete Can verdiğin linkler boş çıkıyor sanırım linkler kırık

tabloda veri olmadığından yorum yapamıcam yazıları yaz yorumlarız yine fr uzantılı site fransızcamda yok

Bu mesaja 1 cevap geldi.

M

Mete Can Karahasan

15 yıl (21124 mesaj)

Yarbay

Bağlantıları tinypic'e yükledim, açılıyorlar şimdi.

G

Guest-0245653D0

15 yıl (8415 mesaj)

Yarbay

Fermiler MIMD nvidia ilk kullandı bu özelliği hatta fx57 haberlerindede geçiyordu fermiler çıkmadan önce

Bu mesaja 2 cevap geldi.

R

RCox

15 yıl (1026 mesaj)

Yüzbaşı

Ben de MIMD diye biliyorum.

CUDA da programlama yaparken kernel denen c programlama dilinde kullanılan fonksiyon tipine benzeyen ozel bir fonksiyon kullanılıyor. Fermı de kart uzerınde ıkı farklı kernel ıslem yapabılıyor. Örneğın işlemcilerin bir kısmı toplama yaparken diğerleri çarpma işlemi yapabiliyor. GTX200 ler de ve Radeonlarda tek bir kernel kullanabiliyorsunuz, yanı önce toplamayı bitirmeniz gerekiyor, sonra carpma işlemini yapan kernel yükleniyor. Birden fazla kernel kullanmak Multıple Instructıon Multı Data olmasını sağlıyor. Diğer kartlar tek kernel çalıştırabildiği için single instructıon Multiple Data olarak adlandırılıyor

S

sakiri

15 yıl (3530 mesaj)

Yarbay

quote:

Orijinalden alıntı: DEATH71

Fermiler MIMD nvidia ilk kullandı bu özelliği hatta fx57 haberlerindede geçiyordu fermiler çıkmadan önce

Fx57 nin haberi Gt300 mimarisi cikacak seklindeydi. O zaman bu teknolojinin gelecegini söylüyorlardi. Ama bu gerceklesmedi sanirim. Gf100 ler geldi piyasaya. O zaman cok haberler dönüyordu piyasada.

Bu mesaja 2 cevap geldi.

E

emir.ksk

15 yıl (16813 mesaj)

Yarbay

Bende MIMD diye bilyiorum fermileri.