Arama butonu
Bu konudaki kullanıcılar: 1 misafir
37
Cevap
1488
Tıklama
0
Öne Çıkarma
Yeni Benchmark Programı - Cuda RayTracer
H
12 yıl
Yüzbaşı
Konu Sahibi

Kendi yazdığım benchmark programını paylaşıyorum skorları paylaşırsanız sevinirim.


Buradan indirebilirsiniz: İndir


Program şimdilik çok ham durumda vaktim oldukça geliştirmeye çalışırım bu haliylede kalabilir emin değilim Program CUDA'da yazıldığı için şimdilik sadece GeForce (tesla, quadro varsa onlarda olur )kartları destekliyor.


RayTracerV0.1.exe'yi tıkladıktan sonra beyaz ekranda 1, 2 ya da 3'ü tıklıyoruz.
1 - tek thread CPU
2 - tek GPU
3 - 2 GPU (varsa)


Bir kaç kere deneyip en iyi skoru yazabilirsiniz.

Skorları burada sıralıyorum:

Tek Kart GPU


GTX 580 (core: 1GHz): 5396 (arbiter)
GTX 570 (core: 950): 4779 (Kir$of)
GTX 480 (925 / 4200): 4729 (Abazzers)
GTX Titan (Stok hız): 3827 (Aydindril)
GTX Titan (Stok hız): 3776 (Hanibal187)
GTX 480 (stok): 3597 (Abazzers)
GTX 680 (stok): 2895 (DeviL's)
GTX 680 (Stok hız): 2779 (SpecturA)
GTX 670 (stok): 2536 (mur88)
GTX 670 (stok): 2520 (kaan0101)
GTX 660TI (Stok hız): 2492 (kaan0101)
GTX 690 (Stok): 2480 (rezes)
GTX 690 (+111 GPU, +400 VRAM) 2488 (rezes)


Çift Kart GPU

GTX 580SLI (stok): 10378 (arbiter)
GTX Titan (Stok hız): 7055 (Hanibal187)
GTX 680 (Stok hız): 5270 (SpecturA)
GTX 670SLI (stok): 4826 (mur88)
GTX 690 (Stok): 4783 (rezes)
GTX 690 (+111 GPU, +400 VRAM) 4800 (rezes)

CPU

3930K @4.160GHz: 100.3 (Hanibal187)
3930K @4.290GHz: 103 (SpecturA)


< Resime gitmek için tıklayın >

DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.

Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.

Üye Ol Şimdi Değil





< Bu mesaj bu kişi tarafından değiştirildi hanibal187 -- 30 Nisan 2013; 21:21:49 >


Bu mesajda bahsedilenler: @rezes , @Poyri!!! , @SpecturA , @B.M.W , @Aydindril , @A35A , @kaan0101
S
12 yıl
Yüzbaşı

Buna en kısa zamanda bi UI da yapmak gerek


Bu mesaja 1 cevap geldi.
K
12 yıl
Yarbay

biri testmi dedi severim testleri en kısa zamanda 660ti-670 skorları atarım :D ellerine sağlık dostum forumda böyle şeyler görmek cidden güzel


Bu mesaja 1 cevap geldi.
K
12 yıl
Yarbay

quote:

Orijinalden alıntı: kaan0101

biri testmi dedi severim testleri en kısa zamanda 660ti-670 skorları atarım :D ellerine sağlık dostum forumda böyle şeyler görmek cidden güzel

ben sizden genelde amd kartların testlerini beklerdim. şaşırdım.


nvidia resmin altına amd kartları yakışmış.



K
12 yıl
Yarbay

oraya nvidialarda gelecek

edit

660ti stock 2492

< Resime gitmek için tıklayın >





< Bu mesaj bu kişi tarafından değiştirildi kaan0101 -- 28 Nisan 2013; 0:01:13 >
Bu mesaja 2 cevap geldi.

Bu mesajda bahsedilenler: @kaskas123
H
12 yıl
Yüzbaşı
Konu Sahibi

sağolasın kaan



K
12 yıl
Yarbay

gtx670 : 2520

i72600k :107

< Resime gitmek için tıklayın >


Bu mesaja 1 cevap geldi.

Bu mesajda bahsedilenler: @hanibal187
R
12 yıl
Yarbay

Tebrik ederim haydi! hayırlısı bakalım

2500K@4.9Ghz CPU biraz fazla oynak gibi. bazen 115 bazen 118 skor alıyor!! @hanibal187

default--------------------------------------------------------OC +111Mhz GPU +400Mhz Vram
< Resime gitmek için tıklayın > < Resime gitmek için tıklayın >





< Bu mesaj bu kişi tarafından değiştirildi rezes -- 28 Nisan 2013; 4:07:32 >
Bu mesaja 1 cevap geldi.

Bu mesajda bahsedilenler: @hanibal187
A
12 yıl
Binbaşı

bendede bu çıktı. sıfır overclock ile. müsait olunca overclocklu koyacağım.

3970x @ default
titan @ default

< Resime gitmek için tıklayın >


Bu mesaja 1 cevap geldi.
A
12 yıl
Yarbay

gtx 480 performansına gerçekten çok saşırcaksınız gtx 580 vs. bu skorları alamaz.biliyorsunuz fermi gf100 cuda hesaplama özellikleriyle öne çıkan bir gpu mimarisiydi.gtx 580 de cuda hesaplamaları yapan bölüm gpu dan çıkarıldı, oyun performansına önem verildi diye biliyorum.kısacası gtx 480 cuda hesaplamaları için mükemmel bir kart, ve benzeri yok

driver sürümü : 320.00 beta

gtx 480 @ stock : 3597 puan

< Resime gitmek için tıklayın >

gtx 480 @ 925 / 4200 overclock : 4729 puan

< Resime gitmek için tıklayın >





< Bu mesaj bu kişi tarafından değiştirildi Abazzers -- 28 Nisan 2013; 6:20:30 >
Bu mesaja 1 cevap geldi.
A
12 yıl
Yarbay

güzel ve basitçe gpu ham gücünü gösteren bir test tebrikler.

tek kart 5396
slı 10378


Bu mesaja 1 cevap geldi.
H
12 yıl
Yüzbaşı
Konu Sahibi

Hepinize teşekkür ederim.

Program gpuyu full utilize edemiyor şimdilik o nsight profilerla kullanımı inceleyip farklı arhitecturelara göre bişeyler ayarlamaya bakcam artık (tesla, fermi ve kepler için farklı thread block sayısı hesabı gerekiyor ama aynı architecturelar içinde sonuçlar tutarlı en azından ).


Fermi architecture'da daha iyi çalışıyor bunun nedeni (480 için hesaplama yapılan blokların 580'de çıkarılması değil, 580'de çıkarılan double precision üniteleri sp üniteleri aynen duruyor hatta 580'de daha fazla. Programda single precision kullanıyor driverdan özellikle double precision seçmezseniz ki gerek yok şimdilik ) kodu yazarken block warp allocationlarını hesaplamalarını fermi üstünden yapmam sizin denemeniz o yüzden çok iyi oldu. Bir ara vaktim olduğunda düzeltmeye çalışırım. Denediğiniz için tekrardan teşekkür ederim

Not: bu arada başlığı anca açabildim forum patlamış durumda





< Bu mesaj bu kişi tarafından değiştirildi hanibal187 -- 28 Nisan 2013; 16:22:19 >

T
12 yıl
Yarbay

K
12 yıl
Yüzbaşı

ray tracer'ı sıfırdan mı yazdınız acaba?


Bu mesaja 1 cevap geldi.
H
12 yıl
Yüzbaşı
Konu Sahibi

quote:

Orijinalden alıntı: kirmik

ray tracer'ı sıfırdan mı yazdınız acaba?

Evet sıfırdan yazdım.

Vakit olursa nvidia optix kullanan birşeyde yazabilirim hem daha güzel olur



< Bu ileti mobil sürüm kullanılarak atıldı >

C
12 yıl
Binbaşı

Basarilar guzel program dewamini bekliyoruz...



< Bu ileti mobil sürüm kullanılarak atıldı >

T
12 yıl
Yarbay

quote:

Orijinalden alıntı: hanibal187

Kendi yazdığım benchmark programını paylaşıyorum skorları paylaşırsanız sevinirim.


Buradan indirebilirsiniz: İndir


Program şimdilik çok ham durumda vaktim oldukça geliştirmeye çalışırım bu haliylede kalabilir emin değilim Program CUDA'da yazıldığı için şimdilik sadece GeForce (tesla, quadro varsa onlarda olur )kartları destekliyor.


RayTracerV0.1.exe'yi tıkladıktan sonra beyaz ekranda 1, 2 ya da 3'ü tıklıyoruz.
1 - tek thread CPU
2 - tek GPU
3 - 2 GPU (varsa)


Bir kaç kere deneyip en iyi skoru yazabilirsiniz.

Skorları burada sıralıyorum:

Tek Kart GPU

GTX Titan (Stok hız): 3776 (Hanibal187)
GTX 680 (Stok hız): 2779 (SpecturA)
GTX 660TI (Stok hız): 2492 (kaan0101)


Çift Kart GPU

GTX Titan (Stok hız): 7055 (Hanibal187)
GTX 680 (Stok hız): 5270 (SpecturA)

CPU

3930K @4.160GHz: 100.3 (Hanibal187)
3930K @4.290GHz: 103 (SpecturA)


< Resime gitmek için tıklayın >

Güzel gözüküyor. Bende hd7870 var. Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.





< Bu mesaj bu kişi tarafından değiştirildi Tugrul_512bit -- 30 Nisan 2013; 16:52:53 >
Bu mesaja 1 cevap geldi.
H
12 yıl
Yüzbaşı
Konu Sahibi

quote:

Orijinalden alıntı: Tugrul_512bit

Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.

uzun ve kötü bir durumda aslında zamanında cpu için yazdığımda bir sürü özelliği vardı depth of field, aa, soft shadows, reflection, refraction, texture vs vs... 5500 satır civarında ve çok fazla tekrar comment out içeriyor şu anki versiyonu kodu temizlediğim zaman atayım sana güzel olur opencl versiyonu.

Dediğim gibi optix kullanmak daha mantıklı aslında sıfırdan yazınca ne kadar uğraşırsan uğraş optix gibi temiz ve hızlı olmuyor (optix de cudaya bağımlısın gerçi)


Bu mesaja 1 cevap geldi.
T
12 yıl
Yarbay

quote:

Orijinalden alıntı: hanibal187

quote:

Orijinalden alıntı: Tugrul_512bit

Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.

uzun ve kötü bir durumda aslında zamanında cpu için yazdığımda bir sürü özelliği vardı depth of field, aa, soft shadows, reflection, refraction, texture vs vs... 5500 satır civarında ve çok fazla tekrar comment out içeriyor şu anki versiyonu kodu temizlediğim zaman atayım sana güzel olur opencl versiyonu.

Dediğim gibi optix kullanmak daha mantıklı aslında sıfırdan yazınca ne kadar uğraşırsan uğraş optix gibi temiz ve hızlı olmuyor (optix de cudaya bağımlısın gerçi)

5500 satırsa boşver Ben çarpışma simülasyonnu yapmıştım 200-250 satır bile yoktur(kernel). Demekki raytracingde bir ton hesap var. Çok üşengecim de
Peki hesapları yaptırırken thread sayısı kaça çıkıyor ve kaçar kaçar gidiyor? Threadler tek boyutlu mu yoksa 2-3 boyutlu mu?





< Bu mesaj bu kişi tarafından değiştirildi Tugrul_512bit -- 30 Nisan 2013; 17:03:11 >
Bu mesaja 1 cevap geldi.
H
12 yıl
Yüzbaşı
Konu Sahibi

quote:

Orijinalden alıntı: Tugrul_512bit

quote:

Orijinalden alıntı: hanibal187

quote:

Orijinalden alıntı: Tugrul_512bit

Kernel programı çok uzun değilse opencl sürümünü çıkartabilirim tabi paylaşmak istersen. Oyun grafik motoru olarak sadece jmonkey engine kullandım ve şu anda unity öğreniyorum.

uzun ve kötü bir durumda aslında zamanında cpu için yazdığımda bir sürü özelliği vardı depth of field, aa, soft shadows, reflection, refraction, texture vs vs... 5500 satır civarında ve çok fazla tekrar comment out içeriyor şu anki versiyonu kodu temizlediğim zaman atayım sana güzel olur opencl versiyonu.

Dediğim gibi optix kullanmak daha mantıklı aslında sıfırdan yazınca ne kadar uğraşırsan uğraş optix gibi temiz ve hızlı olmuyor (optix de cudaya bağımlısın gerçi)

5500 satırsa boşver Ben çarpışma simülasyonnu yapmıştım 200-250 satır bile yoktur(kernel). Demekki raytracingde bir ton hesap var. Çok üşengecim de
Peki hesapları yaptırırken thread sayısı kaça çıkıyor ve kaçar kaçar gidiyor? Threadler tek boyutlu mu yoksa 2-3 boyutlu mu?

şu an blok başına 32 thread kullanıyorum (en iyi sonucu onda veriyor halbuki 4 warp destekliyor ama kod şişkin olduğundan dolayı register sizelarını geçiyor, bide shared memory ile uğraşmadım çok fazla memory pass vardı ) tek gpuda blok sayısı olarakta 1024x1024 pixel ekran için 2-dimension block var -> GridDim dim3(1024, 1024/32, 1). Aynı anda benim kartta 14smx X 32 thread çalışıyor.

Fermi'de hızlı çalışmasıda blok başına 32 threadden kaynaklanıyor :D 480'de 15SM ve 580'de 16SM olunca haliyle bizim 14SMX'i geçiyor





< Bu mesaj bu kişi tarafından değiştirildi hanibal187 -- 30 Nisan 2013; 17:15:25 >
Bu mesaja 1 cevap geldi.