Arama butonu
Bu konudaki kullanıcılar: 1 misafir, 1 mobil kullanıcı
8
Cevap
534
Tıklama
4
Öne Çıkarma
FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
M
geçen yıl
Yarbay
Konu Sahibi

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
Yapay zeka görüntü oluşturucu araçlarda rekabet oldukça yüksek ve oyuna yeni birisi daha dahil oluyor: FLUX.1. Black Forest Labs adındaki Almanya merkezli bir girişim tarafından ortaya konan metinden görüntüye yapay zeka modeli FLUX.1, adından oldukça söz ettirecek gibi. Zira bu şirket Stable Diffusion'ın arkasındaki teknolojiyi geliştiren ve Latent Diffusion tekniğini icat eden araştırmacılar tarafından kurulmuş durumda ve FLUX.1 daha başlangıç.



Güle güle Midjourney



Black Forest Labs, çok kısa bir süre önce üç FLUX.1 metinden görüntüye modelini piyasaya sürdü: üst düzey bir ticari "pro" sürümü, ticari olmayan kullanım için açık ağırlıklara sahip orta sınıf bir "dev" sürümü ve daha hızlı olan açık "schnell" sürümü. Firma, kendi modellerinin görüntü kalitesi ve metin komutlarına bağlılık gibi alanlarda Midjourney ve DALL-E gibi rakiplerinden daha iyi olduğunu söylüyor. Bu arada daha önceki benzer haberlerimizde olduğu gibi, haber içindeki tüm görseller ilgili yapay zekaya ait.



Ayrıca Bkz.OpenAI destekli yeni insansı robot Figure 02 tanıtıldı



Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu söyleminin boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6'ya çok yakın ve bazen daha iyi. İstemlerdeki doğruluk da DALL-E 3 kadar iyi ve tam olarak ne isteniyorsa onu verebiliyor.



FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor



FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen "hibrit mimari" olarak adlandırdığı bir mimari kullanıyor. FLUX.1 modelleri ayrıca diğer çoğu yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. İlk başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu ancak günümüzde Midjourney gibi araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla önem arz ediyor.



Sırada Sora rakibi SOTA var



FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor
Black Forest Labs, yapay zeka alanında yeni bir şirket olsa da firmanın adını gelecekte daha sık duyabiliriz. Pazara üst seviyeden hızlı bir giriş yapan şirket, yakında SOTA adında metinden videoya yapay zekasını tanıtacak. SOTA, günümüzün popüler yapay zekaları OpenAI Sora, Runway Gen3-Alpha veya KLING ile mücadele edecek. Aşağıdaki galeriden daha fazla FLUX.1 örneğine göz atabilirsiniz.






Kaynak:https://arstechnica.com/information-technology/2024/08/flux-this-new-ai-image-generator-is-eerily-good-at-creating-human-hands/
Kaynak:https://blackforestlabs.ai/

DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.

Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.

Üye Ol Şimdi Değil

 Haberi Portalda Gör

Bunun nedenlerinden biri insan elinin kendi karmaşıklığında yatıyor. Çeşitli şekil ve boyutlarda birden fazla öğeden oluşan ellerin yapısı inanılmaz derecede karmaşıktır, biz insanlar bunu h...
Yoruma Git
Yorumun Devamı Metin Yasir Akpınar - geçen yıl +7
T
geçen yıl
Yarbay

Lan nereye gidecek bu ai resim video ses olayı. Bir kaç yıl sonra filmleri vs her şeyi bütçe gerektirmeden yapacakar gibi. Gerçekliği sorgulatacaklar ciddi ciddi.



< Bu ileti Android uygulamasından atıldı >

V
geçen yıl
Yarbay

Diğerleri insan elini oluştururken neden saçmalıyor peki, olay ne? Kodlar mı karışık?

Yani kafayı veya yüzü oluşturuyor ama ellerde neden saçmalıyor, mesela neden saçları oluştururken saçmalamıyor da eller? İzah ediniz.



Bu mesaja 2 cevap geldi.
M
geçen yıl
Yarbay
Konu Sahibi

Bunun nedenlerinden biri insan elinin kendi karmaşıklığında yatıyor. Çeşitli şekil ve boyutlarda birden fazla öğeden oluşan ellerin yapısı inanılmaz derecede karmaşıktır, biz insanlar bunu hafife alsak da durum bu. Parmaklar, avuç içleri, eklemler, tendonlar ve diğer bileşenler birbirine bağımlı olarak hareket ediyor. Elleri gerçekçi bir şekilde çizmek için, modelin elin parçalarındaki doğal varyasyonların geniş yelpazesini öğrenmesi ve tıpkı insanlar gibi bu öğeler arasındaki mekansal ilişkileri anlaması gerekir. İnsan eli tokalaşma sırasında farklı, bir bardağı tutarken farklı, bir çay kaşığını tutarken farklı varyasyonlarda olabiliyor. Yapay zeka modelleri bu desenleri öğrenebilir ancak unutmayın, insan eli dediğimiz olguyu anlayamaz, kavrayamaz.

Bir diğer etken ise ellerin kişiden kişiye değişkenliği. Farklı bireylerin farklı el oranları, boyutları ve hatta şekilleri var. Dolayısıyla her el tipini bir modele öğretmek muazzam bir veri kümesi gerektirir. Buna bir de modelin esasında herhangi bir şey bilmediğini ekleyin. Yani modeller insan elinin aslında 5 tane parmaktan oluştuğunu bile gerçekte bilmiyor.
Midjourney, Dall-E veya Flux esasında bir difüzyon modelidir. Difüzyon modelleri, veri üreterek ya da dönüştürerek yapay zeka modellerinin içerik üretmesine olanak tanıyan bir yaklaşım olarak düşünülebilir. Bu modeller, veriyi adım adım iyileştirerek ya da gürültü ekleyip çıkararak hedef veriyi üretir. Bu üretimin kalitesi de modelin eğitim kümesiyle doğrudan ilişkili. Bildiğiniz gibi modeller genellikle internetteki görseller üzerinde eğitiliyor. Bu görsellerde insan yüzleri, gövdesi veya saçları oldukça barizdir. Ancak insan elleri görsellerde süreli olarak farklı pozisyon ve açılarda olabiliyor. Bu da  insan eli gibi nesnelerin temsillerinin sınırlı olmasına neden oluyor.

Dediğimiz gibi Difüzyon modelleri, genellikle veriyi adım adım dönüştürerek çalışır. Bu süreçte eklenen veya çıkarılan gürültü, karmaşık ve ince detaylı yapılar üzerinde bozulmalara neden olabilir. İnsan eli, parmak izi desenlerinden tırnaklara, damarlardan eklemlere kadar inanılmaz bir detay seviyesine sahip. Difüzyon modelleri, bu kadar ince detayları tutarlı bir şekilde üretmekte henüz tam olarak başarılı olamıyor. Dolayısıyla eller bozulma konusuna eğilimliler.

Bir elin sadece bir nesne değil, aynı zamanda bir kavram olduğunu unutmamak gerekiyor. Bir el, bir nesneyle etkileşime girdiğinde, o nesnenin özelliklerine göre şekil değiştirir. Bu tür anlamsal kavramayı modellere öğretmek maliyetli bir süreç. İmkansız mı? Elbette değil. En basit çözümü veri kümesini büyütmek. Ayrıca 2D görüntülerin yanı sıra 3D modelleme verileri de kullanılabilir. El hareketlerinin fiziksel simülasyonları kullanılabilir.


Bu mesaja 2 cevap geldi.

Bu mesajda bahsedilenler: @V4LKyR
S
geçen yıl
Yarbay

S
geçen yıl
Yarbay

O kadar doyurucu bir cevap kaleme almışsın ki , keşke yapay zeka hakkında
(DH 'de Yapay Zeka haberleri sekmesi altında bu teknolojinin tarihçesi ,metotları ,terminolojisi ve mantığı hakkında wiki tarzında...) bir kaynakça olsa da bunu sen yapsan diye beklenti oluştu .

Yok artık diyeceksin ancak , böyle karmaşık sayılabilecek bir konuyu gayet sarih bir şekilde açıklamak her editörün harcı değil ...

Teşekkürler.



Bu mesaja 1 cevap geldi.

Bu mesajda bahsedilenler: @Metin Yasir Akpınar
M
geçen yıl
Yarbay
Konu Sahibi

Yorumunuz için çok teşekkürler, onore ettiniz. Aslında haklısınız, özellikle terminoloji tarafını doldurmak gerekiyor. Not alayım bunu :)





Bu mesajda bahsedilenler: @sendemail
V
geçen yıl
Yarbay

10 seneden fazladır bu forumdayım, şunun gibi kaliteli izahat - hem de kusursuz bir imla ile - görmedim, teşekkür ediyorum Yasir hocam, saygılar.




Bu mesajda bahsedilenler: @Metin Yasir Akpınar
B
geçen yıl
Yarbay

Yalnız bütün görseller o kadar iyi ki...




DH Mobil uygulaması ile devam edin. Mobil tarayıcınız ile mümkün olanların yanı sıra, birçok yeni ve faydalı özelliğe erişin. Gizle ve güncelleme çıkana kadar tekrar gösterme.