FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

Aşağı Git Tüm Forumlar Donanım / Hardware Anasayfa Haberleri FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

Bu konudaki kullanıcılar: 1 misafir, 1 mobil kullanıcı

8
Cevap 534
Tıklama 4
Öne Çıkarma

1. sayfa

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

Cevap Yaz

Metin Yasir Akpınar

geçen yıl

Yarbay

Konu Sahibi

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor — Yapay zeka görüntü oluşturucu araçlarda rekabet oldukça yüksek ve oyuna yeni birisi daha dahil oluyor: **FLUX.1**. **Black Forest Labs** adındaki Almanya merkezli bir girişim tarafından ortaya konan metinden görüntüye yapay zeka modeli FLUX.1, adından oldukça söz ettirecek gibi. Zira bu şirket **Stable Diffusion**'ın arkasındaki teknolojiyi geliştiren ve **Latent Diffusion** tekniğini icat eden araştırmacılar tarafından kurulmuş durumda ve FLUX.1 daha başlangıç.

Güle güle Midjourney

Black Forest Labs, çok kısa bir süre önce üç FLUX.1 metinden görüntüye modelini piyasaya sürdü: üst düzey bir ticari "pro" sürümü, ticari olmayan kullanım için açık ağırlıklara sahip orta sınıf bir "dev" sürümü ve daha hızlı olan açık "schnell" sürümü. Firma, kendi modellerinin görüntü kalitesi ve metin komutlarına bağlılık gibi alanlarda Midjourney ve DALL-E gibi rakiplerinden daha iyi olduğunu söylüyor. Bu arada daha önceki benzer haberlerimizde olduğu gibi, haber içindeki tüm görseller ilgili yapay zekaya ait.

Ayrıca Bkz.OpenAI destekli yeni insansı robot Figure 02 tanıtıldı

Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu söyleminin boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6'ya çok yakın ve bazen daha iyi. İstemlerdeki doğruluk da DALL-E 3 kadar iyi ve tam olarak ne isteniyorsa onu verebiliyor.

FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen "hibrit mimari" olarak adlandırdığı bir mimari kullanıyor. FLUX.1 modelleri ayrıca diğer çoğu yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. İlk başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu ancak günümüzde Midjourney gibi araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla önem arz ediyor.

Sırada Sora rakibi SOTA var

Kaynak:https://arstechnica.com/information-technology/2024/08/flux-this-new-ai-image-generator-is-eerily-good-at-creating-human-hands/
Kaynak:https://blackforestlabs.ai/

DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.

Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.

Üye Ol Şimdi Değil

Bir Daha Gösterme

Haberi Portalda Gör

En Çok Beğenilenler Tümü Saat Gün Hafta Ay Yıl ✔ Tümü Tüm Yorumları Aç

Yoruma Git Yoruma Git

Bunun nedenlerinden biri insan elinin kendi karmaşıklığında yatıyor. Çeşitli şekil ve boyutlarda birden fazla öğeden oluşan ellerin yapısı inanılmaz derecede karmaşıktır, biz insanlar bunu hafife alsak da durum bu. Parmaklar, avuç içleri, eklemler, tendonlar ve diğer bileşenler birbirine bağımlı olarak hareket ediyor. Elleri gerçekçi bir şekilde çizmek için, modelin elin parçalarındaki doğal varyasyonların geniş yelpazesini öğrenmesi ve tıpkı insanlar gibi bu öğeler arasındaki mekansal ilişkileri anlaması gerekir. İnsan eli tokalaşma sırasında farklı, bir bardağı tutarken farklı, bir çay kaşığını tutarken farklı varyasyonlarda olabiliyor. Yapay zeka modelleri bu desenleri öğrenebilir ancak unutmayın, insan eli dediğimiz olguyu anlayamaz, kavrayamaz.

Bir diğer etken ise ellerin kişiden kişiye değişkenliği. Farklı bireylerin farklı el oranları, boyutları ve hatta şekilleri var. Dolayısıyla her el tipini bir modele öğretmek muazzam bir veri kümesi gerektirir. Buna bir de modelin esasında herhangi bir şey bilmediğini ekleyin. Yani modeller insan elinin aslında 5 tane parmaktan oluştuğunu bile gerçekte bilmiyor.
Midjourney, Dall-E veya Flux esasında bir difüzyon modelidir. Difüzyon modelleri, veri üreterek ya da dönüştürerek yapay zeka modellerinin içerik üretmesine olanak tanıyan bir yaklaşım olarak düşünülebilir. Bu modeller, veriyi adım adım iyileştirerek ya da gürültü ekleyip çıkararak hedef veriyi üretir. Bu üretimin kalitesi de modelin eğitim kümesiyle doğrudan ilişkili. Bildiğiniz gibi modeller genellikle internetteki görseller üzerinde eğitiliyor. Bu görsellerde insan yüzleri, gövdesi veya saçları oldukça barizdir. Ancak insan elleri görsellerde süreli olarak farklı pozisyon ve açılarda olabiliyor. Bu da insan eli gibi nesnelerin temsillerinin sınırlı olmasına neden oluyor.

Dediğimiz gibi Difüzyon modelleri, genellikle veriyi adım adım dönüştürerek çalışır. Bu süreçte eklenen veya çıkarılan gürültü, karmaşık ve ince detaylı yapılar üzerinde bozulmalara neden olabilir. İnsan eli, parmak izi desenlerinden tırnaklara, damarlardan eklemlere kadar inanılmaz bir detay seviyesine sahip. Difüzyon modelleri, bu kadar ince detayları tutarlı bir şekilde üretmekte henüz tam olarak başarılı olamıyor. Dolayısıyla eller bozulma konusuna eğilimliler.

Bir elin sadece bir nesne değil, aynı zamanda bir kavram olduğunu unutmamak gerekiyor. Bir el, bir nesneyle etkileşime girdiğinde, o nesnenin özelliklerine göre şekil değiştirir. Bu tür anlamsal kavramayı modellere öğretmek maliyetli bir süreç. İmkansız mı? Elbette değil. En basit çözümü veri kümesini büyütmek. Ayrıca 2D görüntülerin yanı sıra 3D modelleme verileri de kullanılabilir. El hareketlerinin fiziksel simülasyonları kullanılabilir.

Yorumun Devamı Metin Yasir Akpınar - geçen yıl +7 ▲

TncyKrmn

geçen yıl

Yarbay

Lan nereye gidecek bu ai resim video ses olayı. Bir kaç yıl sonra filmleri vs her şeyi bütçe gerektirmeden yapacakar gibi. Gerçekliği sorgulatacaklar ciddi ciddi.

< Bu ileti Android uygulamasından atıldı >

V4LKyR

geçen yıl

Yarbay

Diğerleri insan elini oluştururken neden saçmalıyor peki, olay ne? Kodlar mı karışık?

Yani kafayı veya yüzü oluşturuyor ama ellerde neden saçmalıyor, mesela neden saçları oluştururken saçmalamıyor da eller? İzah ediniz.

Bu mesaja 2 cevap geldi.

Metin Yasir Akpınar

geçen yıl

Yarbay

Konu Sahibi

Bu mesaja 2 cevap geldi.

Bu mesajda bahsedilenler: @V4LKyR

smart1978

geçen yıl

Yarbay

https://onedio.com/haber/yapay-zeka-tarafindan-uretilen-fotograflarda-neden-cok-fazla-parmak-oluyor-1126099

https://gdh.digital/gorsel-yapay-zeka-araclari-neden-el-ve-ayak-cizemiyor-74286

Bu mesajda bahsedilenler: @V4LKyR

sendemail

geçen yıl

Yarbay

O kadar doyurucu bir cevap kaleme almışsın ki , keşke yapay zeka hakkında
(DH 'de Yapay Zeka haberleri sekmesi altında bu teknolojinin tarihçesi ,metotları ,terminolojisi ve mantığı hakkında wiki tarzında...) bir kaynakça olsa da bunu sen yapsan diye beklenti oluştu .

Yok artık diyeceksin ancak , böyle karmaşık sayılabilecek bir konuyu gayet sarih bir şekilde açıklamak her editörün harcı değil ...

Teşekkürler.

Bu mesaja 1 cevap geldi.

Bu mesajda bahsedilenler: @Metin Yasir Akpınar

Metin Yasir Akpınar

geçen yıl

Yarbay

Konu Sahibi

Yorumunuz için çok teşekkürler, onore ettiniz. Aslında haklısınız, özellikle terminoloji tarafını doldurmak gerekiyor. Not alayım bunu :)

Bu mesajda bahsedilenler: @sendemail

V4LKyR

geçen yıl

Yarbay

10 seneden fazladır bu forumdayım, şunun gibi kaliteli izahat - hem de kusursuz bir imla ile - görmedim, teşekkür ediyorum Yasir hocam, saygılar.

Bu mesajda bahsedilenler: @Metin Yasir Akpınar

Bloodin

geçen yıl

Yarbay

Yalnız bütün görseller o kadar iyi ki...

Cevap Yaz

1. sayfa

Tüm Forumlar Donanım / Hardware Anasayfa Haberleri FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor