Arama butonu
Bu konudaki kullanıcılar: 1 misafir, 1 mobil kullanıcı
5
Cevap
475
Tıklama
2
Öne Çıkarma
Apple’dan yapay zekada “görsel dil” devrimi: FastVLM
M
4 hafta
Yarbay
Konu Sahibi

Apple’dan yapay zekada “görsel dil” devrimi: FastVLM
Apple, yapay zeka dünyasında önemli bir adım atarak FastVLM adını verdiği yeni görsel-dil modelini (VLM) kullanıcıların beğenisine sundu. 2024’te tanıtılan bu model, hız, ölçeklenebilirlik ve doğruluk açısından mevcut birçok modele fark atacak şekilde tasarlandı. FastVLM, özellikle gerçek zamanlı uygulamalarda, mobil, bulut ve uç cihazlarda kullanılmak üzere optimize edilmiş bir çözüm sunuyor.



Etkileyici bir model



Apple, FastVLM’i Hugging Face platformunda 0.5, 1.5 ve 7 milyar parametreli modeller olarak yayınladı. Modelin önemli teknik avantajları arasında benzer boyuttaki VLM’lere kıyasla 85 kat daha hızlı ve 3,4 kat daha küçük olması, büyük modellerde TTFT (text-to-frame time) performansının 7,9 kat artırılması ve yüksek çözünürlüklü görseller için daha az çıktı üreterek kodlama süresini azaltması yer alıyor. Üstelik WebGPU desteği sayesinde FastVLM, ek bir kurulum gerektirmeden doğrudan tarayıcı üzerinden gerçek zamanlı çalışabiliyor. Aşağıdaki videoda bu model, gerçek zamanlı video altyazı oluşturma yeteneğini sergiliyor.



https://x.com/reach_vb/status/1961471154197053769



FastVLM, görselleri ve metinleri aynı anda anlayabilen bir yapay zeka modeli olarak öne çıkıyor. Modelin amacı, yüksek hızda işlem yapmak, farklı görsel-dil görevlerinde güçlü sonuçlar elde etmek ve eğitim süreçlerini daha verimli hale getirmek. Apple, bu modelle hızdan ödün vermeden doğruluk sunmayı hedefliyor ve bu sayede hem geliştiriciler hem de kullanıcılar için daha iyi bir deneyim sağlıyor.



Apple’dan yapay zekada “görsel dil” devrimi: FastVLM
Teknik olarak FastVLM, hibrit transformer mimarisi kullanıyor. FastVLM, görselleri ve metinleri aynı anda anlayabilen bir yapay zeka modeli. Görselleri işlemek için özel bir sistem, metinleri işlemek için ayrı bir sistem var ve bu iki sistem, modelin bilgileri birleştirmesini sağlayan bir katmanla bağlanıyor. Böylece model, resimleri ve metinleri birlikte yorumlayabiliyor, yeni kavramları tanıyabiliyor ve karmaşık soruları yanıtlayabiliyor. Ayrıca model, sıfırdan tanıma, açık kelime dağarcığıyla tespit ve görsel-metinsel akıl yürütme yetenekleri de sunuyor.



Akıllı gözlüklerde devrim yaratabilir



< Resime gitmek için tıklayın >



Modelin hız optimizasyonları da dikkat çekici. Apple, görsel işleme ve metin üretme adımlarını daha hızlı ve verimli hale getiren teknikler uyguladığını belirtiyor. Büyük veri setleri üzerinde yapılan eğitimlerde ise işlem maliyetlerini düşürmek için özel hesaplama yöntemleri tercih edildi. Bu sayede FastVLM, büyük görevlerde bile yüksek verimlilikle çalışabiliyor.



Ayrıca Bkz.Yapay zeka veri merkezleri devasa maliyetlerle ekonomiyi tehdit ediyor



FastVLM, sağlık sektöründe tıbbi görüntüleme ve rapor üretiminde, perakende sektöründe görsel ürün arama ve öneri sistemlerinde, eğitimde, içerik üretiminde ve erişilebilirlikte görsel verilerin gerçek zamanlı sese çevrilmesinde kullanılabiliyor. Ve daha da önemlisi; bu model, akıllı gözlük gibi giyilebilir cihazlarda inanılmaz avantajlar sağlayabilir. Gerçek zamanlı video altyazı oluşturma ve sahne analizi yetenekleri, kullanıcıların çevreyi anında anlamasına ve etkileşim kurmasına imkan tanıyabilir.




Kaynak:https://huggingface.co/apple/FastVLM-7B
Kaynak:https://arxiv.org/html/2412.13303v1

DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.

Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.

Üye Ol Şimdi Değil

 Haberi Portalda Gör

M
4 hafta
Yüzbaşı

Sonunda Apple cephesinden de kayda değer haberler gelmeye başladı. İzleyelim görelim.



< Bu ileti Android uygulamasından atıldı >

M
4 hafta
Yarbay

Ben Videoda gerçek zaman göremedim




D
4 hafta
Teğmen

Herhangi bir yerden indirebilir miyiz ?



< Bu ileti Android uygulamasından atıldı >

X
3 hafta
Yarbay

Apple, yapay zeka ve devrim... Düşündürücü. Google AI haberinde bile devrim yazmadınız iphone 17 gelir beleş inceleme ye diye mi umut ediyorsunuz?




L
3 hafta
Teğmen

AR ile birleştiğini düşünecek olursak müthiş gelişme. Meta ile ortaklık kurmaları lazım geleceğe yönelik.



DH Mobil uygulaması ile devam edin. Mobil tarayıcınız ile mümkün olanların yanı sıra, birçok yeni ve faydalı özelliğe erişin. Gizle ve güncelleme çıkana kadar tekrar gösterme.