DonanımHaber Mini sürüm 2 Ocak 2026 tarihi itibariyle kullanımdan kalkacaktır. Bunun yerine daha hızlı bir deneyim için DH Android veya DH iOS uygulamalarını kullanabilirsiniz.
Arama butonu
Bu konudaki kullanıcılar: 1 misafir, 1 mobil kullanıcı
4
Cevap
352
Tıklama
6
Öne Çıkarma
Meta, ses işlemede devrim yaratan SAM Audio modelini tanıttı
M
3 gün (11071 mesaj)
Yarbay
Konu Sahibi

Meta, ses işlemede devrim yaratan SAM Audio modelini tanıttı
Meta, ses işleme alanında çığır açacak yeni bir model olan SAM Audio’yu tanıttı. Görsel dünyada Segment Anything Model (SAM) ile öne çıkan Meta, şimdi benzer bir yaklaşımı ses dünyasına taşıyor. SAM Audio, karmaşık ses karışımlarından herhangi bir sesi izole etmeyi çok modlu girdilerle mümkün kılıyor. Bu yöntem, insanların sesi algılama biçimini taklit ederek ses ayrıştırmayı hem daha erişilebilir hem de kullanışlı hale getiriyor.



Ses düzenlemede yeni dönem



Meta, ses işlemede devrim yaratan SAM Audio modelini tanıttı
Geleneksel ses düzenleme araçlarının aksine SAM Audio, kullanıcıların metin komutları, görsel ipuçları veya zaman dilimi belirleme gibi doğal yöntemlerle etkileşime girmesine olanak tanıyor. Bu teknoloji sayesinde, örneğin bir konser videosunda sadece gitara tıklayarak gitarın sesini izole etmek veya bir podcast kaydındaki köpek havlamalarını basit bir metin komutuyla temizlemek mümkün hale geliyor. Meta, SAM Audio’nun türünün ilk örneği birleşik ve çok modlu yapay zeka modeli olduğunu söylüyor.



Modelin merkezinde yer alan Perception Encoder Audiovisual (PE-AV), SAM Audio’nun gelişmiş performansını sağlayan teknik motor olarak öne çıkıyor. Daha önce açık kaynak olarak paylaşılan modelin geliştirilmiş versiyonu olan PE-AV, görsel ve işitsel verileri zaman ekseninde hizalayarak yüksek doğrulukta çok modlu ses ayrıştırmayı mümkün kılıyor. Bu sayede ekrandaki konuşmacılar veya enstrümanlar gibi görsel olarak belirgin kaynaklar kolayca izole edilebiliyor, hatta sahne bağlamına göre ekran dışındaki olaylar da tahmin edilebiliyor.



Detaylarda neler var?



Meta, ses işlemede devrim yaratan SAM Audio modelini tanıttı
SAM Audio metin tabanlı, görsel tabanlı ve zaman dilimi tabanlı olmak üzere üç farklı yöntemle ses segmentasyonu sunuyor. Örneğin, kullanıcı “köpek havlaması” veya “vokal” gibi metinler girerek belirli sesleri ayırabiliyor. Görsel ipuçlarıyla, videodaki konuşan kişiler veya ses çıkaran nesnelere tıklayarak sesi izole etmek mümkün. Zaman dilimi tabanlı yöntem ise, bir podcast kaydında köpek havlaması gibi istenmeyen sesleri tüm kayıtta filtrelemeyi sağlıyor.











Modelin mimarisi, akış eşleştirme difüzyon dönüştürücüsü üzerine inşa edilmiş bir üretken modelleme çerçevesi üzerine kurulmuş bir üretici çerçeve kullanıyor. Bu yapı, ses karışımını ve girdileri ortak bir temsil alanına kodlayarak hedef ve kalan ses parçalarını oluşturuyor. Eğitim verisi, konuşma, müzik ve genel ses olaylarını kapsayan hem gerçek hem de sentetik karışımlardan oluşuyor. Gelişmiş veri sentezi ve otomatik çok modlu ipucu üretimi ile modelin gerçek dünyada yüksek performans göstermesi sağlanıyor.



Meta, ses işlemede devrim yaratan SAM Audio modelini tanıttı
Performans açısından SAM Audio, evrensel ses ayrıştırmada mevcut modelleri geride bırakırken alanına özgü en iyi modellerle karşılaştırıldığında da üstünlük sağlıyor. Karma modlu girdiler kullanıldığında ise daha güçlü sonuçlar elde edilebiliyor. Model, 500 milyon ile 3 milyar parametre arasında ölçeklenebiliyor ve gerçek zamanın altında bir hızla çalışabiliyor (RTF ≈ 0.7). Ancak, sesin kendisi prompt olarak kullanılamıyor ve tamamen promptsuz ayrıştırma mümkün değil. Ayrıca, çok benzer sesleri izole etmek halen zorluk teşkil ediyor.



Ayrıca Bkz.Güney Kore, yapay zeka düzenlemelerini fiilen uygulayan ilk ülke olacak



Ancak SAM Audio’nun yetenekleri beraberinde bazı güvenlik kaygılarını da getiriyor. Model, kullanıcı taleplerine göre belirli sesleri izole edebildiği için, potansiyel olarak halka açık kayıtlardaki konuşmaları ayırmak ve dinlemek gibi kötüye kullanım senaryoları gündeme gelebiliyor.



Modeli buradan deneyebilir veya buradan indirebilirsiniz.






Kaynak:https://ai.meta.com/blog/sam-audio/

 Haberi Portalda Gör

A
3 gün (189 mesaj)
Teğmen

Buna benzer SAME veya SEMU muydu bilmiyorum. Instagram'da görmüştüm, ona benzecek.



Bu mesaja 1 cevap geldi.
B
3 gün (891 mesaj)
Yüzbaşı

filmlerde çok güzel dublaj yapılır ve dahası




G
3 gün (14402 mesaj)
Yarbay

Suno



< Bu ileti Android uygulamasından atıldı >


Bu mesajda bahsedilenler: @AIA_DH
D
dün (108651 mesaj)
Yarbay

Çok tehlikeli olduğunu düşünüyorum. herhangi bir ortamda sesini kaydedip pürüzsüz hale getirip istedikleri gibi kullanabilirler




DH Mobil uygulaması ile devam edin. Mobil tarayıcınız ile mümkün olanların yanı sıra, birçok yeni ve faydalı özelliğe erişin. Gizle ve güncelleme çıkana kadar tekrar gösterme.