OpenAI, geliştiricilere düşük gecikmeli ve çok modlu deneyimler sunma imkanı sağlayan Realtime API’yi Ekim 2024’te tanıtmıştı. O tarihten bu yana binlerce geliştirici, bu API sayesinde uygulamalarında doğal dilde konuşma deneyimleri oluşturdu. Şimdi ise daha gelişmiş özellikler barındırılan gpt-realtime adlı konuşma modelin duyuruldu.
Daha gelişmiş ve daha ucuz
Yeni model, karmaşık talimatları daha iyi takip edebiliyor, araç çağırmada hata oranı düşüyor. Aynı zamanda modelin ürettiği seslerin de daha doğal ve ifade dolu olduğu belirtiliyor. OpenAI, modelin sistem mesajlarını ve geliştirici komutlarını eski modellere göre çok daha iyi yorumlayabildiğini belirtiyor.
Realtime API’nin ilk lansmanında 6 ses seçeneği sunulmuş, sonrasında iki yeni ses daha eklenmişti. Şimdi Marin ve Cedar adında iki yeni ses daha duyuruldu. Ek olarak mevcuttaki sekiz ses de daha doğal ve akıcı bir deneyim sunacak şekilde güncellendi.
Yeni model aynı zamanda performans testlerinde de iddialı. Big Bench Audio testinde gpt-realtime yüzde 82,8 doğrulukla, Aralık 2024’teki önceki modelin yüzde 65,6’lık skorunu geride bırakmış durumda. MultiChallenge Audio Benchmark testinde ise model, önceki yüzde 20,6’lık skoru geçerek yüzde 30,5 skor elde etti.
Yeni model ve seslerle birlikte Realtime API’de de güncellemeler yapıldı. Artık API, uzaktan MCP sunucularını, görsel girdileri ve Session Initiation Protocol (SIP) üzerinden telefon aramalarını destekliyor. Ayrıca geliştiriciler kullandıkları talimatları (prompt) kaydedip yeniden kullanabiliyor.
Tüm bu gelişmelere rağmen OpenAI, Realtime API’nin fiyatını düşürdü. gpt-realtime artık, önceki gpt-4o-realtime-preview’a kıyasla yüzde 20 daha ucuz. 1M ses girdi tokeni 32 dolar, 1M ses çıktı tokeni ise 64 dolar seviyesinde.
DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.
Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.
Daha gelişmiş ve daha ucuz
Yeni model, karmaşık talimatları daha iyi takip edebiliyor, araç çağırmada hata oranı düşüyor. Aynı zamanda modelin ürettiği seslerin de daha doğal ve ifade dolu olduğu belirtiliyor. OpenAI, modelin sistem mesajlarını ve geliştirici komutlarını eski modellere göre çok daha iyi yorumlayabildiğini belirtiyor.
https://x.com/OpenAIDevs/status/1961124915719053589
Realtime API’nin ilk lansmanında 6 ses seçeneği sunulmuş, sonrasında iki yeni ses daha eklenmişti. Şimdi Marin ve Cedar adında iki yeni ses daha duyuruldu. Ek olarak mevcuttaki sekiz ses de daha doğal ve akıcı bir deneyim sunacak şekilde güncellendi.
Yeni model aynı zamanda performans testlerinde de iddialı. Big Bench Audio testinde gpt-realtime yüzde 82,8 doğrulukla, Aralık 2024’teki önceki modelin yüzde 65,6’lık skorunu geride bırakmış durumda. MultiChallenge Audio Benchmark testinde ise model, önceki yüzde 20,6’lık skoru geçerek yüzde 30,5 skor elde etti.
Ayrıca Bkz.Microsoft, ilk kez kendi yapay zeka modellerini tanıttı: OpenAI’a rakip geliyor
Yeni model ve seslerle birlikte Realtime API’de de güncellemeler yapıldı. Artık API, uzaktan MCP sunucularını, görsel girdileri ve Session Initiation Protocol (SIP) üzerinden telefon aramalarını destekliyor. Ayrıca geliştiriciler kullandıkları talimatları (prompt) kaydedip yeniden kullanabiliyor.
Tüm bu gelişmelere rağmen OpenAI, Realtime API’nin fiyatını düşürdü. gpt-realtime artık, önceki gpt-4o-realtime-preview’a kıyasla yüzde 20 daha ucuz. 1M ses girdi tokeni 32 dolar, 1M ses çıktı tokeni ise 64 dolar seviyesinde.
DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.
Üye Ol Şimdi DeğilÜye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.
Haberi Portalda Gör