Arama butonu
Bu konudaki kullanıcılar: 1 misafir, 1 mobil kullanıcı
6
Cevap
710
Tıklama
7
Öne Çıkarma
OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?
M
7 gün
Yarbay
Konu Sahibi

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?
Yapay zeka dünyasında rekabet giderek hız kazanırken OpenAI uzun süredir beklenen bir adımı attı. Şirketin yeni modeli GPT-OSS, hem 120 milyar parametreli hem de 20 milyar parametreli iki farklı sürümle sunuluyor. Bu yeni model, şirketin altı yıl sonra piyasaya sürdüğü ilk açık ağırlıklı model konumunda.



6 yıl sonra gelen GPT-OSS



Ailenin büyük modeli olan gpt-oss-120b tek bir Nvidia GPU üzerinde çalışabiliyor ve şirketin halihazırdaki o4-mini modeliyle benzer performans sergiliyor. Daha küçük model gpt-oss-20b ise yalnızca 16 GB belleğe ihtiyaç duyuyor ve o3-mini seviyesinde bir performans vadediyor. Dolayısıyla her iki model de aslında bir dizüstü bilgisayarda çalıştırılabiliyor.



Her iki model de bugünden itibaren Hugging Face, Databricks, Azure ve AWS gibi platformlar üzerinden indirilebiliyor. Üstelik Apache 2.0 lisansı kapsamında sunulmaları, bu modellerin ticari amaçlarla dahi özgürce değiştirilmesine olanak tanıyor.



OpenAI, ChatGPT öncesinde en son altı yıl önce açık ağırlıklı bir model paylaşmıştı. CEO Sam Altman, uzun süre bu kararın arkasında güvenlik endişelerinin yattığını savunuyordu. Ancak açık kaynaklı modellerin popülaritesinin artması ve DeepSeek gibi alternatiflerin yükselişi şirketin tutumunu yeniden gözden geçirmesine neden oldu. Altman, bu yılın başlarında yaptığı açıklamada, "Tarihin yanlış tarafında yer aldık" diyerek bu konuda geç kaldıklarını kabul etmişti.



Akıl da yürütebiliyor



GPT-OSS, OpenAI’nin yalnızca yazı üretmekle kalmayan, aynı zamanda akıl yürütme, internette tarama, kod yazma ve API aracılığıyla ajan çalıştırma gibi gelişmiş görevleri de yerine getirebilen bir model olarak öne çıkıyor.



Öte yandna OpenAI, GPT-OSS’nin şimdiye kadar en kapsamlı güvenlik testlerinden geçen modeli olduğunu vurguluyor. Siber güvenlik ve biyolojik tehditler gibi hassas konularda harici güvenlik firmalarının da katkısıyla test edilen model karar alma sürecini görünür kılan “zincirleme düşünce” (chain-of-thought) yöntemini de barındırıyor.



Ayrıca Bkz.Google Genie 3 tanıtıldı: Böylesi daha önce çıkmadı, işte detaylar



OpenAI, açık modellerin eğitiminde kapalı modellerle benzer bir süreç izlediğini belirtiyor. Her iki model de “mixture-of-experts” (MoE) yaklaşımı ile eğitildi. Bu teknik, her token için tüm parametreler yerine yalnızca gerekli olanları aktive ederek verimliliği artırıyor. Ayrıca her iki model, yüksek işlem gücüne sahip takviyeli öğrenme (RL) sürecinden geçirildi.



Performansı nasıl?



OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?
Bunlarla birlikte GPT-OSS sadece metin tabanlı çıktılar üretebiliyor. Ve diğer OpenAI modellerinde olduğu gibi eğitim verisi kamuya açıklanmıyor. Dolayısıyla model açık ağırlıklı olsa da açık kaynak değil. Ek olarak modelin Llama, DeepSeek veya Google’ın Gemma modelleriyle karşılaştırmalı verileri de henüz paylaşılmadı ve sadece şirketin kenti modelleriyle kıyaslandı.



Yine de OpenAI, GPT-OSS modellerinin açık ağırlıklı modeller arasında lider konuma geldiğini savunuyor. Kodlama platformu Codeforces üzerinde GPT-OSS-120B modeli 2622, GPT-OSS-20B modeli ise 2516 puan alarak DeepSeek’in R1 modelini geride bırakabiliyor. Ancak bu skorlar kapalı o3 ve o4-mini modellerinin gerisinde



OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?
Bir diğer test olan Humanity’s Last Exam (HLE) sonuçlarında da benzer bir tablo ortaya çıktı. GPT-OSS-120B yüzde 19, GPT-OSS-20B ise yüzde 17,3 başarı oranına ulaştı. Bu da modellerin Qwen ve DeepSeek gibi diğer açık modellerin önüne geçtiğini o3 seviyesinin altında kaldığını gösteriyor.



GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde. Şirketin kendi kıyaslaması olan PersonQA testine göre GPT-OSS-120B modelinin halüsinasyon oranı yüzde 49, 20B modelinin ise yüzde 53. Bu oranlar, o1 modelinin yüzde 16’lık ve o4-mini’nin yüzde 36’lık oranlarının oldukça üzerinde.




Kaynak:https://openai.com/index/introducing-gpt-oss/
Kaynak:https://www.theverge.com/openai/718785/openai-gpt-oss-open-model-release

DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.

Üye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.

Üye Ol Şimdi Değil

 Haberi Portalda Gör

Bu halüsinasyon oranı nedir ya %50 bir dediği bir dediğini tutmaz modellerin
Yoruma Git
darkem - 7 gün +3
J
7 gün
Yarbay

Sanal zeka gazı açık ara verilmeye devam ediliyor..Buna ençok sevinenler Donanım üreticileri oluyor.



Bu mesaja 1 cevap geldi.
D
7 gün
Teğmen

Bu halüsinasyon oranı nedir ya %50 bir dediği bir dediğini tutmaz modellerin



< Bu ileti Android uygulamasından atıldı >

E
7 gün
Binbaşı

Alternatif konu başlığı:

GPT-OSS Halüsinasyon Rekorları Kırmaya Devam Ediyor

quote:

GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde



< Bu ileti mini sürüm kullanılarak atıldı >

D
6 gün
Yüzbaşı

yarı yarıya halüsinasyon gören bir zekaya neyi danışabiliriz ki ?




A
6 gün
Binbaşı

Ne gazı ya istediğin soruyu sor anında cevap veriyor daha napsın muhteşem birşey.




Bu mesajda bahsedilenler: @joven
B
6 gün
Yarbay

Bu kadarını gerçekten isteyen kaç kişi vardır dünyada? Bence bu işin suyu çıkmaya başladı. Tamam ben de kullanıyorum ama ne yapalım dünyayı da mı teslim edelim yapay zekaya?



< Bu ileti mobil sürüm kullanılarak atıldı >

DH Mobil uygulaması ile devam edin. Mobil tarayıcınız ile mümkün olanların yanı sıra, birçok yeni ve faydalı özelliğe erişin. Gizle ve güncelleme çıkana kadar tekrar gösterme.