OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?

Aşağı Git Tüm Forumlar Donanım / Hardware Anasayfa Haberleri OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?

Bu konudaki kullanıcılar: 1 misafir, 1 mobil kullanıcı

6
Cevap 751
Tıklama 7
Öne Çıkarma

1. sayfa

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?

Cevap Yaz

Metin Yasir Akpınar

2 ay

Yarbay

Konu Sahibi

OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor? — Yapay zeka dünyasında rekabet giderek hız kazanırken OpenAI uzun süredir beklenen bir adımı attı. Şirketin yeni modeli GPT-OSS, hem 120 milyar parametreli hem de 20 milyar parametreli iki farklı sürümle sunuluyor. Bu yeni model, şirketin altı yıl sonra piyasaya sürdüğü ilk açık ağırlıklı model konumunda.

6 yıl sonra gelen GPT-OSS

Ailenin büyük modeli olan gpt-oss-120b tek bir Nvidia GPU üzerinde çalışabiliyor ve şirketin halihazırdaki o4-mini modeliyle benzer performans sergiliyor. Daha küçük model gpt-oss-20b ise yalnızca 16 GB belleğe ihtiyaç duyuyor ve o3-mini seviyesinde bir performans vadediyor. Dolayısıyla her iki model de aslında bir dizüstü bilgisayarda çalıştırılabiliyor.

Her iki model de bugünden itibaren Hugging Face, Databricks, Azure ve AWS gibi platformlar üzerinden indirilebiliyor. Üstelik Apache 2.0 lisansı kapsamında sunulmaları, bu modellerin ticari amaçlarla dahi özgürce değiştirilmesine olanak tanıyor.

OpenAI, ChatGPT öncesinde en son altı yıl önce açık ağırlıklı bir model paylaşmıştı. CEO Sam Altman, uzun süre bu kararın arkasında güvenlik endişelerinin yattığını savunuyordu. Ancak açık kaynaklı modellerin popülaritesinin artması ve DeepSeek gibi alternatiflerin yükselişi şirketin tutumunu yeniden gözden geçirmesine neden oldu. Altman, bu yılın başlarında yaptığı açıklamada, "Tarihin yanlış tarafında yer aldık" diyerek bu konuda geç kaldıklarını kabul etmişti.

Akıl da yürütebiliyor

GPT-OSS, OpenAI’nin yalnızca yazı üretmekle kalmayan, aynı zamanda akıl yürütme, internette tarama, kod yazma ve API aracılığıyla ajan çalıştırma gibi gelişmiş görevleri de yerine getirebilen bir model olarak öne çıkıyor.

Öte yandna OpenAI, GPT-OSS’nin şimdiye kadar en kapsamlı güvenlik testlerinden geçen modeli olduğunu vurguluyor. Siber güvenlik ve biyolojik tehditler gibi hassas konularda harici güvenlik firmalarının da katkısıyla test edilen model karar alma sürecini görünür kılan “zincirleme düşünce” (chain-of-thought) yöntemini de barındırıyor.

Ayrıca Bkz.Google Genie 3 tanıtıldı: Böylesi daha önce çıkmadı, işte detaylar

OpenAI, açık modellerin eğitiminde kapalı modellerle benzer bir süreç izlediğini belirtiyor. Her iki model de “mixture-of-experts” (MoE) yaklaşımı ile eğitildi. Bu teknik, her token için tüm parametreler yerine yalnızca gerekli olanları aktive ederek verimliliği artırıyor. Ayrıca her iki model, yüksek işlem gücüne sahip takviyeli öğrenme (RL) sürecinden geçirildi.

Performansı nasıl?

Yine de OpenAI, GPT-OSS modellerinin açık ağırlıklı modeller arasında lider konuma geldiğini savunuyor. Kodlama platformu Codeforces üzerinde GPT-OSS-120B modeli 2622, GPT-OSS-20B modeli ise 2516 puan alarak DeepSeek’in R1 modelini geride bırakabiliyor. Ancak bu skorlar kapalı o3 ve o4-mini modellerinin gerisinde

GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde. Şirketin kendi kıyaslaması olan PersonQA testine göre GPT-OSS-120B modelinin halüsinasyon oranı yüzde 49, 20B modelinin ise yüzde 53. Bu oranlar, o1 modelinin yüzde 16’lık ve o4-mini’nin yüzde 36’lık oranlarının oldukça üzerinde.

Kaynak:https://openai.com/index/introducing-gpt-oss/
Kaynak:https://www.theverge.com/openai/718785/openai-gpt-oss-open-model-release

Haberi Portalda Gör

En Çok Beğenilenler Tümü Saat Gün Hafta Ay Yıl ✔ Tümü Tüm Yorumları Aç

Bu halüsinasyon oranı nedir ya %50 bir dediği bir dediğini tutmaz modellerin

Yoruma Git darkem - 2 ay +3 ▲

joven

2 ay

Yarbay

Sanal zeka gazı açık ara verilmeye devam ediliyor..Buna ençok sevinenler Donanım üreticileri oluyor.

Bu mesaja 1 cevap geldi.

darkem

2 ay

Teğmen

Bu halüsinasyon oranı nedir ya %50 bir dediği bir dediğini tutmaz modellerin

< Bu ileti Android uygulamasından atıldı >

Epirus

2 ay

Binbaşı

Alternatif konu başlığı:

GPT-OSS Halüsinasyon Rekorları Kırmaya Devam Ediyor

quote:

GPT-OSS modellerinin bir diğer zayıf karnı ise halüsinasyonlar. Modeller, önceki modellere kıyasla daha yüksek oranda yanlış bilgi üretme eğiliminde

< Bu ileti mini sürüm kullanılarak atıldı >

Dropzone

2 ay

Yüzbaşı

yarı yarıya halüsinasyon gören bir zekaya neyi danışabiliriz ki ?

Arondir

2 ay

Binbaşı

Ne gazı ya istediğin soruyu sor anında cevap veriyor daha napsın muhteşem birşey.

Bu mesajda bahsedilenler: @joven

bkaakco

2 ay

Yarbay

Bu kadarını gerçekten isteyen kaç kişi vardır dünyada? Bence bu işin suyu çıkmaya başladı. Tamam ben de kullanıyorum ama ne yapalım dünyayı da mı teslim edelim yapay zekaya?

< Bu ileti mobil sürüm kullanılarak atıldı >

Cevap Yaz

1. sayfa

Tüm Forumlar Donanım / Hardware Anasayfa Haberleri OpenAI’dan sürpriz: Açık ağırlıklı GPT-OSS tanıtıldı, neler yapabiliyor?