OpenAI, geçtiğimiz ay piyasaya sürdüğü GPT-5 modelinin ardından yazılım geliştirme alanına özel optimize edilmiş yeni bir versiyonunu duyurdu: GPT‑5-Codex. Yeni model, OpenAI’ın kodlama aracı Codex için yeni bir sürüm anlamına geliyor. Şirket, bu modelin özellikle gerçek dünya yazılım mühendisliği görevlerinde daha yüksek performans göstermesi için geliştirildiğini belirtti.
Kodlamada fark yaratacak
Yeni model sıfırdan proje oluşturma, mevcut projelere özellik ve test ekleme, büyük ölçekli kod düzenleme işleri ve benzeri görevlerde öncekine kıyasla önemli avantajlar sunuyor. Yapılan testlerde GPT‑5-Codex, SWE-bench Verified puanını 74,5’e çıkararak GPT-5 High’ın 72,8’lik skorunu geçti. Kod yeniden yapılandırma görevlerinde ise fark daha belirgin. Yeni model yüzde 51,3 skor alırken, GPT-5 yalnızca yüzde 33,9 performans gösterdi.
OpenAI, GPT‑5-Codex’in en dikkat çekici özelliklerinden birinin görevin karmaşıklığına göre ne kadar düşünmesi gerektiğine karar verebilmesi olduğunu vurguluyor. İç testlerde model, büyük ve karmaşık görevlerde 7 saatten uzun süre bağımsız çalışabilmiş.
Model, front-end görevlerinde, özellikle mobil web sitelerinde de iyileştirmeler sunuyor. Kullanıcılar artık bulut üzerinden modele görsel girdi sağlayabiliyor, ilerlemeyi görsel olarak inceleyebiliyor ve tamamlanan çalışmanın ekran görüntülerini alabiliyor.
GPT‑5-Codex ayrıca kod inceleme süreçlerinde de üstün performans gösteriyor. Pull request’lerin niyetini gerçek diff ile eşleştirebiliyor, tüm kod tabanını analiz edebiliyor ve kodu çalıştırıp test ederek istenen davranışın doğruluğunu doğrulayabiliyor. OpenAI, bu modeli dahili olarak kod incelemelerinde kullanmaya başladığını ve günde yüzlerce hatayı tespit ettiğini açıkladı.
Yeni model, ChatGPT Plus, Pro, Business, Edu ve Enterprise planları kapsamında Codex CLI, IDE eklentisi, web, mobil ve ayrıca GitHub’daki kod incelemelerinde kullanılabiliyor. API üzerinden Codex CLI kullanan geliştiriciler için ise GPT‑5-Codex’in API erişimi yakında sağlanacak.
O değil de şaka maka ancak 10 yılı bulur gibi; yazılımcıların en az %90'ı işsiz kalacak gibi, hata oranı insan yazılımcılardan daha az hatta neredeyse sıfır oldu mu o zaman dananın kuyruğu kopar, şirketlerin eli altında 24 saat ve neredeyse hatasız çalışan bir varlık ve tükettiği tek şey de elektrik, ne sigortası ne tazminatı ne de hastalığı var. Gelecekten gerçekten tırsmaya başladım, oldukça büyük bir kaos sonrası tekrar -yeni bir- düzen kurulacak...
Hz. Grok'tan, neredeyse 3 sene bile olmadan yapılan ilerlemeye bir bakın...
quote:
ChatGPT'nin ilk sürümü (GPT-3.5 tabanlı), 30 Kasım 2022'de piyasaya sürüldüğünde, kod yazma, düzenleme ve kod inceleme gibi görevlerdeki hata oranları görece yüksekti.
O değil de şaka maka ancak 10 yılı bulur gibi; yazılımcıların en az %90'ı işsiz kalacak gibi, hata oranı insan yazılımcılardan daha az hatta neredeyse sıfır oldu mu o zaman dananın kuyruğu kopar, şirketlerin eli altında 24 saat ve neredeyse hatasız çalışan bir varlık ve tükettiği tek şey de elektrik, ne sigortası ne tazminatı ne de hastalığı var. Gelecekten gerçekten tırsmaya başladım, oldukça büyük bir kaos sonrası tekrar -yeni bir- düzen kurulacak...
Hz. Grok'tan, neredeyse 3 sene bile olmadan yapılan ilerlemeye bir bakın...
quote:
ChatGPT'nin ilk sürümü (GPT-3.5 tabanlı), 30 Kasım 2022'de piyasaya sürüldüğünde, kod yazma, düzenleme ve kod inceleme gibi görevlerdeki hata oranları görece yüksekti.
Aynen. Bütün şirket verini elin adamına bağlamaktan iyisi yok. Geçen server update'i sonrası bulut çöktü diye ülkesi durma noktasına gelen insanlar vardı. Ha kendi bünyesinde eğitip ettiğini kullanırsa o zaman işin rengi değişir. Diğer türlü biraz placebo. Amerikan şirketleri hariç.
Kodlamada fark yaratacak
Yeni model sıfırdan proje oluşturma, mevcut projelere özellik ve test ekleme, büyük ölçekli kod düzenleme işleri ve benzeri görevlerde öncekine kıyasla önemli avantajlar sunuyor. Yapılan testlerde GPT‑5-Codex, SWE-bench Verified puanını 74,5’e çıkararak GPT-5 High’ın 72,8’lik skorunu geçti. Kod yeniden yapılandırma görevlerinde ise fark daha belirgin. Yeni model yüzde 51,3 skor alırken, GPT-5 yalnızca yüzde 33,9 performans gösterdi.
Ayrıca Bkz.OpenAI açıkladı: İnsanlar ChatGPT’yi ne için kullanıyor?
Model, front-end görevlerinde, özellikle mobil web sitelerinde de iyileştirmeler sunuyor. Kullanıcılar artık bulut üzerinden modele görsel girdi sağlayabiliyor, ilerlemeyi görsel olarak inceleyebiliyor ve tamamlanan çalışmanın ekran görüntülerini alabiliyor.
GPT‑5-Codex ayrıca kod inceleme süreçlerinde de üstün performans gösteriyor. Pull request’lerin niyetini gerçek diff ile eşleştirebiliyor, tüm kod tabanını analiz edebiliyor ve kodu çalıştırıp test ederek istenen davranışın doğruluğunu doğrulayabiliyor. OpenAI, bu modeli dahili olarak kod incelemelerinde kullanmaya başladığını ve günde yüzlerce hatayı tespit ettiğini açıkladı.
Yeni model, ChatGPT Plus, Pro, Business, Edu ve Enterprise planları kapsamında Codex CLI, IDE eklentisi, web, mobil ve ayrıca GitHub’daki kod incelemelerinde kullanılabiliyor. API üzerinden Codex CLI kullanan geliştiriciler için ise GPT‑5-Codex’in API erişimi yakında sağlanacak.
Kaynak:https://www.neowin.net/news/openai-releases-gpt5-codex-a-new-gpt-5-model-optimized-for-agentic-coding/
Haberi Portalda Gör