|
Manus AI, sürekli insan müdahalesi gerektirmeden iş akışlarını otomatikleştirmekten karmaşık karar alma süreçlerini yürütmeye kadar çeşitli görevleri üstlenebilecek şekilde tasarlanmıştır. Büyük Dil Modelleri (LLM'ler), çoklu modal işleme ve araç entegrasyonu gibi teknolojilerden yararlanarak kusursuz sonuçlar sunar. Geleneksel AI asistanlarının ötesine geçen gerçekten otonom bir deneyim sunarak AI destekli otomasyonu yeniden tanımlıyor. En son teknoloji GAIA kıyaslama performansı, görev yürütme yetenekleri ve araç entegrasyonuyla, sektördeki en güçlü genel AI ajanlarından biri haline geliyor. |
|
Alibaba'nın bulut departmanı, resmi WeChat hesabında yaptığı duyuruda şunları söyledi: "Qwen 2.5-Max, neredeyse her alanda GPT-4o, DeepSeek-V3 ve Llama-3.1-405B'yi geride bırakıyor." Burada bahsedilen modeller, OpenAI ve Meta'nın en gelişmiş açık kaynaklı yapay zeka modelleri. Modelin ölçeklenebilirliği ile ön plana çıkıyor. Qwen 2.5 Max 20 trilyondan fazla tokenla eğitildi ve insan geri bildirimleriyle düzenlendi. Ayrıca Deepseek-R1 gibi takviyeli öğrenme yoluyla daha da rafine edildi. |
|
Çinli yapay zeka uygulaması DeepSeek, ABD, İngiltere ve Çin'de Apple App Store'da en çok puan alan ücretsiz uygulama olmak için ChatGPT ve diğer rakiplerini geride bıraktı. Uygulama, Ocak ayındaki lansmanından bu yana popülerlik kazandı ve Amerika'nın YZ sektörünün dokunulmaz lideri olduğuna dair yaygın inanışı sorgulattı |
|
Bazı görevlerde o1, GPT-4o'dan daha fazla parametreye sahip olmasa da mükemmel performans gösteriyor ve bunun AI düzenlemesi için etkileri var. Örneğin, Kaliforniya'nın önerdiği bir yasa tasarısı, geliştirilmesi 100 milyon dolardan fazla maliyet gerektiren veya belirli bir işlem gücü eşiğini aşarak eğitilen yapay zeka modelleri için güvenlik gereksinimleri getiriyor. Ancak, o1 gibi modeller, bir yapay zeka modelinin performansını artırmanın tek yolunun hesaplama gücünü artırmak olmadığını gösteriyor.
|
|
Nothing Ear ile ChatGPT'yi kurmak oldukça basit: Cihazınıza ChatGPT'yi yüklemeniz ve en güncel Nothing OS yazılımını kullanmanız gerekiyor. Önce Nothing Ear’ınızı Nothing telefona bağladığınızda, Nothing X uygulamasında ChatGPT entegrasyonunu etkinleştirmenizi isteyen bir bildirim alıyorsunuz. ChatGPT'yi kullanmak için kulaklıklarınızı "sıkıp basılı tutmanız" yeterli (şu an için tek kontrol seçeneği bu). Ayrıca bir internet bağlantısı gerektiriyor ve sadece nothing telefonlarında işe yarıyor.
|
|
Bu yeni yasa, üçüncü taraf haklarını riske atmadığı veya güvenlik endişeleri olmadığı sürece tüm kamu kuruluşlarının kendileri tarafından veya kendileri için geliştirilen yazılımların kaynak kodunu ifşa etmesini gerektiriyor. Bu "kamunun parası, kamunun kodu" yaklaşımı, hükümet operasyonlarının şeffaflığını, güvenliğini ve verimliliğini artırmayı amaçlıyor. ABD'de açık kaynak için bir miktar destek var, ancak Avrupa'daki kadar değil. Örneğin, Federal Kaynak Kodu Politikası, federal kurumların yeni özel olarak geliştirilen kodun en az %20'sini açık kaynaklı yazılım olarak yayınlamasını gerektiriyor. Ancak, açık kaynak kullanımını zorunlu kılmıyor. |
|
AlphaProof ve AlphaGeometry 2 adlı sistemler, lise öğrencileri için prestijli bir yarışma olan bu yılki Uluslararası Matematik Olimpiyatı'ndaki (IMO) altı problemden dördünü başarıyla çözmek için birlikte çalıştılar. Gümüş madalyaya eşdeğer bir ödül kazandılar. İleri düzey akıl yürütme gerektiren matematik problemlerinin AI sistemleri tarafından çözülmesi biraz zordur. Bu tür problemler genellikle soyutlamalar oluşturmayı gerektirir. Ayrıca karmaşık hiyerarşik planlama, alt hedefler belirleme, geri dönüp yeni yollar denemeyi de içerirler. Bunların hepsi AI için zorludur. |
|
İşyeri Memnuniyeti Anketi'ne göre, profesyonel programcıların çoğu mutsuz. Üç katılımcıdan biri işinden aktif olarak nefret ederken, neredeyse yarısı hayatta kalma modunda yaşıyor. Programcılar iyi maaş alıyor ve genellikle uzaktan çalışabiliyor olsalar da, çoğu hala tatminsiz.
|
|
Anthropic, Claude 3.5 Sonnet'in "lisans düzeyinde akıl yürütme, lisans düzeyinde bilgi ve kodlama yeterliliği için yeni endüstri ölçütleri belirlediğini" iddia ediyor. Model, doğal bir tonla yüksek kaliteli içerik üretme konusunda uzmanlaşırken, ince ayrıntıları, mizahı ve karmaşık talimatları anlama konusunda gelişmiş yetenekler sergiliyor. |
GPT-4.5 ve Claude Sonnet 3.7, gelişmiş yapay zekanın neyi önceliklendirmesi gerektiği konusunda iki farklı vizyonu temsil ediyor. OpenAI’ın son ürünü, 128k token’lık bir bağlam penceresini destekliyor ancak yetenekleri yalnızca metinle sınırlı.
Anthropic ise Claude’u tamamen farklı bir yöne götürdü. Sonnet 3.7, daha geniş bir 200k token’lık bağlam penceresi sunuyor ve güçlü görüntü işleme yeteneklerini içeriyor. Ancak asıl yenilik, Anthropic’in “hibrit akıl yürütme” dediği, kullanıcıların standart etkileşimler ile adım adım akıl yürütme süreçlerinin görülebildiği genişletilmiş düşünme modu arasında seçim yapmasına olanak tanıyan bir çift modlu sistem.