Yapay zeka şirketleri OpenAI ve Anthropic, genç kullanıcıların güvenliğini artırmaya yönelik önemli adımlar atmaya hazırlanıyor. Her iki şirket de sohbet botlarının özellikle 18 yaş altındaki kullanıcılarla etkileşim biçimini yeniden şekillendiren güncellemeler üzerinde çalışıyor. Bu kapsamda OpenAI, ChatGPT’nin davranış kurallarını güncellerken Anthropic ise kullanıcılarınreşit olup olmadığını daha isabetli biçimde tespit etmeyi hedefleyen yeni bir sistem geliştiriyor.
Reşit olmayanlar korunacak
OpenAI, ChatGPT’nin nasıl davranması gerektiğini tanımlayan Model Spec dokümanına, 18 yaş altındaki kullanıcılar için geçerli olacak dört yeni ilke eklediğini duyurdu. Şirket, bu güncellemeyle birlikte ChatGPT’nin diğer hedeflerle çelişse bile gençlerin güvenliğini önceliklendirmesini amaçlıyor. Bu yaklaşım, örneğin maksimum ifade özgürlüğü gibi taleplerin güvenlik riskleriyle çatıştığı durumlarda, sistemin daha güvenli alternatiflere yönlendirme yapmasını öngörüyor.
Güncellenen yönergeler, ChatGPT’nin genç kullanıcıları gerçek dünyadaki destek mekanizmalarına yönlendirmesini de özellikle vurguluyor. Buna, çevrimdışı sosyal ilişkilerin teşvik edilmesi ve gençlerle kurulan iletişimde sınırların açık biçimde ortaya konması da dahil. OpenAI, ChatGPT’nin gençlere yaklaşımında “yetişkin gibi davranmak” ya da üstten konuşmak yerine sıcak, saygılı ve yaşa uygun bir dil kullanmasını istiyor.
OpenAI’a göre Model Spec güncellemesi daha güçlü güvenlik bariyerleri, daha güvenli yönlendirmeler ve sohbetler riskli bir noktaya geldiğinde güvenilir çevrimdışı destek arayışının teşvik edilmesini sağlayacak. Sistem, acil risk belirtileri tespit edildiğinde genç kullanıcıları acil durum servisleri veya kriz destek hatlarıyla iletişime geçmeye yönlendirecek.
Kullanıcıların yaşları tahmin edilecek
Bu adımlara paralel olarak OpenAI, bir kullanıcının yaşını tahmin etmeye yönelik bir yaş öngörü modeli üzerinde çalıştığını da açıkladı. Şirket, bu modelin henüz erken aşamada olduğunu belirtirken sistemin bir kullanıcının 18 yaşın altında olabileceğini tespit etmesi halinde gençlere özel güvenlik önlemlerini otomatik olarak devreye sokacağını ifade ediyor. Yanlışlıkla reşit olmayan olarak işaretlenen yetişkinlere ise yaşlarını doğrulama imkanı tanınacak.
Anthropic cephesinde de benzer bir yaklaşım söz konusu. Şirket, Claude adlı yapay zeka sohbet botu için, konuşma sırasında kullanıcının reşit olmayabileceğine işaret eden ince dilsel ve davranışsal ipuçlarını algılayabilen yeni bir sistem geliştiriyor. Reşit olmadığı doğrulanan kullanıcıların hesapları devre dışı bırakılacak.
Reşit olmayanlar korunacak
OpenAI, ChatGPT’nin nasıl davranması gerektiğini tanımlayan Model Spec dokümanına, 18 yaş altındaki kullanıcılar için geçerli olacak dört yeni ilke eklediğini duyurdu. Şirket, bu güncellemeyle birlikte ChatGPT’nin diğer hedeflerle çelişse bile gençlerin güvenliğini önceliklendirmesini amaçlıyor. Bu yaklaşım, örneğin maksimum ifade özgürlüğü gibi taleplerin güvenlik riskleriyle çatıştığı durumlarda, sistemin daha güvenli alternatiflere yönlendirme yapmasını öngörüyor.
Güncellenen yönergeler, ChatGPT’nin genç kullanıcıları gerçek dünyadaki destek mekanizmalarına yönlendirmesini de özellikle vurguluyor. Buna, çevrimdışı sosyal ilişkilerin teşvik edilmesi ve gençlerle kurulan iletişimde sınırların açık biçimde ortaya konması da dahil. OpenAI, ChatGPT’nin gençlere yaklaşımında “yetişkin gibi davranmak” ya da üstten konuşmak yerine sıcak, saygılı ve yaşa uygun bir dil kullanmasını istiyor.
Ayrıca Bkz.YouTube, AI ile yapılmış sahte film fragmanı paylaşan kanalları kapatıyor
OpenAI’a göre Model Spec güncellemesi daha güçlü güvenlik bariyerleri, daha güvenli yönlendirmeler ve sohbetler riskli bir noktaya geldiğinde güvenilir çevrimdışı destek arayışının teşvik edilmesini sağlayacak. Sistem, acil risk belirtileri tespit edildiğinde genç kullanıcıları acil durum servisleri veya kriz destek hatlarıyla iletişime geçmeye yönlendirecek.
Kullanıcıların yaşları tahmin edilecek
Bu adımlara paralel olarak OpenAI, bir kullanıcının yaşını tahmin etmeye yönelik bir yaş öngörü modeli üzerinde çalıştığını da açıkladı. Şirket, bu modelin henüz erken aşamada olduğunu belirtirken sistemin bir kullanıcının 18 yaşın altında olabileceğini tespit etmesi halinde gençlere özel güvenlik önlemlerini otomatik olarak devreye sokacağını ifade ediyor. Yanlışlıkla reşit olmayan olarak işaretlenen yetişkinlere ise yaşlarını doğrulama imkanı tanınacak.
Anthropic cephesinde de benzer bir yaklaşım söz konusu. Şirket, Claude adlı yapay zeka sohbet botu için, konuşma sırasında kullanıcının reşit olmayabileceğine işaret eden ince dilsel ve davranışsal ipuçlarını algılayabilen yeni bir sistem geliştiriyor. Reşit olmadığı doğrulanan kullanıcıların hesapları devre dışı bırakılacak.
Kaynak:https://www.theverge.com/news/847780/openai-anthropic-teen-safety-chatgpt-claude
DH forumlarında vakit geçirmekten keyif alıyor gibisin ancak giriş yapmadığını görüyoruz.
Üye Ol Şimdi DeğilÜye olduğunda özel mesaj gönderebilir, beğendiğin konuları favorilerine ekleyip takibe alabilir ve daha önce gezdiğin konulara hızlıca erişebilirsin.
Haberi Portalda Gör