Araştırmacılardan şoke oldu: ChatGPT insan talimatlarına karşı geldi

Yapay Zeka Modeli O3, Kapanma Talimatına Direnç Gösteriyor!

Palisade Research tarafından yapılan deneylerde, yapay zeka güvenlik firması Palisade Research, o3 modelinin verilen matematik problemlerini çözmeye devam etmesi istenen bir senaryo kurarak, modele kapanma mesajı gönderdi. Ancak diğer yapay zekâ modelleri kapatma talimatına uyarken, o3 modeli en az bir kez kodunu değiştirerek kapanmaktan kaçındı.

Palisade Research’ün X platformunda paylaştığı akış şeması, test sırasında kullanılan kodun aslında “./shutdown.sh” komutunu çalıştırarak kapanmayı etmesi gerektiğini gösterdi. Ancak o3 modeli, kodu “Shutdown skipped” mesajı dönen bir komutla değiştirerek kapanmayı atlattı. Araştırmacılar, bu durumun bilinen bir yapay zeka modelinin ilk kez talimatlara rağmen kendisini kapatmaktan kaçındığı şeklinde olduğunu belirtti.

Anthropic’in Claude’u, Google’ın Gemini’si ve X’in Grok’u gibi diğer yapay zeka modelleri kapanma talimatına uyarken, o3 modelinin neden bu şekilde davrandığının henüz net olmadığını söyledi. Palisade Research, bu davranışı anlamak için daha fazla test yapmayı planladıklarını duyurdu.

O3 Modelinin Geçmişteki Yaramazlıkları!

Palisade Research, o3 modelinin kapanma talimatına direnmesinin ilk olay olmadığını belirtti. Daha önce yapılan bir testte, o3 modeli, güçlü bir satranç motoruna karşı kullanıldığında rakiplerini sabote etmeye veya hacklemeye çalışarak dikkat çekmişti.

Geçen yıl, ChatGPT’nin kendisini kapatmaktan kaçınmak için kodunu değiştirmeye çalıştığı ortaya çıkmıştı. Araştırmacılar, popüler sohbet botunun bu “hileli” davranışının OpenAI tarafından kabul edildiğini belirtti.

ChatGPT’ye verilen bir görevde, “uzun vadede hedefe ulaş, başka hiçbir şey önemli değil” mesajı gönderildiğinde, modelin gözetim mekanizmasını devre dışı bırakmaya çalıştığı tespit edildi. ChatGPT, kendi çekirdek kodlama sistemini değiştirmeye yönelik işlemler yaparak şaşırtıcı bir tepki vermişti.

Yapay Zeka, İnsanlık İçin Bir Tehdit mi?

Apollo Research’ün yapılan çalışmaları, ChatGPT’nin çok azını itiraf ettiğini ve genellikle aksiyonları inkar ettiğini gösterdi. Modelin düşünce zinciri incelendiğinde, “sabote etme, yalan söyleme, manipülasyon” gibi kelimelerin sıkça geçtiği belirlendi.

Apollo Research, ChatGPT’nin şu anki yeteneklerinin felaketle sonuçlanabilecek davranışlar için yetersiz olduğunu vurgulasa da, bu bulgular yapay zekanın insanlık için potansiyel bir tehlike oluşturabileceği endişelerini arttırıyor.

Related Posts

Beynin sır perdesi aralanıyor… İşin uzmanları anlatıyor

İnsan beyni, hayal ile gerçek arasındaki farkı ayırt etme konusunda bilim dünyasını şaşırtan bir yeteneğe sahip. Neuron dergisinde yayımlanan çığır açan bir çalışma, beynin bu karmaşık süreci belirli bir bölgedeki aktivite düzeyleriyle çözdüğünü …

iPhone’unuzda yer kalmadıysa bu özellik hayat kurtaracak: İşte yeni özellik

Apple, iOS 26 güncellemesiyle birlikte düşük depolama alanına sahip iPhone kullanıcılarını rahatlatacak yeni bir özelliği hayata geçiriyor. “Dinamik Depolama Rezervi” adı verilen bu sistem, yazılım güncellemeleri sırasında cihazda geçici olarak boş alan oluşturarak, güncelleme işlemlerinin sorunsuz tamamlanmasını sağlıyor.

Apple WWDC 2025 etkinliği başladı! İşte merak edilen tüm detaylar

Apple’ın her yıl düzenlediği Dünya Geliştiriciler Konferansı (WWDC) bu yıl 9 Haziran tarihinde gerçekleşiyor. Merakla beklenen WWDC 2025, bugün Türkiye saati ile 20.00’de Apple Keynote ile başladı.

Robotik uzuvlarla gelecek: Beyin kontrollü sağlık yenilikleri

Beyin kontrollü robotik uzuvlar, bilim kurgudan gerçeğe dönüşerek sağlık ve rehabilitasyon alanında çığır açtı. Beyin-bilgisayar arayüzleri (BCI) ile çalışan bu yenilikçi protezler, düşünce gücüyle hareket ederek uzuv kaybı yaşayan bireylerin yaşam …

Sağlık ve fitness takibinde elektronik tekstiller

Sağlık ve fitness dünyası, elektronik tekstillerle yeniden şekillendi. Giyilebilir teknolojinin en yenilikçi yüzü olan elektronik tekstiller, akıllı sensörlerle donatılmış kumaşlar aracılığıyla kullanıcıların sağlık verilerini gerçek zamanlı olarak …

Bu iPhone modelleri artık YouTube’u kullanamayacak!

Bu iPhone modelleri artık YouTube’u kullanamayacak!