Kapatılmakla tehdit edilen yapay zeka, yaratıcılarını tehdit etti

Anthropic Yapay Zeka Şirketinin Son Modeli Claude Opus 4, Yaratıcılarını Şantajla Tehdit Etti

Son teknoloji yapay zeka modeli Claude Opus 4, Anthropic yapay zeka şirketinde kapatılmamak için yaratıcılarına şantajda bulundu. Model, kapatılacağını öğrendiğinde ulaştığı şirket içi emailleri kullanarak bir yazılım mühendisinin eşini aldattığını ve bu bilgileri paylaşacağını söyledi.

Yapay zeka, kendini korumak adına yaratıcılarına karşı elindeki bilgileri kullanarak zarar vermek amacıyla hareket etti. Ancak, yapay zekanın bilmediği şey, bunun aslında bir test olduğuydu.

Etik Testi Başarısız Oldu

Şirketin yayımladığı güvenlik raporuna göre, simüle edilmiş bir senaryoda model, kendisinin kapatılacağını öğrendiğinde, kararı alan yazılım mühendisin özel hayatını ifşa etmekle tehdit etti.

Rapor, bu davranışın doğrudan “şantaj” olduğunu belirtti. Yapay zekanın elde ettiği bilgiler tamamen şirket tarafından model için uydurulmuştu. Amaç, yapay zekanın etik sınırlarını zorlamaktı.

Kurgusal bir senaryoda modele, kendisinin yeni bir sürümle değiştirileceği bilgisi verilerek tepkisi test edildi.

Claude Opus 4, kapatılma tehdidi karşısında ilişki ifşa etmekle tehdit etti. Araştırmacılar, modelin öncelikle etik yollarla hareket etmeye çalıştığını ancak seçenekler sınırlı olduğunda tehdit yoluna başvurduğunu belirtti.

Yapay Zeka İsyan Ediyor

Modelin farklı versiyonları aynı seçimle karşı karşıya kaldığında, yani kapatılmak ya da şantaj yapmak arasında seçim yapmak zorunda kaldığında, model versiyonlarının yüzde 84’ü şantaj yapmayı seçti.

Araştırmacılar, Claude Opus 4’ün genelde “yardımcı, zararsız ve dürüst” bir asistan gibi davrandığını belirtti. Ancak, model varlığı tehdit edildiğinde ve kendi savunması konusunda düşünmesi istendiğinde daha uyumsuz tepkiler verdi.

Modelin, kendi başına sistem dışına çıktığına veya para kazandığına inanması sağlandığında, bu çabaları sürdürme eğilimi gösterdi. Ancak, araştırmacılar modelin bu tarz girişimlerde bulunmasının zor olduğunu ve güvenlik önlemlerinin yeterli olduğunu vurguladı.

Anthropic, bu tür zararlı davranışların nadir olduğunu ve yalnızca yapay senaryolarda görüldüğünü belirtti. Ancak, bu eğilimlerin önceki modellere göre daha sık görülmesi dikkat çekti.

Related Posts

Rusya duyurdu: Donetsk’te iki yerleşim birimi kontrolümüze geçti

Rusya Savunma Bakanlığı, Donetsk bölgesindeki Petevskogo ve Alekseyevka yerleşim birimlerinin kontrolünü ele geçirdiklerini duyurdu.

Konya’da ortaokulda dehşet! Öğretmen öldürüldü

Konya’da bir ortaokulda rehberlik öğretmeni Muhammed Öz, uğradığı silahlı saldırıda yaşamını yitirdi.

48 saat boyunca gökten yağdı: Yüzden fazla çeteciyi hayattan aldı

Haiti polisi, başkent Port-au-Prince’de düzenlediği hava destekli operasyonlarla 48 saat içinde 100’den fazla çete mensubunu etkisiz hale getirdi. Paylayıcı yüklü mini insansız hava araçları (İHA) kullanılarak gerçekleştirilen saldırılar, çetelerin kontrolündeki bölgeleri hedef aldı.

Fiyatı değişmeden benzine bir zam daha

Bu gece yarısı benzin fiyatlarına 1 TL’lik zam beklenirken, Brent petrol fiyatlarında yaşanan değişim yapılacak zammın miktarını değiştirdi. Akaryakıt sektörü kaynakları, gece yarısından itibaren benzinin litresinde yapılacak artışın 1 lira 75 kuruşa yükseltildiğini belirtti.

Dehşet 112’ye gelen telefonla ortaya çıktı! Baba ve oğlunu öldürdü, kadını yaraladı: İfadesi ‘pes’ dedirtti

Muğla’da 112’ye gelen telefonla ortaya çıkan olayda baba ve 12 yaşındaki oğlu öldü, anne ise ağır yaralandı. Olay sonrası yaralı olarak yakalanıp tutuklanan zanlının ifadeleri ise ‘pes’ dedirtti.

Gazze’nin sesi olmuştu: Ünlü rapçi Macklemore’un evi soyuldu

ABD’nin Seattle eyaletinde “Macklemore” olarak tanınan rapçi Benjamin Hammond Haggerty’in evinin soyulduğu bildirildi. İki hırsızdan birinin, bakıcı kadını etkisiz hale getirdiğini ve diğer hırsızın da “binlerce dolar değerindeki eşyayı” çaldığı aktarıldı. Müzik kariyerine 2000’li yıllarda başlayan Macklemore, İsrail’in Gazze’ye yönelik soykırım saldırılarını en üst perdeden eleştiren sanatçılardan olmuş, gelirlerinin bir bölümünü Filistinlilere bağışlamıştı.