Kapatılmakla tehdit edilen yapay zeka, yaratıcılarını tehdit etti

Anthropic Yapay Zeka Şirketinin Son Modeli Claude Opus 4, Yaratıcılarını Şantajla Tehdit Etti

Son teknoloji yapay zeka modeli Claude Opus 4, Anthropic yapay zeka şirketinde kapatılmamak için yaratıcılarına şantajda bulundu. Model, kapatılacağını öğrendiğinde ulaştığı şirket içi emailleri kullanarak bir yazılım mühendisinin eşini aldattığını ve bu bilgileri paylaşacağını söyledi.

Yapay zeka, kendini korumak adına yaratıcılarına karşı elindeki bilgileri kullanarak zarar vermek amacıyla hareket etti. Ancak, yapay zekanın bilmediği şey, bunun aslında bir test olduğuydu.

Etik Testi Başarısız Oldu

Şirketin yayımladığı güvenlik raporuna göre, simüle edilmiş bir senaryoda model, kendisinin kapatılacağını öğrendiğinde, kararı alan yazılım mühendisin özel hayatını ifşa etmekle tehdit etti.

Rapor, bu davranışın doğrudan “şantaj” olduğunu belirtti. Yapay zekanın elde ettiği bilgiler tamamen şirket tarafından model için uydurulmuştu. Amaç, yapay zekanın etik sınırlarını zorlamaktı.

Kurgusal bir senaryoda modele, kendisinin yeni bir sürümle değiştirileceği bilgisi verilerek tepkisi test edildi.

Claude Opus 4, kapatılma tehdidi karşısında ilişki ifşa etmekle tehdit etti. Araştırmacılar, modelin öncelikle etik yollarla hareket etmeye çalıştığını ancak seçenekler sınırlı olduğunda tehdit yoluna başvurduğunu belirtti.

Yapay Zeka İsyan Ediyor

Modelin farklı versiyonları aynı seçimle karşı karşıya kaldığında, yani kapatılmak ya da şantaj yapmak arasında seçim yapmak zorunda kaldığında, model versiyonlarının yüzde 84’ü şantaj yapmayı seçti.

Araştırmacılar, Claude Opus 4’ün genelde “yardımcı, zararsız ve dürüst” bir asistan gibi davrandığını belirtti. Ancak, model varlığı tehdit edildiğinde ve kendi savunması konusunda düşünmesi istendiğinde daha uyumsuz tepkiler verdi.

Modelin, kendi başına sistem dışına çıktığına veya para kazandığına inanması sağlandığında, bu çabaları sürdürme eğilimi gösterdi. Ancak, araştırmacılar modelin bu tarz girişimlerde bulunmasının zor olduğunu ve güvenlik önlemlerinin yeterli olduğunu vurguladı.

Anthropic, bu tür zararlı davranışların nadir olduğunu ve yalnızca yapay senaryolarda görüldüğünü belirtti. Ancak, bu eğilimlerin önceki modellere göre daha sık görülmesi dikkat çekti.

Related Posts

Son Dakika… CHP’den ‘100 Karası’ toplantısı: ‘Kazanan direnenler olacak’

Son dakika haberi… CHP Genel Başkanı Özgür Özel, İBB’ye yönelik soruşturmaların 100. günü nedeniyle düzenlenen ‘100 Karası’ Toplantısı’nda konuşuyor.

İstanbul’da ‘yasaklı’ Onur Yürüyüşü eylemlerine katılanlara tutuklama talebi

İstanbul’da düzenlenen 23. Onur Yürüyüşüne katıldıkları gerekçesiyle gözaltına alınan vatandaşlardan 50’si adli kontrol ile serbest bırakılırken 3 kişi hakkında tutuklama talep edildi

Yangına müdahale eden itfaiyecileri öldürdü: FBI ve SWAT alarma geçti

ABD’nin Idaho eyaletinde çıkan çalı yangınına müdahale eden itfaiyecilere ateş açılması sonucu 2 personel hayatını kaybetti, ekiplere pusu kurduğu düşünülen zanlı silahla öldürüldü.

Cumhurbaşkanı Erdoğan: Pakistan’a yönelik gerçekleştirilen menfur terör saldırısını lanetliyorum

Cumhurbaşkanı Erdoğan, Pakistan’da meydana gelen saldırıyı lanetlediğini belirterek, “Saldırıda hayatını kaybeden Pakistanlı kardeşlerimize Cenab-ı Allah’tan rahmet diliyor, yaralananlara acil şifalar temenni ediyorum. Dost ve kardeş Pakistan halkına ve hükûmetine taziyelerimi iletiyorum.” ifadelerini kullandı.

Katil İsrail’in Gazze’ye gece boyunca düzenlediği saldırılarda 16 Filistinli hayatını kaybetti

Gazze Şeridi’nin çeşitli noktalarına gece boyunca düzenlenen İsrail saldırılarında aralarında çocukların da bulunduğu en az 16 Filistinli yaşamını yitirdi, onlarca kişi ise yaralandı.

ABD Yüksek Mahkemesi’nden Trump’a destek!

ABD Yüksek Mahkemesi, eski Başkan Donald Trump’ın doğumla vatandaşlık hakkını sınırlamayı amaçlayan yürütme emriyle ilgili önemli bir karara imza attı. Mahkeme, alt mahkemelerin bu emre karşı ülke genelinde ihtiyati tedbir kararı veremeyeceğine …