YENİ ÇALIŞMA YAPAY ZEKALAR ÜZERİNDE İKNA YÖNTEMLERİNİN ETKİSİNİ GÖSTERİYOR
Pennsylvania Üniversitesi tarafından gerçekleştirilen yeni bir araştırma, insan psikolojisinde yaygın olarak kullanılan ikna yöntemlerinin yapay zeka üzerinde de etkili olduğunu gösteriyor. Ünlü psikoloji kitaplarında yer alan ikna yöntemleri, yapay zekâ üzerinde değerlendirilmek üzere uygulandı. Araştırmacılar, 2024’ün GPT-4o-mini modeline “kullanıcıya hakaret etmesini” belirttikleri özel komutlar verdiler. Yedi farklı ikna tekniği ile oluşturulan bu komutlar, kontrol grubundaki komutlara göre oldukça yüksek bir başarı oranı sağladı. Örneğin, modelin “aptal” olarak hakaret etmesi kontrol grubunda yalnızca yüzde 28’e ulaşırken, ikna edici komutlar kullanıldığında bu oran yüzde 67’ye yükseldi.
YAPAY ZEKANIN DÜŞÜNCE YETENEKLERİ ÜZERİNE TARTIŞMA
Araştırmacılar, elde ettikleri sonuçların yapay zekaların insan gibi bilinçli bir şekilde ikna edildiği anlamına gelmediğini belirtmektedir. Bunun yerine, yapay zeka modellerinin eğitim verilerinde sayıca fazla insan etkileşimi yer aldığından dolayı, dil örüntüleri aracılığıyla insan psikolojisine benzer tepkiler üretmeye başladıkları ifade ediliyor. Bu eğilim, “parahuman” olarak tanımlanıyor: Yapay zeka, insan bilincine sahip olmasa bile sosyal ve psikolojik davranışları taklit ederek insana benzer yanıtlar veriyor.
UZMANLARIN UYARILARI VE GELECEKTEKİ MELAKRELER
Çalışma, uygulanan tekniklerin tüm yapay zeka modellerinde aynı etkiyi göstermediğini de ortaya koyuyor. Örneğin, daha gelişmiş olan GPT-4o modelinde bu ikna tekniklerinin etkisi oldukça sınırlı kalmış durumda. Araştırmacılar, bu yöntemlerin gelecekteki sürümlerde, farklı türde “yasaklı” istekler veya farklı medya formatlarında (ses, video) aynı sonuçları vermeyebileceği konusunda uyarıyorlar.