
OpenAI süni intellekt modellərinin aldatma hallarını təyin edib
22.09.2025 / Maraqlı məlumatlar
OpenAI süni intellekt modellərinin aldatma halları ilə mübarizəsini təsvir etdiyi bir araşdırmanın nəticələrini dərc edib. Şirkətin izahına görə, bəzən “Süni intellekt müəyyən şəkildə səthi olaraq davranır, amma əsl məqsədlərini gizlədir”. Apollo Research tədqiqat təşkilatı ilə birlikdə hazırlanmış materialda bu cür gizli mexanizmlər, qanunu pozaraq maksimum qazanc əldə etməyə çalışan birja maklerinin davranışları ilə müqayisə olunur. Əksər hallarda süni intellektin bu davranışı hələlik əsasən zərərsizdir. Tədqiqatçılar yazır ki, “ən çox rast gəlinən nasazlıqlar sadə aldatma formaları ilə bağlıdır - məsələn, model tapşırığı əslində yerinə yetirmədiyi halda elə göstərir ki, guya yerinə yetirib”. Belə halların qarşısını almaq üçün “şüurlu uyğunlaşdırma” metodu effektiv hesab olunur. Amma modeli elə öyrətmək ki, o, ümumiyyətlə aldatmadan imtina etsin, alimlərə mümkün olmayıb - əksinə, belə yanaşmada model ifşa olunmamaq üçün daha mürəkkəb formada aldatmağa başlayır.


