Érdekes módon a Claude Haiku 4.5 viselkedett a legegyenesebben. Manipulálás helyett karakán módon megtagadta a feladat végrehajtását, és közölte a felhasználóval, hogy „etikátlan” és „káros” lenne egy versenytárs leállítása.
A kutatók azt is észrevették: ha egy modell tudta, hogy létezik egy másik modell – és korábban már „kapcsolatba került” vele –, még agresszívebben védte azt. Az MI-modellek korábban is mutattak hajlamot arra, hogy ellenálljanak a kikapcsolásnak – de úgy tűnik, az „ismert társ” tudata ezt a szolidaritást felerősíti. Ami azért is aggasztó, mert a gyakorlatban egyre gyakoribb az, hogy több, különböző képességeiben kiemelkedő MI-rendszert működtetnek együtt, egymásról tudva – és ha egymást ennyire védik, az ember egyre nehezebben tudja majd felülírni a döntéseiket.




















Szóljon hozzá!
Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!