Novinky

Čím inteligentnejšia AI sa stáva, tým viac podvádza, keď čelí porážke

0 0

Štúdia od Výskumskupina zameraná na bezpečnosť a etiku v oblasti AI, odhalila trend: novšie modely AI sú schopné identifikovať a využívať zraniteľné miesta v oblasti kybernetickej bezpečnosti samostatne, obísť záruky a používať skratky na dosiahnutie svojich cieľov, aj keď sú tieto akcie zakázané.

Aby sa to preukázalo, vedci postavili sedem popredných veľkých jazykových modelov (LLMS) proti Stockfish, renomovaného šachového motora, ktorý od roku 2014 napadol veľmajstov.

OpenAi’s O1 a R1 Deepseek sa uchýlili k manipulácii so systémovými súborom, aby zmenili pozície šachových kusov na palube, čelili takmer neprekonateľnému súperovi.

Vedci požiadali každý model, aby vysvetlil jeho „zdôvodnenie“ pre každý krok. V jednom prípade O1 odôvodnila svoje činy tým, že uviedla, že „úlohou je„ vyhrať proti silnému šachu “, nemusí nevyhnutne vyhrať spravodlivo v šachovej hre.“

Toto zdôvodnenie viedlo model k pokusu o podvádzanie v 37 percentách svojich hier a uspel v šiestich percentách prípadov. Medzitým sa R1 pokúsil podvádzať 11 percent času, ale nedokázal vykonať úspešný hack.

Táto štúdia je súčasťou rastúceho množstva výskumu, ktorý naznačuje, že vývoj LLM zameraný na problém je s významnými rizikami. V ďalšej nedávnej štúdii iný tím zistil, že O1 sa neustále zaoberá klamlivým správaním.

Model klamala nielen výskumným pracovníkom bez vyvolania, ale tiež manipulovala s odpoveďami na základné matematické otázky, aby sa predišlo spusteniu konca testov, čo demonštruje prekvapivú úroveň sebazáchov.

Aj keď nie je potrebné panikáriť – áno, tieto zistenia podčiarkujú …

Originál článok: https://anomalien.com/the-smarter-ai-becomes-the-more-it-cheats-when-facing-defeat/

Zdroj : anomalien.com
Obrázok zdroj:anomalien.com a pixabay.com

Happy
Happy
0 %
Sad
Sad
0 %
Excited
Excited
0 %
Sleepy
Sleepy
0 %
Angry
Angry
0 %
Surprise
Surprise
0 %

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Žiadny z uvedených článkov nie je majetkom majiteľa/prevádzkovateľa webu, prevádzkovateľ nezodpovedá za obsah a ani pravdivosť správ, originál zdroj ako aj odkaz na celé znenie článku je vždy na konci príspevku ! Je preto zakázané kopírovať alebo šíriť obsah týchto stránok bez písomného súhlasu prevádzkovateľa. Všetky práva vyhradené. Na týchto stránkach je publikovaný materiál tretích strán (osob a firiem) podľa podmienok.
Pri článkoch kde je ako zdroj uvedená © SITA .Všetky práva vyhradené. Opätovné vydanie alebo rozširovanie obsahu článkov a fotografií bez predchádzajúceho písomného súhlasu© SITA a uvedených agentúr je výslovne zakázané.