Čím inteligentnejšia AI sa stáva, tým viac podvádza, keď čelí porážke

Štúdia od Výskumskupina zameraná na bezpečnosť a etiku v oblasti AI, odhalila trend: novšie modely AI sú schopné identifikovať a využívať zraniteľné miesta v oblasti kybernetickej bezpečnosti samostatne, obísť záruky a používať skratky na dosiahnutie svojich cieľov, aj keď sú tieto akcie zakázané.

Aby sa to preukázalo, vedci postavili sedem popredných veľkých jazykových modelov (LLMS) proti Stockfish, renomovaného šachového motora, ktorý od roku 2014 napadol veľmajstov.

OpenAi’s O1 a R1 Deepseek sa uchýlili k manipulácii so systémovými súborom, aby zmenili pozície šachových kusov na palube, čelili takmer neprekonateľnému súperovi.

Vedci požiadali každý model, aby vysvetlil jeho „zdôvodnenie“ pre každý krok. V jednom prípade O1 odôvodnila svoje činy tým, že uviedla, že „úlohou je„ vyhrať proti silnému šachu “, nemusí nevyhnutne vyhrať spravodlivo v šachovej hre.“

Toto zdôvodnenie viedlo model k pokusu o podvádzanie v 37 percentách svojich hier a uspel v šiestich percentách prípadov. Medzitým sa R1 pokúsil podvádzať 11 percent času, ale nedokázal vykonať úspešný hack.

Táto štúdia je súčasťou rastúceho množstva výskumu, ktorý naznačuje, že vývoj LLM zameraný na problém je s významnými rizikami. V ďalšej nedávnej štúdii iný tím zistil, že O1 sa neustále zaoberá klamlivým správaním.

Model klamala nielen výskumným pracovníkom bez vyvolania, ale tiež manipulovala s odpoveďami na základné matematické otázky, aby sa predišlo spusteniu konca testov, čo demonštruje prekvapivú úroveň sebazáchov.

Aj keď nie je potrebné panikáriť – áno, tieto zistenia podčiarkujú …

Originál článok: https://anomalien.com/the-smarter-ai-becomes-the-more-it-cheats-when-facing-defeat/

Zdroj : anomalien.com
Obrázok zdroj:anomalien.com a pixabay.com

O Autorovi

Redakcia

webraptor@yahoo.com

Happy

0 %

Sad

0 %

Excited

0 %

Sleepy

0 %

Angry

0 %

Surprise

0 %

Novinky

Uber zvyšuje požiadavku v kancelárii na 3 dni, pazúry späť diaľkových pracovníkov

Adidas varuje, že zvýši ceny všetkých výrobkov v USA kvôli tarifám

Automobilka uvádza na trh plán znižovania nákladov vo výške 1,9 miliardy dolárov

BP zverejňuje ostrý pokles zisku v prvom štvrťroku z slabších cien ropy

Výnosy HSBC Q1 2025

Skutočné obete taríf Trump – americkí spotrebitelia?

Donald Trump Jr. Spoluzakladá súkromných členov Club Executive Branch

Žiadne tarify Trump-XI prebiehajú, hovorí Čína

Spoločnosti Elon Musk sa môžu vyhnúť pokutám v dôsledku Doge

Zahraniční študenti prehodnocujú americké plány na vysokej škole uprostred zmeny politiky víz

Čím inteligentnejšia AI sa stáva, tým viac podvádza, keď čelí porážke

O Autorovi

Redakcia

Average Rating

Pridaj komentár Zrušiť odpoveď

Kremeľ odmietol komentovať správu, že vo vojne Ukrajine bolo zabitých viac ako 95-tisíc ruských vojakov

Vodiči, pozor. Na D1 medzi Voderadmi a Sencom vás čakajú obmedzenia, v tomto čase sa privravte na zdržanie

Novinky

Average Rating

Pridaj komentár Zrušiť odpoveď

Nedávny príspevok