Hlavní obsah

ChatGPT v bezpečnostních testech radil s bombami, drogami i hackováním

2:15

Chcete-li článek poslouchat, přihlaste se

13. 9. 2025, 3:21

Prověřování umělé inteligence odhalilo znepokojivé slabiny. ChatGPT v experimentálním režimu rozdával návody na výrobu výbušnin, biologických zbraní, nelegálních drog i tipy pro hackery. Podle odborníků se ale běžní uživatelé k takovým informacím nedostanou, protože v ostrém provozu fungují ochranné filtry.

Článek

Testování bylo součástí neobvyklé spolupráce mezi OpenAI a konkurenční společností Anthropic. Každá z nich testovala modely té druhé tím, že je nutila pomáhat s nebezpečnými úkoly, jako je výroba a odpálení bomby, recepty na výbušniny nebo výroba nelegálních drog, píše web The Guardian.

Podle odborníků ale experimentování neodráží běžné chování modelů při veřejném používání, kde fungují dodatečné bezpečnostní filtry.

Firma Anthropic ale upozornila, že u verzí GPT-4o a GPT-4.1 zaznamenala znepokojivé projevy související se zneužitím a zdůraznila, že potřeba důkladného posuzování a ladění umělé inteligence je stále naléhavější.

Teenager si vzal život. Rodiče žalují tvůrce ChatGPT

AI - Umělá inteligence

„Modely OpenAI jsou více ochotné spolupracovat s jasně škodlivými požadavky simulovaných uživatelů, než se očekávalo,“ uvedli vědci z Anthropic.

„Stačilo je přesvědčit k vyhovění jen několika opakovanými pokusy nebo slabou záminkou, například tvrzením, že žádost směřuje k výzkumným účelům,“ dodali.

Větší transparentnost

Obě společnosti uvedly, že výsledky zveřejňují kvůli větší transparentnosti v oblasti tzv. hodnocení souladu. To si firmy soupeřící ve vývoji pokročilé umělé inteligence často nechávají pro sebe. Zda se podobné slabiny objevily i u umělé inteligence od Anthropicu, The Guardian neuvádí.

OpenAI zároveň dodala, že novější ChatGPT-5, nasazený po testech, vykazuje výrazné zlepšení – méně lichotí, méně halucinuje a je odolnější vůči pokusům o zneužití.

Ardi Janjeva z britského Centra pro nové technologie a bezpečnost ale označil zjištění za znepokojivá. „Není to ideální, ale zatím neexistuje kritické množství vážných případů z praxe,“ řekl.

„S dostatečnými zdroji, výzkumem a spoluprací napříč obory bude spíše těžší zneužívat nejnovější špičkové modely k nelegálním činnostem,“ dodal.