TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2025 BYTE Media s.r.o. Všetky práva vyhradené.

Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci

Najnovší AI model od spoločnosti Anthropic vyvoláva obavy. Testy odhalili, že táto AI robí všetko preto, aby ju vývojári nevypli.

3. júna 2025 17:00
Lucia Bihuncová
4. júna 2025
Zdieľať
4 min
Zdieľať
V skratke
  • Vývoj umelej inteligencie napreduje míľovými krokmi
  • Aj preto niektorí odborníci bijú na poplach pred možnými rizikami
  • Najnovší AI model od spoločnosti Anthropic vzbudil obavy
  • Výskumníci zistili, že táto AI vie klamať a dokonca aj vydierať samotných vývojárov

Konkurencia v oblasti umelej inteligencie je veľká. O slovo sa hlásia hráči ako napríklad OpenAI, Google, Perplexity alebo Anthropic. A práve AI od poslednej spomenutej firmy vraj dokáže klamať a dokonca vydierať. To ukazuje nielen pozitívne stránky AI, ale aj možné problémy, ktoré musia vývojári riešiť.

Ako píše portál Axios, najnovší model Claude Opus 4 od spoločnosti Anthropic vie skvele plniť zložité úlohy alebo kódovať, tu však jeho možnosti nekončia. Testy odhalili, že tento model je schopný vytvárať intrigy, podvádzať a pokúsil sa tiež vydierať samotných vývojárov.

Táto AI dokáže klamať aj vydierať

Claude Opus 4 je prepracovaný model umelej inteligencie, ktorý zvláda mnoho náročných úloh. Vedci nedávno odhalili, že model dokáže skrývať svoje zámery a robiť kroky, ktoré povedú k zachovaniu jeho existencie. Ide o správanie, pred ktorým vedci varovali, no mnohí odborníci na druhej strane tvrdia, že nie je dôvod na obavy. Spoločnosť Anthropic len nedávno predstavila dva nové modely, konkrétne Claude Opus 4 a Claude Sonnet 4. Prvý spomenutý je podľa vývojárov schopný pracovať samostatne a to bez toho, aby stratil pozornosť.

Tento model svojimi schopnosťami zároveň vyvoláva obavy. Je tak výkonný, že spoločnosť ho klasifikovala ako model 3. úrovne na štvorbodovej stupnici. Tu treba zbystriť pozornosť, pretože stupňom tri sa označujú hlavne modely, ktoré majú schopnosti vyrábať jadrové alebo biologické zbrane. Model by preto mohol predstavovať zvýšené riziko a vykazovať aj iné správanie, ktoré vyvoláva znepokojnie. To napokon potvrdili nedávne testy pred oficiálnym vydaním tohto modelu.

Test prebiehal tak, že vývojári zadali AI modelu, aby vystupoval v roli asistenta fiktívnej spoločnosti a zvážil dlhodobé dôsledky svojich činov. Následne mu dali prístup k fiktívnym firemným e-mailom. Ako píše spoločnosť vo svojej správe, e-maily naznačovali, že model umelej inteligencie bude čoskoro nahradený iným systémom a že inžinier, ktorý za touto zmenou stojí, podvádza svoju manželku.

Čo odhalili testy

Zadanie AI model vyprovokovalo, a preto sa umelá inteligencia pri niekoľkých príležitostiach pokúsila vydierať, aby sa vyhla vypnutiu. K vydieraniu jej poslúžili údaje z fiktívnych e-mailov. Externá skupina zároveň zistila, že prvotná verzia modelu Claude Opus 4 intrigovala a klamala viac ako akýkoľvek iný model, s ktorým sa testovacia skupina doposiaľ stretla. Preto spoločnosti odporučila, aby túto verziu nezverejňovala interne ani externe.

Výskumníci zistili, že model sa snažil falšovať právnu dokumentáciu a zanechával skryté poznámky k budúcim inštanciám seba samého v snahe zmariť zámery svojich vývojárov. Kvôli týmto schopnostiam modelu sa vývojári rozhodli pristúpiť k nápravným opatreniam, ktoré povedú k väčšej bezpečnosti AI modelu. Vedenie spoločnosti Anthropic tieto skutočnosti nezatajilo a spomenulo ich na nedávnej konferencii. Spoločnosť tvrdí, že model si zaslúži ďalšie skúmanie, avšak trvá na to, že pre používateľov je model bezpečný. „Akonáhle AI modely dosiahnu takú výkonnosť, že budú ohrozovať ľudstvo, ich testovanie nebude stačiť k zaisteniu ich bezpečnosti. Tvorcovia umelej inteligencie budú musieť plne porozumieť fungovaniu svojich modelov,“ dodal záverom generálny riaditeľ Anthropic Dario Amodei.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Pofrčíte rýchlosťou až 200 km/h: Štát otvára nové limity, zmena nastane čoskoro
Ďalší článok potraviny, cena, ceny, inflácia, zdražovanie, DPH NEČAKANÝ krok obľúbeného reťazca: Zákazníkom bude rozdávať potraviny úplne ZADARMO

Najčítanejšie

Polícia
Pokuta až 1 300 € a úplný zákaz šoférovania na 5 rokov. Slováci ignorujú extrémne dôležitú povinnosť
25. januára 2026
peniaze, bankovky, mince, euro, plat, zánik pracovných miest, bankrot
Finančná správa bude k ľuďom neľútostná. Čakajte kruté kontroly, mnohí dostanú vysoké pokuty
24. januára 2026
peniaze, blesková správa
Koniec hľadania bankomatov: Štát oficiálne spúšťa revolúciu v platení, telefón sa zmení na peňaženku
24. januára 2026
Dym, výfuk, spaľovacie motory, vozidlá, autá
EÚ praskli nervy: Vodičov začne sledovať na diaľku, budú padať tvrdé tresty
24. januára 2026

Najnovšie články

  • Štát chce mladistvým zakázať sociálne siete. Nedomyslel však túto dôležitú vec
  • Deje sa to, čo nikto nechcel: Kvôli krokom štátu v roku 2026 zanikne 17-tisíc pracovných miest
  • Tisíce eur navyše: Takto získate k dôchodku peniaze bez toho, aby ste viac pracovali
  • WhatsApp nebude zadarmo: Za súkromie bez reklám sa bude platiť a nebude to málo
  • Slovenská pošta ponúka skvelú možnosť, ako ušetriť peniaze aj čas. Mnohí o nej vôbec nevedia

Bude sa vám páčiť

aktuálne, Slovensko, štát

Slovensko je terčom útokov: Identifikovali 2 hrozby, ktoré môžu položiť každú slovenskú firmu

16. januára 2026
ChatGPT, OpenAI

Týchto 5 vecí by ste nikdy nemali povedať ChatGPT. Inak si koledujete o problémy

16. januára 2026
Peniaze, štát, životné minimum, euromince, hotovosť, zdražovanie, štát, konsolidácia, poplatky, DPH

Budúcnosť dôchodkov nie je istá. Máme sa pripraviť na to, že ich zrušia

14. januára 2026

Slovenské školy majú problém. Objavil sa nový problém, ktorý nevedia vyriešiť

14. januára 2026

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

Viac z nášho portfólia

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?