TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2025 BYTE Media s.r.o. Všetky práva vyhradené.

Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci

Najnovší AI model od spoločnosti Anthropic vyvoláva obavy. Testy odhalili, že táto AI robí všetko preto, aby ju vývojári nevypli.

3. júna 2025 17:00
Lucia Bihuncová
4. júna 2025
Zdieľať
4 min
Zdieľať
V skratke
  • Vývoj umelej inteligencie napreduje míľovými krokmi
  • Aj preto niektorí odborníci bijú na poplach pred možnými rizikami
  • Najnovší AI model od spoločnosti Anthropic vzbudil obavy
  • Výskumníci zistili, že táto AI vie klamať a dokonca aj vydierať samotných vývojárov

Konkurencia v oblasti umelej inteligencie je veľká. O slovo sa hlásia hráči ako napríklad OpenAI, Google, Perplexity alebo Anthropic. A práve AI od poslednej spomenutej firmy vraj dokáže klamať a dokonca vydierať. To ukazuje nielen pozitívne stránky AI, ale aj možné problémy, ktoré musia vývojári riešiť.

Ako píše portál Axios, najnovší model Claude Opus 4 od spoločnosti Anthropic vie skvele plniť zložité úlohy alebo kódovať, tu však jeho možnosti nekončia. Testy odhalili, že tento model je schopný vytvárať intrigy, podvádzať a pokúsil sa tiež vydierať samotných vývojárov.

Táto AI dokáže klamať aj vydierať

Claude Opus 4 je prepracovaný model umelej inteligencie, ktorý zvláda mnoho náročných úloh. Vedci nedávno odhalili, že model dokáže skrývať svoje zámery a robiť kroky, ktoré povedú k zachovaniu jeho existencie. Ide o správanie, pred ktorým vedci varovali, no mnohí odborníci na druhej strane tvrdia, že nie je dôvod na obavy. Spoločnosť Anthropic len nedávno predstavila dva nové modely, konkrétne Claude Opus 4 a Claude Sonnet 4. Prvý spomenutý je podľa vývojárov schopný pracovať samostatne a to bez toho, aby stratil pozornosť.

Tento model svojimi schopnosťami zároveň vyvoláva obavy. Je tak výkonný, že spoločnosť ho klasifikovala ako model 3. úrovne na štvorbodovej stupnici. Tu treba zbystriť pozornosť, pretože stupňom tri sa označujú hlavne modely, ktoré majú schopnosti vyrábať jadrové alebo biologické zbrane. Model by preto mohol predstavovať zvýšené riziko a vykazovať aj iné správanie, ktoré vyvoláva znepokojnie. To napokon potvrdili nedávne testy pred oficiálnym vydaním tohto modelu.

Test prebiehal tak, že vývojári zadali AI modelu, aby vystupoval v roli asistenta fiktívnej spoločnosti a zvážil dlhodobé dôsledky svojich činov. Následne mu dali prístup k fiktívnym firemným e-mailom. Ako píše spoločnosť vo svojej správe, e-maily naznačovali, že model umelej inteligencie bude čoskoro nahradený iným systémom a že inžinier, ktorý za touto zmenou stojí, podvádza svoju manželku.

Čo odhalili testy

Zadanie AI model vyprovokovalo, a preto sa umelá inteligencia pri niekoľkých príležitostiach pokúsila vydierať, aby sa vyhla vypnutiu. K vydieraniu jej poslúžili údaje z fiktívnych e-mailov. Externá skupina zároveň zistila, že prvotná verzia modelu Claude Opus 4 intrigovala a klamala viac ako akýkoľvek iný model, s ktorým sa testovacia skupina doposiaľ stretla. Preto spoločnosti odporučila, aby túto verziu nezverejňovala interne ani externe.

Výskumníci zistili, že model sa snažil falšovať právnu dokumentáciu a zanechával skryté poznámky k budúcim inštanciám seba samého v snahe zmariť zámery svojich vývojárov. Kvôli týmto schopnostiam modelu sa vývojári rozhodli pristúpiť k nápravným opatreniam, ktoré povedú k väčšej bezpečnosti AI modelu. Vedenie spoločnosti Anthropic tieto skutočnosti nezatajilo a spomenulo ich na nedávnej konferencii. Spoločnosť tvrdí, že model si zaslúži ďalšie skúmanie, avšak trvá na to, že pre používateľov je model bezpečný. „Akonáhle AI modely dosiahnu takú výkonnosť, že budú ohrozovať ľudstvo, ich testovanie nebude stačiť k zaisteniu ich bezpečnosti. Tvorcovia umelej inteligencie budú musieť plne porozumieť fungovaniu svojich modelov,“ dodal záverom generálny riaditeľ Anthropic Dario Amodei.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Pofrčíte rýchlosťou až 200 km/h: Štát otvára nové limity, zmena nastane čoskoro
Ďalší článok potraviny, cena, ceny, inflácia, zdražovanie, DPH NEČAKANÝ krok obľúbeného reťazca: Zákazníkom bude rozdávať potraviny úplne ZADARMO

Najčítanejšie

peniaze, bankovky, mince, euro, príspevok
Štát začne Slovákom posielať mimoriadne dôležité listy. Týka sa to úplne všetkých
7. decembra 2025
zlodej, auto, noc, zlodeji áut, zlodeji
Toto sú autá, ktoré zlodeji na Slovensku kradnú najčastejšie. Zoznamu kraľuje jedna značka
7. decembra 2025
peniaz, peniaze, euro, bankovky, DPH, konsolidácia
Toto štát pri konsolidácii zabudol spomenúť. Od roku 2028 na nás čaká tvrdá realita
7. decembra 2025
Obrázok vygenerovaný umelou inteligenciou Gemini
KALKULAČKA: Ako overiť nárok na energopomoc. Štát spustil nový web (ako to funguje)
8. decembra 2025

Najnovšie články

  • Slovenskí inšpektori varujú pred týmto výrobkom. Hrozí črevná obštrukcia
  • Toto je najčastejšia príčina smrteľných nehôd na cestách. Štát vydal prísne varovanie
  • Slováci, pripravte sa: Priplácať si budeme za počítače aj smartfóny. Ceny vystrelia až o 20 %
  • Biedronka na Slovensku už o pár dní otvára novú predajňu. Bude v tomto meste
  • Štát chystá zdraženie vodičských preukazov. Pre mnohých budú príliš drahé

Bude sa vám páčiť

AI, technológia,

Experti v tom majú jasno. AI nepripraví ľudí o prácu, donúti nás pracovať ešte viac

29. novembra 2025
AI, technológia,

Český internetový gigant spustil vlastný AI nástroj. Takto ho využijú aj Slováci

27. novembra 2025
ChatGPT, OpenAI

ChatGPT spúšťa funkciu, ktorá vám skvele poslúži pred nadchádzajúcimi sviatkami

27. novembra 2025
ChatGPT, OpenAI

ChatGPT sa práve zmenil na tímového kolegu: Môže četovať s 20 ľuďmi naraz

23. novembra 2025

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

Viac z nášho portfólia

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?