TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2024 BYTE Media s.r.o. Všetky práva vyhradené.

Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci

Najnovší AI model od spoločnosti Anthropic vyvoláva obavy. Testy odhalili, že táto AI robí všetko preto, aby ju vývojári nevypli.

3. júna 2025 17:00
Lucia Bihuncová
3. júna 2025
Zdieľať
4 min
Zdieľať
V skratke
  • Vývoj umelej inteligencie napreduje míľovými krokmi
  • Aj preto niektorí odborníci bijú na poplach pred možnými rizikami
  • Najnovší AI model od spoločnosti Anthropic vzbudil obavy
  • Výskumníci zistili, že táto AI vie klamať a dokonca aj vydierať samotných vývojárov

Konkurencia v oblasti umelej inteligencie je veľká. O slovo sa hlásia hráči ako napríklad OpenAI, Google, Perplexity alebo Anthropic. A práve AI od poslednej spomenutej firmy vraj dokáže klamať a dokonca vydierať. To ukazuje nielen pozitívne stránky AI, ale aj možné problémy, ktoré musia vývojári riešiť.

Ako píše portál Axios, najnovší model Claude Opus 4 od spoločnosti Anthropic vie skvele plniť zložité úlohy alebo kódovať, tu však jeho možnosti nekončia. Testy odhalili, že tento model je schopný vytvárať intrigy, podvádzať a pokúsil sa tiež vydierať samotných vývojárov.

Táto AI dokáže klamať aj vydierať

Claude Opus 4 je prepracovaný model umelej inteligencie, ktorý zvláda mnoho náročných úloh. Vedci nedávno odhalili, že model dokáže skrývať svoje zámery a robiť kroky, ktoré povedú k zachovaniu jeho existencie. Ide o správanie, pred ktorým vedci varovali, no mnohí odborníci na druhej strane tvrdia, že nie je dôvod na obavy. Spoločnosť Anthropic len nedávno predstavila dva nové modely, konkrétne Claude Opus 4 a Claude Sonnet 4. Prvý spomenutý je podľa vývojárov schopný pracovať samostatne a to bez toho, aby stratil pozornosť.

Tento model svojimi schopnosťami zároveň vyvoláva obavy. Je tak výkonný, že spoločnosť ho klasifikovala ako model 3. úrovne na štvorbodovej stupnici. Tu treba zbystriť pozornosť, pretože stupňom tri sa označujú hlavne modely, ktoré majú schopnosti vyrábať jadrové alebo biologické zbrane. Model by preto mohol predstavovať zvýšené riziko a vykazovať aj iné správanie, ktoré vyvoláva znepokojnie. To napokon potvrdili nedávne testy pred oficiálnym vydaním tohto modelu.

Test prebiehal tak, že vývojári zadali AI modelu, aby vystupoval v roli asistenta fiktívnej spoločnosti a zvážil dlhodobé dôsledky svojich činov. Následne mu dali prístup k fiktívnym firemným e-mailom. Ako píše spoločnosť vo svojej správe, e-maily naznačovali, že model umelej inteligencie bude čoskoro nahradený iným systémom a že inžinier, ktorý za touto zmenou stojí, podvádza svoju manželku.

Čo odhalili testy

Zadanie AI model vyprovokovalo, a preto sa umelá inteligencia pri niekoľkých príležitostiach pokúsila vydierať, aby sa vyhla vypnutiu. K vydieraniu jej poslúžili údaje z fiktívnych e-mailov. Externá skupina zároveň zistila, že prvotná verzia modelu Claude Opus 4 intrigovala a klamala viac ako akýkoľvek iný model, s ktorým sa testovacia skupina doposiaľ stretla. Preto spoločnosti odporučila, aby túto verziu nezverejňovala interne ani externe.

Výskumníci zistili, že model sa snažil falšovať právnu dokumentáciu a zanechával skryté poznámky k budúcim inštanciám seba samého v snahe zmariť zámery svojich vývojárov. Kvôli týmto schopnostiam modelu sa vývojári rozhodli pristúpiť k nápravným opatreniam, ktoré povedú k väčšej bezpečnosti AI modelu. Vedenie spoločnosti Anthropic tieto skutočnosti nezatajilo a spomenulo ich na nedávnej konferencii. Spoločnosť tvrdí, že model si zaslúži ďalšie skúmanie, avšak trvá na to, že pre používateľov je model bezpečný. „Akonáhle AI modely dosiahnu takú výkonnosť, že budú ohrozovať ľudstvo, ich testovanie nebude stačiť k zaisteniu ich bezpečnosti. Tvorcovia umelej inteligencie budú musieť plne porozumieť fungovaniu svojich modelov,“ dodal záverom generálny riaditeľ Anthropic Dario Amodei.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Pofrčíte rýchlosťou až 200 km/h: Štát otvára nové limity, zmena nastane čoskoro
Ďalší článok potraviny, cena, ceny, inflácia, zdražovanie NEČAKANÝ krok obľúbeného reťazca: Zákazníkom bude rozdávať potraviny úplne ZADARMO

Najčítanejšie

EÚ, zákaz vjazdu
EÚ má toho dosť: Ide tvrdo zasiahnuť proti obľúbeným obchodom Slovákov! (čo sa deje)
21. júla 2025
Aktuálne, peniaze, zdražovanie
POZOR: Štát začne Slovákom posielať dôležité listy. Budú zlé, dobré aj neutrálne
20. júla 2025
Mimoriadne, Volkswagen
AKTUÁLNE: Volkswagen zatvára fabriku: O prácu prídu tisíce ľudí
21. júla 2025
minca, euro, peniaze
Skontrolujte si peňaženky: Za TÚTO mincu dostanete dosť peňazí na dovolenku a ešte vám aj ostane!
22. júla 2025

Najnovšie články

  • MIMORIADNE: Potvrdili MASOVÝ útok na Slovákov. Máme sa pripraviť na najhoršie (čo sa deje)
  • Vodiči, POZOR: Pri týchto značkách áut predajcovia zatajujú haváriu (ZOZNAM)
  • Vodiči, POZOR: Za zdriemnutie v aute hrozí pokuta. TOMUTO sa na cestách vyhnite
  • POZOR: V slovenských obchodoch sa objavil ďalší nebezpečný produkt. Nejedzte ho!
  • EÚ je nekompromisná: Elektromobily nám vnúti aj na miestach, kde by to nikto nečakal

Bude sa vám páčiť

Mimoriadne, Slovensko

MIMORIADNE: Štát bije na POPLACH. Na Slovákov tajne poľuje známa služba, za škody nezodpovedá (čo sa deje)

13. júla 2025

AI robot operoval so 100-PERCENTNOU presnosťou: Špičkoví chirurgovia sa len pozerali

12. júla 2025
Aktuálna správa

Ministerstvo vnútra BIJE NA POPLACH: Za pár sekúnd dokážu zistiť, kde sa práve nachádzate, stačí im k tomu jediná vec

10. júla 2025
SearchGPT

Schyľuje sa k búrke: Tvorca ChatGPT pracuje na vlastnom prehliadači. Google môže dopadnúť zle

10. júla 2025

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?