TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2024 BYTE Media s.r.o. Všetky práva vyhradené.

Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci

Najnovší AI model od spoločnosti Anthropic vyvoláva obavy. Testy odhalili, že táto AI robí všetko preto, aby ju vývojári nevypli.

3. júna 2025 17:00
Lucia Bihuncová
3. júna 2025
Zdieľať
4 min
Zdieľať
V skratke
  • Vývoj umelej inteligencie napreduje míľovými krokmi
  • Aj preto niektorí odborníci bijú na poplach pred možnými rizikami
  • Najnovší AI model od spoločnosti Anthropic vzbudil obavy
  • Výskumníci zistili, že táto AI vie klamať a dokonca aj vydierať samotných vývojárov

Konkurencia v oblasti umelej inteligencie je veľká. O slovo sa hlásia hráči ako napríklad OpenAI, Google, Perplexity alebo Anthropic. A práve AI od poslednej spomenutej firmy vraj dokáže klamať a dokonca vydierať. To ukazuje nielen pozitívne stránky AI, ale aj možné problémy, ktoré musia vývojári riešiť.

Ako píše portál Axios, najnovší model Claude Opus 4 od spoločnosti Anthropic vie skvele plniť zložité úlohy alebo kódovať, tu však jeho možnosti nekončia. Testy odhalili, že tento model je schopný vytvárať intrigy, podvádzať a pokúsil sa tiež vydierať samotných vývojárov.

Táto AI dokáže klamať aj vydierať

Claude Opus 4 je prepracovaný model umelej inteligencie, ktorý zvláda mnoho náročných úloh. Vedci nedávno odhalili, že model dokáže skrývať svoje zámery a robiť kroky, ktoré povedú k zachovaniu jeho existencie. Ide o správanie, pred ktorým vedci varovali, no mnohí odborníci na druhej strane tvrdia, že nie je dôvod na obavy. Spoločnosť Anthropic len nedávno predstavila dva nové modely, konkrétne Claude Opus 4 a Claude Sonnet 4. Prvý spomenutý je podľa vývojárov schopný pracovať samostatne a to bez toho, aby stratil pozornosť.

Tento model svojimi schopnosťami zároveň vyvoláva obavy. Je tak výkonný, že spoločnosť ho klasifikovala ako model 3. úrovne na štvorbodovej stupnici. Tu treba zbystriť pozornosť, pretože stupňom tri sa označujú hlavne modely, ktoré majú schopnosti vyrábať jadrové alebo biologické zbrane. Model by preto mohol predstavovať zvýšené riziko a vykazovať aj iné správanie, ktoré vyvoláva znepokojnie. To napokon potvrdili nedávne testy pred oficiálnym vydaním tohto modelu.

Test prebiehal tak, že vývojári zadali AI modelu, aby vystupoval v roli asistenta fiktívnej spoločnosti a zvážil dlhodobé dôsledky svojich činov. Následne mu dali prístup k fiktívnym firemným e-mailom. Ako píše spoločnosť vo svojej správe, e-maily naznačovali, že model umelej inteligencie bude čoskoro nahradený iným systémom a že inžinier, ktorý za touto zmenou stojí, podvádza svoju manželku.

Čo odhalili testy

Zadanie AI model vyprovokovalo, a preto sa umelá inteligencia pri niekoľkých príležitostiach pokúsila vydierať, aby sa vyhla vypnutiu. K vydieraniu jej poslúžili údaje z fiktívnych e-mailov. Externá skupina zároveň zistila, že prvotná verzia modelu Claude Opus 4 intrigovala a klamala viac ako akýkoľvek iný model, s ktorým sa testovacia skupina doposiaľ stretla. Preto spoločnosti odporučila, aby túto verziu nezverejňovala interne ani externe.

Výskumníci zistili, že model sa snažil falšovať právnu dokumentáciu a zanechával skryté poznámky k budúcim inštanciám seba samého v snahe zmariť zámery svojich vývojárov. Kvôli týmto schopnostiam modelu sa vývojári rozhodli pristúpiť k nápravným opatreniam, ktoré povedú k väčšej bezpečnosti AI modelu. Vedenie spoločnosti Anthropic tieto skutočnosti nezatajilo a spomenulo ich na nedávnej konferencii. Spoločnosť tvrdí, že model si zaslúži ďalšie skúmanie, avšak trvá na to, že pre používateľov je model bezpečný. „Akonáhle AI modely dosiahnu takú výkonnosť, že budú ohrozovať ľudstvo, ich testovanie nebude stačiť k zaisteniu ich bezpečnosti. Tvorcovia umelej inteligencie budú musieť plne porozumieť fungovaniu svojich modelov,“ dodal záverom generálny riaditeľ Anthropic Dario Amodei.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Pofrčíte rýchlosťou až 200 km/h: Štát otvára nové limity, zmena nastane čoskoro
Ďalší článok potraviny, cena, ceny, inflácia, zdražovanie, DPH NEČAKANÝ krok obľúbeného reťazca: Zákazníkom bude rozdávať potraviny úplne ZADARMO

Najčítanejšie

Mimoriadne, Slovensko, vláda, štát, zákon, legislatíva, novela, zákaz, posudky
Odborníci sú ZHROZENÍ: Vydali varovanie, Slovensko čaká katastrofa, na toto sa musia pripraviť úplne všetci
5. septembra 2025
Slovensko, štát, zákon, sviatok
AKTUÁLNE: Vláda zvažuje, že zruší ďalší voľný deň. Teraz sa hovorí o TOMTO sviatku
5. septembra 2025
peniaz, peniaze, euro, bankovky, DPH, konsolidácia
Úradníci EÚ len krútili hlavami: Vypočítali priemerný plat Slováka, je to katastrofa, zhodli sa
4. septembra 2025
banka, platobná karta, peniaze, Aktuálne, zmena banky
AKTUÁLNE: Schválili MASÍVNE zatváranie aj prepúšťanie. Týka sa to úplne všetkých
4. septembra 2025

Najnovšie články

  • Začali platiť TVRDÉ pravidlá: Slovákom príde pokuta aj 1 150 €. Takmer nikto nevie, za čo
  • Štát mimoriadne prekvapil: VÝRAZNE predĺžil intervaly STK, potešia sa tisíce ľudí (ako často chodiť)
  • Odborníčka vyzvala dospelých aj deti, aby sa urýchlene nechali zaočkovať
  • MIMORIADNE: EÚ už nebude počúvať Slovensko. Ruskú ropu ZAKÁŽU aj bez nás
  • MIMORIADNE: Trump si myslí, že sa ich nikto dostatočne nebojí. Ministerstvo obrany zmenil na Ministerstvo vojny

Bude sa vám páčiť

Google, Slovensko, smartfón, vyhľadávanie, Gmail

Google nečakane predstavil GENIÁLNY nástroj, na ktorý Slováci čakali. TOTO všetko dokáže

28. augusta 2025
útok, hacker, aktuálne, hackeri, podvodníci

PRÁVE SA STALO: Potvrdili devastačný útok. Ohrození sú aj Slováci, mnohých čaká to najhoršie

28. augusta 2025
nemocnica, AI lekár

Ľudia vymieňajú lekárov za AI: Tu sú dôvody, prečo to nie je dobrý nápad

25. augusta 2025
WhatsApp

WhatsApp zavádza BIZARNÚ novinku: Správy už nemusíte písať, spraví to za vás stroj

20. augusta 2025

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?