TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2024 BYTE Media s.r.o. Všetky práva vyhradené.

Táto umelá inteligencia vie klamať, intrigovať a dokonca vydierať! Obavy majú aj odborníci

Najnovší AI model od spoločnosti Anthropic vyvoláva obavy. Testy odhalili, že táto AI robí všetko preto, aby ju vývojári nevypli.

3. júna 2025 17:00
Lucia Bihuncová
3. júna 2025
Zdieľať
4 min
Zdieľať
V skratke
  • Vývoj umelej inteligencie napreduje míľovými krokmi
  • Aj preto niektorí odborníci bijú na poplach pred možnými rizikami
  • Najnovší AI model od spoločnosti Anthropic vzbudil obavy
  • Výskumníci zistili, že táto AI vie klamať a dokonca aj vydierať samotných vývojárov

Konkurencia v oblasti umelej inteligencie je veľká. O slovo sa hlásia hráči ako napríklad OpenAI, Google, Perplexity alebo Anthropic. A práve AI od poslednej spomenutej firmy vraj dokáže klamať a dokonca vydierať. To ukazuje nielen pozitívne stránky AI, ale aj možné problémy, ktoré musia vývojári riešiť.

Ako píše portál Axios, najnovší model Claude Opus 4 od spoločnosti Anthropic vie skvele plniť zložité úlohy alebo kódovať, tu však jeho možnosti nekončia. Testy odhalili, že tento model je schopný vytvárať intrigy, podvádzať a pokúsil sa tiež vydierať samotných vývojárov.

Táto AI dokáže klamať aj vydierať

Claude Opus 4 je prepracovaný model umelej inteligencie, ktorý zvláda mnoho náročných úloh. Vedci nedávno odhalili, že model dokáže skrývať svoje zámery a robiť kroky, ktoré povedú k zachovaniu jeho existencie. Ide o správanie, pred ktorým vedci varovali, no mnohí odborníci na druhej strane tvrdia, že nie je dôvod na obavy. Spoločnosť Anthropic len nedávno predstavila dva nové modely, konkrétne Claude Opus 4 a Claude Sonnet 4. Prvý spomenutý je podľa vývojárov schopný pracovať samostatne a to bez toho, aby stratil pozornosť.

Tento model svojimi schopnosťami zároveň vyvoláva obavy. Je tak výkonný, že spoločnosť ho klasifikovala ako model 3. úrovne na štvorbodovej stupnici. Tu treba zbystriť pozornosť, pretože stupňom tri sa označujú hlavne modely, ktoré majú schopnosti vyrábať jadrové alebo biologické zbrane. Model by preto mohol predstavovať zvýšené riziko a vykazovať aj iné správanie, ktoré vyvoláva znepokojnie. To napokon potvrdili nedávne testy pred oficiálnym vydaním tohto modelu.

Test prebiehal tak, že vývojári zadali AI modelu, aby vystupoval v roli asistenta fiktívnej spoločnosti a zvážil dlhodobé dôsledky svojich činov. Následne mu dali prístup k fiktívnym firemným e-mailom. Ako píše spoločnosť vo svojej správe, e-maily naznačovali, že model umelej inteligencie bude čoskoro nahradený iným systémom a že inžinier, ktorý za touto zmenou stojí, podvádza svoju manželku.

Čo odhalili testy

Zadanie AI model vyprovokovalo, a preto sa umelá inteligencia pri niekoľkých príležitostiach pokúsila vydierať, aby sa vyhla vypnutiu. K vydieraniu jej poslúžili údaje z fiktívnych e-mailov. Externá skupina zároveň zistila, že prvotná verzia modelu Claude Opus 4 intrigovala a klamala viac ako akýkoľvek iný model, s ktorým sa testovacia skupina doposiaľ stretla. Preto spoločnosti odporučila, aby túto verziu nezverejňovala interne ani externe.

Výskumníci zistili, že model sa snažil falšovať právnu dokumentáciu a zanechával skryté poznámky k budúcim inštanciám seba samého v snahe zmariť zámery svojich vývojárov. Kvôli týmto schopnostiam modelu sa vývojári rozhodli pristúpiť k nápravným opatreniam, ktoré povedú k väčšej bezpečnosti AI modelu. Vedenie spoločnosti Anthropic tieto skutočnosti nezatajilo a spomenulo ich na nedávnej konferencii. Spoločnosť tvrdí, že model si zaslúži ďalšie skúmanie, avšak trvá na to, že pre používateľov je model bezpečný. „Akonáhle AI modely dosiahnu takú výkonnosť, že budú ohrozovať ľudstvo, ich testovanie nebude stačiť k zaisteniu ich bezpečnosti. Tvorcovia umelej inteligencie budú musieť plne porozumieť fungovaniu svojich modelov,“ dodal záverom generálny riaditeľ Anthropic Dario Amodei.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Pofrčíte rýchlosťou až 200 km/h: Štát otvára nové limity, zmena nastane čoskoro
Ďalší článok potraviny, cena, ceny, inflácia, zdražovanie, DPH NEČAKANÝ krok obľúbeného reťazca: Zákazníkom bude rozdávať potraviny úplne ZADARMO

Najčítanejšie

Mimoriadne
MIMORIADNE: Navždy vypnú Messenger aj WhatsApp. Náhrada nebude (+ dátum)
21. októbra 2025
Peniaze, dôchodok, sporenie, penzisti, konsolidácia, plat, dávka v nezamestnanosti, odvody, konsolidácia, inflácia, živnostníkov, príspevok, konsolidačný balík
Slováci si prilepšia: Na účet cinke viac ako 300 €. Tešiť z príspevku sa môže veľká skupina ľudí
20. októbra 2025
červená čiara na diaľnici
Vodiči sú zmätení z NOVÉHO prvku na cestách: Kto nevie, čo to je, dostane 400 € pokutu
21. októbra 2025
starší šoféri, senior, dôchodca, autá
Najlepšie autá pre seniorov: TIETO ocení každý skúsený vodič, ktorý chce pohodlie
21. októbra 2025

Najnovšie články

  • AKTUÁLNE: Veľká banka hlási odstávku služieb. POZOR na platby kartou!
  • Potvrdili ĎALŠIE zdražovanie: Týka sa všetkých, neveští to nič dobré (čo sa deje)
  • Ďalší neúspešný projekt? Apple DRASTICKY znižuje výrobu iPhone Air
  • Diablo v dystopickej budúcnosti: Česi štartujú unikátny projekt, akčné RPG má veľkú šancu na úspech
  • AKTUÁLNE: Orange Vianoce sú tu! TOTO vám dá na 6 mesiacov úplne ZADARMO

Bude sa vám páčiť

Samsung Galaxy Z Flip7

Samsung testuje parádnu AI novinku. Nikto si ju nepýtal, no KAŽDÝ ju využije

2. októbra 2025
Grokipedia, Elon Musk

Wikipédia bude mať konkurenciu. Elon Musk vytvorí Grokipediu, vraj nebude taká ľavicová

2. októbra 2025

Nová aplikácia od tvorcu ChatGPT vám vyrazí dych. TOTO dokáže Sora 2 od OpenAI

2. októbra 2025
Aktuálna správa

Deje sa PRESNE to, čo sme nechceli: 4-TISÍC ľudí príde o prácu, nahradí ich AI

1. októbra 2025

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

Viac z nášho portfólia

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?