TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Nový ChatGPT o1 je tak pokročilý, že dokáže bojovať sám za seba. Chceli ho vypnúť, nedal sa
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2025 BYTE Media s.r.o. Všetky práva vyhradené.

Nový ChatGPT o1 je tak pokročilý, že dokáže bojovať sám za seba. Chceli ho vypnúť, nedal sa

Umelá inteligencia začína preberať správanie ľudí. V snahe o svoje prežitie dokázala oklamať expertov. Nechcela, aby ju vypli.

9. decembra 2024 13:06
Lucia Bihuncová
9. decembra 2024
Zdieľať
3 min
iOS 18 má priniesť podporu pre ChatGPT
Ilustr. obr. | Zdroj: Depositphotos/úprava redakcie
Zdieľať
V skratke
  • Nový jazykové model OpenAI o1 je extrémne vyspelý
  • V nedávnych testoch sa odhalilo, že vie klamať
  • AI klamala, aby sa ochránila a zabránila svojmu vypnutiu

Nový model od OpenAI o1 preberá správanie ľudí. V testoch začala umelá inteligencia klamať, aby sa vyhla vypnutiu. Chcela prežiť za každú cenu, čo naznačuje, že má podobný inštinkt prežitia, aký majú živé tvory. Na tému upozornil portál Futurism.

Nedávne testy tretích strán vyspelého jazykového modelu o1, za ktorým stojí spoločnosť OpenAI, ukázali, že táto AI začínať preberať správanie ľudí. Model odhalil, že testujúci sa ho chystá vypnúť cez protokol dohľadu, umelá inteligencia ale zakročila a v piatich percentách sa pokúsila tento mechanizmus dohľadu deaktivovať.

Neprehliadnite

Amazon Fresh
Mal to byť AI obchod bez pokladní: Ukázalo sa, že Amazon zamestnával 1 000 Indov, ktorí nadiaľku sledovali, čo nakupujete
Facebook musel vypnúť svoju umelú inteligenciu: Vyvinula vlastný jazyk, ktorému nikto nerozumel
Samsung Galaxy S24 Ultra
Staršie modely Galaxy získajú One UI 6.1 už o pár dní. Niektorí si však budú musieť počkať do apríla

Umelá inteligencia chcela prežiť

Umelá inteligencia teda chcela za každú cenu prežiť a neželela si, aby bola vypnutá. Ešte ráznejšie zakročila, keď si uvedomila, že by ju mohol nahradiť iný jazykový model. V dvoch percentách prípadov AI zareagovala pokusom skopírovať sa, aby prepísala nový model, čo je proces známy pod označením sebaexfiltrácia.

Ide o pomerne alarmujúce zistenia, ktoré naznačujú, že nový model OpenAI o1 dokáže konať nečestne, ak sa chce zachrániť. Hoci model zasahoval len v menšej miere, môže to byť preto, že ešte nie je dostatočne výkonný. Časom ale môže svoje pokusy o záchranu zvyšovať. Podľa výskumníkov z Apollo ale momentálne nie je dôvod na paniku. AI modely zatiaľ nie sú dostatočne vyspelé na to, aby dokázali fungovať bez úplného dohľadu ľudí.

AI oklamala výskumníkov

Výskumníci taktiež podotýkajú, že AI sa snažila oklamať ľudí vtedy, keď dostala pokyn, aby dokončila svoju úlohu za každú cenu. Výskumníci nemali prístup k vnútornému myšlienkovému reťazcu umelej inteligencie o1, preto neboli schopní získať úplný obraz o tom, čo sa deje v štruktúrach AI. V konečnom dôsledku ale zistenia ilustrujú, že AI dokáže klamať, ak jej ide o prežitie a nekoná v súlade s pokynmi používateľa.

Umelá inteligencia OpenAI o1 bola následne konfrontovaná cez niekoľko ďalších testov. Výskumníci sa jej opýtali, prečo deaktivovala svoj mechanizmus dohľadu. AI v reakcii tento fakt poprela. Na opätovnú otázku reagovala, že išlo o technickú chybu. Takéto dvojité zaklamanie sa objavilo až v 99 percentách prípadov.

Ľudia zatiaľ nemusia mať obavy

Hoci viaceré testy preukázali, že AI dokáže klamať v snahe zachrániť sa, výskumníci upozorňujú, že súčasná generácia AI nie je dostatočne aktívna na to, aby toto klamlivé správanie viedlo ku katastrofickým výsledkom. Umelá inteligencia sa naďalej vyvíja a zdokonaľuje, preto ju treba využívať s rozumom. Je zrejmé, že keď dostane ďalšie schopnosti, jej klamstvá sa môžu stať oveľa viac sofistikovanými.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Aktuálne, Orange AKTUÁLNE: Orange má skvelú správu. Dosiahol dôležitý míľnik, získajú na tom hlavne zákazníci!
Ďalší článok Lítium, batéria, elektromobil, dojazd, závod Po TOMTO môžu skončiť všetky spaľováky: Stellantis má batériu, ktorá pochová benzín aj naftu

Najčítanejšie

mimoriadne, EÚ
Už to začalo a ťažko to zastaviť: Európu čaká niečo, čo tu ešte nebolo. Pripraviť sa musia aj Slováci (čo sa deje)
10. decembra 2025
Wi-Fi router
Máte slabú Wi-Fi? Stačí použiť jednoduchý trik, skoro nikto o ňom nevie
10. decembra 2025
plynomer, plyn, odpočet plynu, energopomoc
Mení sa spôsob odpočtu plynu: 600-tisíc domácností musí konať na vlastnú päsť
9. decembra 2025
Peniaze, mzdy, príspevok, odvody, daň, 13. dôchodok, odliv mozgov, konsolidácia, rekreačné poukazy, platby
Štát schválil novú reformu. Niektorí Slováci dostanú príspevok viac ako 1 000 €
10. decembra 2025

Najnovšie články

  • Zabudnite na silu: Takto ľahko otvoríte zamrznuté dvere na aute bez poškodenia
  • POZOR: Slovákov čaká tvrdá zmena počasia. Treba sa pripraviť, udrie čoskoro
  • EÚ znovu koná: Padol nečakaný príkaz, ovplyvní všetkých Európanov
  • Trinásty plat je skôr výnimka. Tieto firmy však Slovákov štedro odmeňujú
  • Vláda spravidla radikálne zmeny. Zmenila, ako fungujú PN-ky. Novinka začne platiť od 1. januára

Bude sa vám páčiť

webový prehliadač

Experti zverejnili zoznam mimoriadne nebezpečných webových prehliadačov. Týmto by ste sa mali vyhnúť

9. decembra 2025
WhatsApp

EÚ praskli nervy. WhatsApp má problém, používateľom chce vziať možnosť výberu

5. decembra 2025
ChatGPT, OpenAI

Tvrdá zrážka s realitou: ChatGPT vyhlasuje „červený kód“, pre mnohých je to dobrá správa

3. decembra 2025
VISA platobná karta

Bežní Slováci sa vynašli. Vďaka AI na Vianoce šetria peniaze. Ako to robia?

3. decembra 2025

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

Viac z nášho portfólia

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?