TECHBYTE.skTECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Čítaš: Na svete je ďalší škandál: Najznámejšia AI na svoj tréning využila nečestnú praktiku, vývojár sa k nej otvorene priznal
Zdieľať
TECHBYTE.skTECHBYTE.sk
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Hľadať
  • Domov
  • Tech
  • Recenzie
  • Veda
  • Elektromobilita
  • Domácnosť
  • Gaming
Sleduj TECHBYTE
© 2024 BYTE Media s.r.o. Všetky práva vyhradené.
TECHBYTE.sk > Novinky > Tech > AI > Na svete je ďalší škandál: Najznámejšia AI na svoj tréning využila nečestnú praktiku, vývojár sa k nej otvorene priznal

Na svete je ďalší škandál: Najznámejšia AI na svoj tréning využila nečestnú praktiku, vývojár sa k nej otvorene priznal

9. apríla 2024 14:06
Roman Drexler
9. apríla 2024
Zdieľať
5 min
Zdieľať

Nie každý veľký výtvor vznikal čestne. Je to smutné, ale je to tak. A po novom sa dozvedáme, že čiastočne je takýmto prípadom aj najznámejší model umelej inteligencie od spoločnosti OpenAI. Tá sa otvorene priznala, že svoj model GPT-4 trénovala na prepisoch z viac ako milióna hodín videí publikovaných na YouTube. O téme píše portál The Verge na základe informácií denníka The Wall Street Journal.

Denník začiatkom tohto týždňa informoval, že spoločnosti zamerané na umelú inteligenciu narážajú na značný problém, pokiaľ ide o zhromažďovanie kvalitných údajov na trénovanie svojich modelov. Riešiť sa ho pritom snažia rôznymi spôsobmi. A výnimkou nie je ani OpenAI.

Vyvinuli model, aby mohli trénovať iný model

OpenAI v zúfalej snahe spraviť z GPT-4 ten najlepší model umelej inteligencie vyvinula systém na prepis zvuku s názvom Whisper. Práve s jeho pomocou dokázala obísť prekážky a získať prepisy viac ako milióna hodín videí na YouTube. S nimi potom trénovala GPT-4.

RETAKE
Magio TV šokovala konkurenciu: Predstavila novú funkciu, ktorá úplne mení sledovanie televízie na Slovensku

Magio TV šokovala konkurenciu: Predstavila novú funkciu, ktorá úplne mení sledovanie televízie na Slovensku

Slovensku hrozí grécky scenár: Dôchodkový systém sa ocitol pred kolapsom, bez okamžitých zmien prídu veľké problémy

Slovensku hrozí grécky scenár: Dôchodkový systém sa ocitol pred kolapsom, bez okamžitých zmien prídu veľké problémy

Polícia získala desivú moc: Vaše auto zastavia na diaľku, nemáte žiadnu šancu uniknúť

Polícia získala desivú moc: Vaše auto zastavia na diaľku, nemáte žiadnu šancu uniknúť

Magio TV šokovala konkurenciu: Predstavila novú funkciu, ktorá úplne mení sledovanie televízie na Slovensku
Magio TV šokovala konkurenciu: Predstavila novú funkciu, ktorá úplne mení sledovanie televízie na Slovensku
Slovensku hrozí grécky scenár: Dôchodkový systém sa ocitol pred kolapsom, bez okamžitých zmien prídu veľké problémy
Slovensku hrozí grécky scenár: Dôchodkový systém sa ocitol pred kolapsom, bez okamžitých zmien prídu veľké problémy
Polícia získala desivú moc: Vaše auto zastavia na diaľku, nemáte žiadnu šancu uniknúť
Polícia získala desivú moc: Vaše auto zastavia na diaľku, nemáte žiadnu šancu uniknúť

Samozrejme, ide právne spornú praktiku. A spoločnosť si to veľmi dobre uvedomovala. Napriek tomu ho však presadzovala za spravodlivé. Situáciu ešte väčšmi zhoršuje skutočnosť, že na zhromažďovaní použitých videí sa podieľal aj Greg Brockman, prezident OpenAI.

GPT-4
GPT-4 | Zdroj: OpenAI

Lindsay Heldová, hovorkyňa OpenAI, v e-mailovej správe pre The Verge uviedla, že spoločnosť pre každý zo svojich modelov zaobstaráva „jedinečné“ súbory údajov, aby im pomohla „pochopiť svet“. Tým si OpenAI taktiež zabezpečuje potrebnú konkurencieschopnosť v oblasti globálneho výskumu. Heldová dodala, že spoločnosť využíva „množstvo zdrojov, vrátane verejne dostupných údajov a partnerstiev pre neverejné údaje“, a že sa snaží vytvárať vlastné syntetické údaje.

Problémom je, že spoločnosť vyčerpala svoje zásoby užitočných údajov ešte v roku 2021. Následne začala diskutovať o prepise videí z YouTube, podcastov a audiokníh. Až dovtedy trénovala svoje modely na údajoch, ktoré zahŕňali kód z Githubu, databázy šachových ťahov a obsah školských úloh z Quizletu.

NEWSBYTE
Slováci môžu získať 1000 eur od štátu: Nie každý má nárok, zistite, čo musíte splniť

Slováci môžu získať 1000 eur od štátu: Nie každý má nárok, zistite, čo musíte splniť

Štát je v pasci: Dane zvyšovať NEMÔŽE, na rad prídu trináste dôchodky a prídavky na deti (kto to pocíti najviac)

Štát je v pasci: Dane zvyšovať NEMÔŽE, na rad prídu trináste dôchodky a prídavky na deti (kto to pocíti najviac)

Slovensko sa postavilo Bruselu: Ak potrestáme Rusko, ostaneme bez plynu, varuje vláda

Slovensko sa postavilo Bruselu: Ak potrestáme Rusko, ostaneme bez plynu, varuje vláda

Slováci môžu získať 1000 eur od štátu: Nie každý má nárok, zistite, čo musíte splniť
Slováci môžu získať 1000 eur od štátu: Nie každý má nárok, zistite, čo musíte splniť
Štát je v pasci: Dane zvyšovať NEMÔŽE, na rad prídu trináste dôchodky a prídavky na deti (kto to pocíti najviac)
Štát je v pasci: Dane zvyšovať NEMÔŽE, na rad prídu trináste dôchodky a prídavky na deti (kto to pocíti najviac)
Slovensko sa postavilo Bruselu: Ak potrestáme Rusko, ostaneme bez plynu, varuje vláda
Slovensko sa postavilo Bruselu: Ak potrestáme Rusko, ostaneme bez plynu, varuje vláda

Zakázaná praktika

Záležitosť komentoval aj Matt Bryant, hovorca Google. Ten pre The Verge uviedol, že gigant „zaznamenal nepotvrdené správy“ o činnosti OpenAI. Dodal, že súbory obots.txt, ako aj podmienky používania zakazujú neoprávnené sťahovanie alebo kopírovanie obsahu z YouTube. Podobne sa vyjadril aj Neal Mohan, generálny riaditeľ platformy.

Mohan taktiež prehovoril o možnosti, že OpenAI využila prepisy videí na YouTube aj na trénovanie svojho nedávno predstaveného modelu Sora. Hovorca Google skonštatoval, že spoločnosť prijíma „technické a právne opatrenia“, aby zabránila takémuto neoprávnenému využívaniu obsahu, keď na to má jasný právny alebo technický základ.

Neprehliadnite

Uber
AKTUÁLNE: Taxikári prídu o prácu. Začínajú jazdiť taxíky bez vodiča, prácu prevezmú stroje
AI, mimoriadne
Experti BIJÚ NA POPLACH: Všetko, čo napíšete, sa zobrazí aj iným ľuďom. TOTO v žiadnom prípade nepoužívajte
WhatsApp
WhatsApp získal skvelú funkciu, ktorá KAŽDÉMU ušetrí kopu času. TAKTO funguje
youtube
Ilustr. obr. | Zdroj: YouTube

Aj Google mal využiť prepisy z YouTube na trénovanie svojho modelu AI, avšak Bryant uviedol, že model bol cvičený na určitom obsahu z platformy za dodržania uzavretých dohôd s tvorcami.

Problémy mala aj Meta

V tréningovom procese narazila na bariéru aj spoločnosť Meta. Tá vraj taktiež pôvodne diskutovala o nepovolenom použití diel chránených autorským právom, aby čo najrýchlejšie dobehla OpenAI. Potom vraj mala zvažovať iné kroky, ako napríklad zaplatenie licencií na knihy či kúpu celého vydavateľstva. V spôsoboch, akými môže využívať údaje o spotrebiteľoch, ju však zrejme do istej miery obmedzovali zmeny v oblasti ochrany osobných údajov, ku ktorým musela pristúpiť po vypuknutí škandálu Cambridge Analytica.


Prečítajte si tiež:

  • Apple prekvapuje: Má nový AI systém, ktorý dokáže prekonať aj GPT-4
  • Mal to byť AI obchod bez pokladní: Ukázalo sa, že Amazon zamestnával 1 000 Indov, ktorí nadiaľku sledovali, čo nakupujete
  • AI získava strašidelné schopnosti: OpenAI testuje model, ktorý v priebehu sekúnd zreplikuje ľudský hlas

Samozrejme, modely umelej inteligencie sa dajú trénovať aj legálnym spôsobom. Spoločnosti ich môžu trénovať napríklad na syntetických údajoch, ktoré si vytvoria vlastnými modelmi, prípadne ich môžu trénovať za využitia tzv. kurikulárneho učenia. To spočíva v podávaní vysokokvalitných usporiadaných dát v nádeji, že modely budú schopné identifikovať „inteligentnejšie prepojenia medzi pojmami“ s použitím menšieho množstva informácií. Ani jeden z týchto spôsobov však zatiaľ nebol riadne overený.

Zdieľaj tento článok
Facebook Kopírovať odkaz Vytlačiť
Predchádzajúci článok Humanoid, humanoidné roboty Humanoidní roboti v praxi: Takto ich vo výrobe využíva čínska automobilka Nio!
Ďalší článok Tento smartfón Slováci kupujú najčastejšie. A nie, nie je to Android! (ZOZNAM)

Najčítanejšie

Mimoriadne
AKTUÁLNE: Potvrdili HROMADNÝ útok. Ľuďom radia, nech sú pripravení na najhoršie. Cieľom sú aj Slováci
14. júna 2025
potvrdené, peniaze
POZOR, veľký operátor ZVYŠUJE ceny: Od júla si za televíziu a internet zákazníci výrazne priplatia
13. júna 2025
Slovensko ako vzor v CELEJ EÚ: Náš vynález chvália všetky ministerstvá, Európska únia ho chce všade
14. júna 2025
ČO SA TO DEJE? Obrovská automobilka z ničoho nič prepúšťa TISÍCKY zamestnancov
13. júna 2025

Najnovšie články

  • Kedysi revolučná aplikácia dostala po rokoch NEČAKANÚ aktualizáciu. Zamilujete si ju
  • Na svete je motor bez jediného gramu kovu. Pre elektromobilitu môže znamenať revolúciu
  • Sociálna poisťovňa sa ľuďom vyhráža zrušením dôchodkov. Mnohí zareagovali presne tak, ako nemali
  • Ministerstvo vnútra BIJE NA POPLACH: Na Slovákov útočia, majú byť pripravení na na možnú stratu peňazí
  • Všetci klikajú na TENTO odkaz. Experti na bezpečnosť hovoria, že je to obrovská CHYBA

Bude sa vám páčiť

Pozor, iPhone, Apple

Už to prestáva byť sranda: Apple znovu odkladá kľúčový UPGRADE. Čakáme naň už pridlho

13. júna 2025

Telefón, ktorý vie, kam sa pozeráte. A podľa toho okamžite koná

12. júna 2025
samoobslužné pokladne

Samoobslužné pokladne čaká REVOLÚCIA: Nová technológia vám ušetrí kopu času aj nervov (ako fungujú)

10. júna 2025
Mimoriadne, peniaze, zdražovanie, daň

BOD ZLOMU: Zamestnancom, ktorí využívajú AI, stúpli platy o 56 %. Vysokoškolský diplom treba čoraz menej

9. júna 2025

 

Spájame vedu, technológie a internetovú kultúru.

Dôležité odkazy

  • Kontakt
  • Reklama
  • O nás
  • Cookies
  • Podmienky používania

Spoj sa s nami

© 2025 BYTE Media s.r.o. Všetky práva vyhradené.
Vitaj späť!

Prihlás sa do svojho účtu

Username or Email Address
Password

Zabudol si heslo?

Continue with Google