Google predstavil pre svoju umelú inteligenciu Gemini novú funkciu, ktorá posúva schopnosti AI chatbota na novú úroveň. Namiesto textových odpovedí alebo statických obrázkov dokáže Gemini generovať plnohodnotné interaktívne simulácie a modely priamo v rozhraní chatu.
Používateľ tak môže komplexné vedecké, fyzikálne či chemické koncepty nielen pochopiť z popisu, ale ich aj priamo skúmať, meniť parametre, sledovať výsledky v reálnom čase a experimentovať s virtuálnymi modelmi bez toho, aby opustil okno konverzácie.
Od statických obrázkov k interaktívnym simuláciám
Doterajší spôsob, akým AI asistenti vysvetľovali zložité koncepty, bol prevažne textový, s občasným doplnením statickej grafiky alebo diagramu. Tento prístup má však zjavné limity. Napríklad pri vysvetľovaní orbitálnej mechaniky, molekulárnych štruktúr alebo fyzikálnych javov sa statický obrázok nedokáže plne vyrovnať interaktívnemu modelu, kde používateľ sám skúma vzťahy medzi rôznymi premennými.
Podporná stránka Google referuje, že Gemini ponúka grafický režim a dynamické zobrazenie, ktoré spoločne vytvárajú interaktívne a multimediálne prostredie na učenie a skúmanie informácií. Nová funkcia toto dynamické zobrazenie posúva o krok ďalej: namiesto prednastaveného obsahu Gemini generuje simulácie priamo na základe otázky alebo požiadavky používateľa, bez potreby vopred pripravenej šablóny.
Kde to využijete
Škála aplikovateľnosti je podľa samotného Google pomerne široká. Napríklad, keď používateľ zadá otázku o tom, ako Mesiac obieha okolo Zeme, Gemini nevygeneruje len text alebo statický obrázok orbitálnej dráhy, ale vytvorí funkčnú simuláciu, v ktorej môže pomocou posuvníkov meniť počiatočnú rýchlosť telesa alebo silu gravitácie a sledovať, ako sa tieto zmeny prejavia na dráhe obiehania.
Rovnako možno vizualizovať trojrozmerné molekulárne štruktúry prístupné z rôznych uhlov, alebo systémy fyzikálnych javov, v ktorých sa simuluje pohyb, sila alebo iné veličiny.
Na spustenie simulácie pritom netreba vymýšľať zložité vetné štruktúry, stačí formulovať otázku prirodzeným jazykom. Aj frázy ako „ukáž mi“ alebo „pomôž mi vizualizovať“ fungujú ako spúšťač pre generovanie interaktívneho modelu. Gemini následne interpretuje požiadavku, vyberie vhodný typ vizualizácie a okamžite ho generuje priamo v chate.
Ovládanie v reálnom čase
Jednou z kľúčových vlastností novej funkcie je spôsob interakcie s generovanými simuláciami. Ako sme už naznačili, používateľ nie je len pasívnym pozorovateľom. Prostredníctvom posuvníkov, číselných vstupov alebo iných prvkov rozhrania môže aktívne meniť parametre simulácie a v reálnom čase sledovať, ako tieto zmeny ovplyvňujú výsledok.
Tento princíp je v pedagogike dobre známy: aktívne experimentovanie s modelmi vedie k hlbšiemu pochopeniu tém ako pasívne čítanie vysvetlení.
Google postupne rozširuje schopnosti Gemini o funkcie, ktoré umožňujú aplikácii reagovať na kontext v reálnom čase, či už ide o obsah obrazovky, kamery, alebo po novom generovaných simulácií. Interaktívne simulácie sú prirodzeným pokračovaním tohto smerovania.
Kde a pre koho
Funkcia interaktívnych simulácií sa spúšťa globálne pre všetkých používateľov aplikácie Gemini a je dostupná cez webové rozhranie na adrese gemini.google.com. Na aktiváciu je potrebné v lište zadávania správ zvoliť Pro model.
Funkcia zatiaľ nie je dostupná pre používateľov účtov Google Workspace a Google for Education, teda pre firemné a školské účty, keďže pri tých Google pravdepodobne ešte testuje súlad s politikami ochrany dát a vzdelávacími štandardmi pred širším nasadením.
Toto obmedzenie môže byť pre niektoré školy a spoločnosti sklamaním, keďže práve vzdelávacie inštitúcie by z interaktívnych simulácií profitovali azda najviac. Google však podobnú schému obmedzenia funkcionality pre Workspace a Education kontá uplatňoval aj pri iných novinkách.
Ďalší prostriedok na boj s konkurenciou
Nová funkcia zapadá do širšieho kontextu súperenia medzi Google a OpenAI v oblasti AI asistentov. Zatiaľ čo OpenAI nedávno rozšírilo ChatGPT Pro o prístup k nástroju Deep Research a Codexu, Google stavil na multimodálne schopnosti Gemini, teda na kombináciu textu, obrazu, hlasu, videa a teraz aj interaktívnych simulácií.
Blog Google uvádza, že medzi kľúčové funkcie Gemini patrí okrem Deep Research aj Canvas a generovanie obrázkov prostredníctvom Imagen 4. Nová funkcia interaktívnych simulácií tieto schopnosti dopĺňa o ďalší rozmer. Gemini tak nielenže „vidí“, čo sa deje na obrazovke, ale dokáže aj aktívne generovať dynamický obsah, s ktorým používateľ priamo interaguje.
Stále tu sú otázky
Napriek tomu, že je táto funkcia mimoriadne atraktívne pre pomerne širokú škálu používateľov, niektoré otázky ostávajú otvorené. Zatiaľ napríklad nie je jasné, kam až siaha komplexnosť simulácií, ktoré Gemini dokáže generovať, teda či ide len o jednoduché fyzikálne modely, alebo aj o pokročilejšie chemické, biologické alebo astronomické systémy.
Rovnako nie je známe, či sú simulácie generované za behu priamo modelom, alebo ide o výber z preddefinovaných šablón, ktoré model prispôsobuje inštrukciám, respektíve požiadavkám používateľa. Odpovede na tieto otázky zrejme prezradí až praktické testovanie funkcie, ktoré môžeme očakávať v nasledujúcich dňoch a týždňoch.
AI ako interaktívny učiteľ
Schopnosť generovať interaktívne simulácie posúva AI asistentov do úplne novej kategórie. Doteraz bol základný model ich použitia reaktívny. Jednoducho povedané: používateľ sa pýtal, AI odpovedala. Interaktívne simulácie tento model menia na aktívny: AI nevysvetluje, ale vytvára prostredie, v ktorom používateľ sám objavuje nové poznatky.
Výskumy v oblasti vzdelávacej psychológie dlhodobo potvrdzujú, že práve aktívne objavovanie vedie k lepšiemu a dlhodobejšiemu porozumeniu než pasívne prijímanie informácií.
Z tohto pohľadu predstavuje funkcia Gemini interaktívnych simulácií potenciálne jednu z najhodnotnejších noviniek v oblasti AI asistentov za posledné mesiace, a to nie iba kvôli jej technickej sofistikovanosti, ale hlavne kvôli praktickej využiteľnosti. Či sa tento potenciál naplno pretaví do každodenného využívania, však ukáže až čas.

