Tohtoročná konferencia Google I/O bola náramne bohatá na zaujímavé novinky. Predstavilo či demonštrovalo sa toho naozaj veľa, no spoločným menovateľom toho všetkého bol jeden odkaz. Umelá inteligencia prestáva byť len nástrojom na odpovedanie na otázky. Stáva sa aktívnym agentom, ktorý koná vo vašom mene. Spoločnosť poskytla prehľad predstavených noviniek prostredníctvom tlačovej správy.
Google prišiel s celým ekosystémom vzájomne prepojených produktov, modelov a infraštruktúry, ktoré spoločne vytvárajú to, čo gigant nazýva „agentskou érou Gemini.“
Pre zaujíamvosť, len pred dvoma rokmi Google spracúval zhruba 9,7 bilióna tokenov mesačne. Minulý rok to bolo 480 biliónov. Dnes je to viac ako 3,2 trilióna, teda 7-krát viac ako pred rokom.
Vyhľadávanie sa mení na debatu
Funkcia „Prehľad od AI“ má dnes viac ako 2,5 miliardy aktívnych používateľov mesačne. Režim AI, čo je zatiaľ najväčšia inovácia vo Vyhľadávaní, pritom za jediný rok prekonala hranicu 1 miliardy aktívnych používateľov mesačne.
Vyhľadávanie vďaka tomuto režimu čoraz viac správa ako bežná konverzácia, nie séria jednorazových pokynov. A po novom Google prináša ďalšiu zásadnú zmenu. Predstavil zástup informačných agentov, ktorí budú nepretržite na pozadí vyhľadávať presne to, čo v danom momente potrebujete, a to bez toho, aby ste sa museli pýtať.
Tieto modely budú dostupné od leta, spočiatku pre predplatiteľov programov Google AI Pro a Ultra. Súčasťou ponuky bude aj možnosť vytvárať si vlastné informačné panely a sledovacie prvky, teda akési miniaplikácie priamo vo vyhľadávaní.
Gemini rastie
Google sa tiež pochválil slušnými štatistikami v rámci svojej umelej inteligencie Gemini. Pred rokom mala aplikácia 400 miliónov aktívnych používateľov mesačne. Dnes je to takmer 900 miliónov, teda viac ako dvojnásobok. Denné dopyty pritom stúpli za rovnaké obdobie viac ako 7-násobne.
Logicky, stojí za tým nielen kopa vylepšení, ktoré už model dostal, ale aj tie, ktoré ešte len dostane. Za zmienku stojí napríklad funkcia Spýtať sa YouTube. Namiesto prehľadávania platforma sama odporučí najrelevantnejší obsah a preskočí priamo na časť videa, o ktorej vyhodnotí, že vás bude zaujímať najviac. Testovanie už prebieha, spustenie je plánované taktiež na leto, konkrétne v Spojených štátoch.
Dokumenty Live zase prinášajú hlasové ovládanie do tvorby textov. Používateľ jednoducho hovorí a Gemini z jeho slov vytvorí dokument. Netreba žiadny konkrétny príkaz. Funkcia príde predplatiteľom toto leto a neskôr sa rozšíri do Gmailu a Keep.
Gemini 3.5 Flash
Google zároveň predstavil hneď niekoľko nových modelov. Hlavnou novinkou v tomto smere Gemini 3.5 Flash. Tento model podľa vlastných slov spoločnosti prekonáva poslednú generáciu takmer vo všetkých benchmarkoch a je 4-krát rýchlejší ako porovnateľné špičkové modely konkurencie.
Pre firmy, ktoré denne pracujú s obrovskými objemami dát, by presun 80 percent záťaže na 3.5 Flash znamenal úsporu viac ako miliardy dolárov ročne. Model je dostupný od dnešného dňa. Nasledovať bude Gemini 3.5 Pro, a to vraj už budúci mesiac.
Debutu sa však dočkal aj Gemini Omni, model schopný generovať výstup v akejkoľvek modalite. Začína sa videom, postupne pribudnú obrázky a text. Prvý variant tohto modelu, presnejšie Gemini Omni Flash, je dostupný v aplikácii Gemini, Google Flow a YouTube Shorts. Pre vývojárov cez API príde v najbližších týždňoch.

Agent, ktorý pracuje 24/7
Opomenúť nemožno ani predstavenie Gemini Spark, osobného AI agenta, ktorý beží nepretržite na vyhradených virtuálnych zariadeniach v Google Cloud. Vôbec teda nezáleží na tom, či máte zapnutý počítač alebo nie.
Spark beží na Gemini 3.5 a platforme Antigravity, čo mu umožňuje zvládať dlhodobé úlohy na pozadí. S vlastnými nástrojmi Google aj aplikáciami tretích strán sa integruje cez protokol MCP, pričom Androide budú priebeh a aktualizácie úloh zobrazené cez nové rozhranie Android Halo. Neskôr v lete bude Spark fungovať aj priamo v prehliadači Chrome.
Tento týždeň Google spúšťa testovanie so skupinou dôveryhodných používateľov. Budúci týždeň príde beta pre predplatiteľov Google AI Ultra v USA.
Infraštruktúra za stovky miliárd
Samozrejme, takto obrovské inovácie si vyžadujú obrovskú a schopnú infraštruktúru, čo si ale Google riadne uvedomuje. Zatiaľ čo v roku 2022 investoval do AI infraštruktúry 31 miliárd dolárov, tento rok má v pláne minúť 6-krát viac, presnejšie 190 miliárd.
Kľúčom k úspechu majú byť vlastné čipy. Google predstavil 8. generáciu TPU v akomsi duálnom prevedení. TPU 8t slúži na trénovanie modelov (takmer trojnásobný výpočtový výkon oproti predchádzajúcej generácii, možnosť škálovať na viac ako milión TPU po celom svete) a TPU 8i optimalizovaný na prevádzku modelov s dôrazom na rýchlosť odozvy. Oba čipy ponúkajú až dvojnásobný výkon v prepočte na jeden watt.
SynthID na boj s deepfake obsahom
V neposlednom rade sa prezentácie dotkli aj bezpečnosti. Výskumy ukazujú, že ľudia dokážu správne identifikovať deepfake videá len v zhruba štvrtine prípadov. Google na tento problém reaguje rozšírením svojho nástroja SynthID. Ide o neviditeľný vodoznak, ktorý slúži práve na rozlíšenie skutočných videí od podvodov. Od svojho spustenia označil viac ako sto miliárd obrázkov a videí a audio nahrávky v celkovej dĺžke 60-tisíc rokov.
Pribudla aj nová vrstva ochrany, ktorou sú certifikáty pôvodu (Content Credentials). Tie ukážu, či obsah vytvorila AI alebo kamera a či bol následne upravený generatívnymi nástrojmi. Rozširujú sa na Vyhľadávanie aj Chrome.
Čo ďalšie Google predstavil?
Samozrejme, Google toho predstavil oveľa viac. Aby sme vás ale príliš netrápili, zvyšné kľúčové oznámenia si zhrnieme v bodoch:
- Antigravity 2.0 sa rozširuje z vývojárskeho prostredia na plnohodnotnú platformu pre správu skupín AI agentov. Prichádza aj nová aplikácia pre desktopy.
- Google Pics je nový nástroj na tvorbu a úpravu obrázkov, postavený na modeli Nano Banana. Každý prvok obrázka vystupuje ako samostatný objekt, čo umožňuje presnú úpravu. Dostupný pre dôveryhodných testerov, neskôr v lete pre predplatiteľov AI Pro a Ultra.
- Inteligentné okuliare sú segment, do ktorého plánuje gigant vstúpiť už na jeseň, najskôr s modelom v audio verzii. Model s displejom vraj príde neskôr.
- Gemini for Science prepája AI agentov s viac než 30 vedeckými databázami v oblasti biologických vied na urýchlenie výskumu.
Tohtoročné Google I/O teda neprinieslo iba jeden veľký produkt, ale celý nový ekosystém, v ktorom majú agenti, modely, hardvér aj softvér pracovať ako jeden celok.

