Google už nechce trénovať svoje AI nástroje len na tom, čo nájde verejne na internete. Podľa zistení 404 Media začal vybraným vývojárom Android aplikácií ponúkať peniaze za prístup ku kódu, ktorý stojí za ich aplikáciami v Google Play.
Google mal niektorým vývojárom poslať e-mail s pozvánkou do „dôverného pilotného programu“, ktorý im má priniesť nový spôsob, ako zarobiť na existujúcom kóde.
Ponuka má podľa zverejneného e-mailu zahŕňať aj produkčný kód aktuálnych aplikácií, prototypy a archívy vedľajších projektov. Google vývojárom tvrdí, že ich kód môže mať nevyužitú hodnotu a pomôcť zlepšiť jeho vývojárske nástroje a produkty.
Google nežiada vlastníctvo, ale licenciu
Google podľa e-mailu nechce vývojárom zobrať ich aplikácie ani autorské práva. Licencia má byť nevýhradná, čo znamená, že tvorca by si mal ponechať 100 % práv k vlastnému kódu a teoreticky ho môže licencovať aj iným firmám.
Pre vývojára to môže znieť ako zaujímavá ponuka. Kód, ktorý už raz napísal, môže priniesť ďalšie peniaze bez toho, aby musel pre Google vytvárať nový produkt. Z pohľadu Googlu je však ešte dôležitejšie niečo iné. Reálny produkčný kód je pre AI modely oveľa cennejší než náhodné útržky z verejných repozitárov.
Takýto kód ukazuje, ako aplikácie skutočne fungujú v praxi. Obsahuje architektúru, prepojenia, staršie rozhodnutia, kompromisy, chyby, opravy aj logiku, ktorú vývojári používajú mimo ukážkových príkladov. Práve to môže pomôcť AI nástrojom lepšie rozumieť väčším projektom a navrhovať použiteľnejší kód.
AI naráža na problém s dátami
Google v samotnom e-maile podľa 404 Media výraz AI nespomína priamo. Odkazuje však na oficiálnu stránku Google AI, kde firma opisuje partnerstvá na zlepšovanie AI produktov. Google tam uvádza, že svoje modely trénuje najmä na verejne dostupných dátach z webu, no zároveň pilotuje programy, v ktorých platí za neverejný obsah v rôznych formátoch.
Veľké AI firmy už nesúťažia len v tom, kto má viac grafických kariet na spracovanie a trénovanie AI, ale aj kvalitou dát. Verejný internet je obrovský, no nie všetko na ňom je kvalitné, aktuálne, legálne čisté alebo vhodné na tréning. Pri programovaní je tento problém ešte citlivejší, pretože modely potrebujú nielen veľa kódu, ale hlavne dobrý kód z reálnych projektov.
Google zároveň dobieha konkurenciu v oblasti AI nástrojov pre vývojárov. Microsoft má GitHub Copilot, Anthropic tlačí Claude Code a Google buduje vlastné riešenia ako Gemini Code Assist či Google Antigravity. Ak chce v tejto oblasti presvedčiť profesionálov, potrebuje modely, ktoré nebudú dobré len v malých ukážkach, ale aj pri práci s veľkými aplikáciami.
Pre vývojárov to nie je jednoduché rozhodnutie
Čo všetko vlastne vývojár predáva, keď poskytne firme svoj produkčný kód? Nemusí ísť len o samotné súbory. V kóde môžu byť obchodné postupy, interná logika, technické know-how, bezpečnostné detaily, závislosti alebo časti, ktoré vznikli v spolupráci s klientmi.
Pred podobným krokom by si preto vývojári museli veľmi dôkladne skontrolovať zmluvu, práva tretích strán, bezpečnostné údaje aj to, či v projekte nezostali tajné kľúče, interné komentáre alebo citlivé informácie. Pri menších nezávislých aplikáciách môže byť rozhodovanie jednoduchšie, pri väčších produktoch oveľa zložitejšie.

