GPT-5.5 je oficiálne vonku: Prekonal dokonca aj Claude, toto všetko ponúka (kto má prístup)

Spoločnosť OpenAI vydala nový model umelej inteligencie s označením GPT-5.5. Ide o model navrhnutý predovšetkým pre agentické pracovné postupy, teda také, kde AI nielen odpovedá na otázky, ale sama vykonáva komplexné viacstupňové úlohy naprieč rôznymi nástrojmi a prostrediami, píše FoneArena.

GPT-5.5 prichádza len pár týždňov po vydaní GPT-5.4, pričom OpenAI ho prezentuje ako výrazný posun v schopnosti AI vykonávať reálnu prácu s minimálnym dohľadom používateľa. Interný kódový názov modelu bol „Spud“. Bola to prezývka, ktorou OpenAI model naznačovalo ešte pred vydaním.

Posledné vydanie len potvrdzuje rapídne tempo, akým OpenAI udržiava tlak na konkurenciu: za uplynulý rok spoločnosť vydala niekoľko generácií modelov v rýchlom slede.

Čo je nové oproti GPT-5.4

GPT-5.5 zachováva rýchlosť generovania textu na úrovni predchodcu GPT-5.4, no výrazne zvyšuje inteligenciu a efektivitu spracovania. Model produkuje výstupy vyššej kvality pri menšom počte výpočtových krokov, čo v praxi znamená nižšiu spotrebu tokenov pri rovnako náročných úlohách.

Portál RoboRhythms vo svojej analýze uvádza, že kľúčovým posunom nie sú ani tak benchmarkové čísla, ale zmena paradigmy: OpenAI prestáva predávať chatovací model a začína predávať autonómneho agenta.

Model bol co-vyvinutý s novou hardvérovou generáciou NVIDIA GB200 a GB300 NVL72. Jednou z kľúčových technických optimalizácií bolo zavedenie dynamického balancingu záťaže namiesto pevne nastaveného spracovania v blokoch. Tento prístup, ktorý sám Codex vyvinul analýzou reálnych produkčných dát, zvýšil rýchlosť generovania tokenov o viac ako 20 percent. Model tak za rovnaký čas zvládne viac práce a pri komplexných úlohách výrazne znižuje celkové náklady.

Agentické schopnosti a kódovanie

Jadrom GPT-5.5 je schopnosť interpretovať zámer používateľa, rozložiť ho na čiastkové kroky a vykonávať ich pomocou nástrojov až do úplného splnenia úlohy, a to bez nutnosti opakovaných inštrukcií.

V oblasti kódovania model dosahuje presnosť 82,7 percenta, konkrétne podľa benchmarku Terminal-Bench 2.0, a 58,6 percenta na SWE-Bench Pro, ktorý testuje schopnosť riešenia reálnych problémov zo skutočných GitHub repozitárov. CherCode dopĺňa, že GPT-5.5 na Terminal-Bench 2.0 prekonáva konkurenčný model Claude Opus 4.7, ktorý dosahuje presnosť 69,4 percenta.

Stojí za zmienku, že už viac ako 85 percent zamestnancov OpenAI používa Codex každý týždeň, najčastejšie na analýzu dát, tvorbu systémov hodnotenia rizík, automatizáciu pracovných tokov a spracovanie rozsiahlych dokumentov. Tieto interné čísla naznačujú, že GPT-5.5 nie je len produktom pre externých zákazníkov, ale je aj pevnou súčasťou každodennej práce samotnej spoločnosti.

Výkonnostné benchmarky

Okrem kódovania GPT-5.5 vykazuje solídne výsledky aj v iných oblastiach. Na benchmarku GDPval, ktorý meria výkonnosť v znalostnej práci naprieč 44 profesiami, dosahuje model skóre 84,9 percenta. Na OSWorld-Verified, testujúcom prácu v reálnom počítačovom prostredí, zase dosahuje 78,7 percenta. Ide o mierne, no stále dôležité zlepšenie oproti 75,0 percentám, ktoré vykázal GPT-5.4. Na simulovaných zákazníckych servisných scenároch Tau2-bench Telecom model dosahuje 98,0 percenta.

Vedecký výskum a matematika

V oblasti vedeckého výskumu GPT-5.5 podporuje dlhé viacfázové procesy, ktoré zahŕňajú formuláciu hypotéz, analýzu dát a iteratívnu interpretáciu výsledkov. V bioinformatike dosahuje silné výsledky na benchmarku BixBench a v genetike na benchmarku GeneBench.

Zaujímavým prípadom z interného testovania je dokázanie novej vety v kombinatorike týkajúcej sa Ramseyových čísel: matematický výsledok overený následne formálnymi metódami. FoneArena uvádza, že GPT-5.5 na benchmarku FrontierMath dosahuje 51,7 percenta, čím prekonáva Claude Opus 4.7 so skóre 43,8 percenta.

Bezpečnosť a kybernetika

OpenAI v oblasti kybernetickej bezpečnosti zaradilo GPT-5.5 do kategórie „High“ podľa svojho Preparedness Framework. To je vyššie hodnotenie, než aké dosiahli predchádzajúce modely, no stále pod úrovňou „Critical“.

Model je vybavený silnejšími klasifikátormi citlivých požiadaviek, zlepšenou detekciou zneužitia a mechanizmami na kontrolu opakovaného nesprávneho použitia. OpenAI rozširuje program Trusted Access for Cyber, umožňujúci overeným používateľom prístup k pokročilým schopnostiam v oblasti kybernetickej bezpečnosti, a spolupracuje s vládnymi partnermi na ochrane kritickej infraštruktúry vrátane energetických sietí a verejných digitálnych služieb.

Ako je na tom dostupnosť?

GPT-5.5 je aktuálne sprístupnený pre predplatiteľov ChatGPT Plus, Pro, Business a Enterprise, ako aj pre používateľov Codex. Bezplatní používatelia prístup k novému modelu podľa dostupných informácií zatiaľ nezískali. GPT-5.5 Pro je rezervovaný pre plány Pro, Business a Enterprise, s kontextovým oknom až jeden milión tokenov.

Pokiaľ ide o ceny prostredníctvom API (prístup má byť otvorený čoskoro), štandardná verzia bude stáť 5 dolárov za milión vstupných a 30 dolárov za milión výstupných tokenov. GPT-5.5 Pro bude podstatne drahší: 30 dolárov za milión vstupných a 180 dolárov za milión výstupných tokenov.

Napriek vyšším cenám oproti GPT-5.4 je však celková nákladová efektivita pri komplexných úlohách výhodnejšia, hlavne vďaka výrazne nižšej tokenovej náročnosti modelu.