GPT-5 v medicíne: od asistenta k diagnostickému expertovi
GPT-5 v medicíne dosiahol úroveň nad skúsených lekárov. Prelom v diagnostike či riziko pre klinickú prax?
Úvod
Len pred pár rokmi sa zdalo, že umelá inteligencia v medicíne bude najmä pomocníkom – nástrojom na sumarizáciu dokumentov či predbežné triedenie pacientov. S príchodom GPT-5 sa však situácia dramaticky mení.
Najnovšia štúdia publikovaná tímom z Emory University (august 2025) ukazuje, že GPT-5 dokáže nielen úspešne riešiť textové medicínske otázky, ale aj integrovať dáta z obrázkov, laboratórnych výsledkov a klinických popisov do jedného diagnostického reťazca.
A výsledky? GPT-5 po prvýkrát prekročil úroveň licencovaných lekárov v štandardizovaných testoch medicínskeho uvažovania.
Prelomové výsledky na multimodálnych medicínskych benchmarkoch
Štúdia Capabilities of GPT-5 on Multimodal Medical Reasoning ukázala, že GPT-5 zvláda úlohy, ktoré boli donedávna vyhradené len pre skúsených lekárov.
- MedQA (USMLE testy): GPT-5 dosiahol presnosť 95,84 %, čo je výrazný nárast oproti GPT-4o.
- USMLE Step 2: až 97,5 %, čo je lepšie než priemerný výsledok medicínskych študentov pripravených na záverečnú skúšku.
- MedXpertQA Multimodal: GPT-5 prekonal ľudských expertov – v „odôvodnení zaverov“ o +24 % a v „porozumení“ o +29 %.
Napríklad pri pacientovi s podozrením na Boerhaave syndróm model správne spojil dáta z CT, laboratórne výsledky a klinické príznaky a navrhol urgentný Gastrografin swallow test – presne tak, ako by postupoval skúsený gastroenterológ.
Ako GPT-5 funguje: unified systém a step-by-step uvažovanie
Na rozdiel od predchádzajúcich verzií, GPT-5 je jednotný systém, ktorý vie dynamicky prepínať medzi viacerými režimami – od rýchlych odpovedí po „thinking“ mód určený na hlbšie uvažovanie.
Kľúčovou novinkou je Chain-of-Thought prompting: model pri riešení otázky najprv „premýšľa krok po kroku“, analyzuje jednotlivé symptómy a výsledky, a až potom vydá konečný verdikt. To vedie k vyššej presnosti pri komplexných prípadoch.
OpenAI navyše pridalo bezpečnostné mechanizmy, ktoré znižujú počet tzv. halucinácií a zaisťujú konzistentnosť výstupov.
Kde sú limity? Špecializované prípady a realita praxe
Napriek pôsobivým výsledkom má GPT-5 aj svoje hranice.
- V teste VQA-RAD (radiologické snímky) bol GPT-5 mierne slabší než jeho „mini“ verzia – ukazuje sa, že pri menších datasetoch môže byť väčší model konzervatívnejší.
- V štúdii o MRI mozgových tumoroch GPT-5-mini prekonal veľký model, no ani jeden nedosiahol klinicky akceptovateľnú presnosť.
To znamená, že hoci GPT-5 exceluje v štandardizovaných testoch, v reálnej nemocnici môže zlyhať pri netypických prípadoch alebo pri obrazoch nízkej kvality.
Etické a praktické výzvy: od experimentu k nasadeniu
Skutočnosť, že model prekonal ľudských lekárov v testoch, neznamená, že je pripravený nahradiť klinickú prax.
Ako upozorňuje časopis Wired (2025), LLM modely síce dokážu dosahovať vysokú presnosť, ale chýba im „klinická intuícia“ a schopnosť niesť zodpovednosť za dôsledky rozhodnutí. Navyše, systémová integrácia do nemocníc naráža na právne, etické a praktické bariéry – od zodpovednosti až po dôveru pacientov.
Záver
GPT-5 predstavuje kvalitatívny skok v medicínskom uvažovaní – z úrovne „ľudsky porovnateľného“ modelu (GPT-4o) sa posunul na „nadľudskú presnosť“ v štandardizovaných testoch. Je to obrovská príležitosť pre budúce klinické decision-support systémy, no zároveň výzva, ako tieto technológie bezpečne integrovať do praxe.
👉 Ak chceš sledovať najnovšie trendy umelej inteligencie, navštív AI Kurzy Online.
Diskusná otázka pre čitateľov
Ak by vám lekár oznámil, že váš stav posúdil aj AI model GPT-5 – zvýšilo by to vašu dôveru v diagnózu, alebo naopak obavy?
Praktické tipy pre Slovensko
- Telemedicína: GPT-5 môže pomôcť lekárom pri predbežnom triedení pacientov a odporúčaní ďalších vyšetrení – vhodné pre menšie regióny s nedostatkom špecialistov.
- Vzdelávanie lekárov: USMLE testy ukazujú, že GPT-5 môže slúžiť ako tréningový partner pre medikov a rezidentov, ktorí si chcú precvičiť klinické scenáre.