Ta skutečná AI historie je tady 70 let s několika zimami.
70 let výzkumu, dvě AI zimy a čtyři éry technologického vývoje - to vše předcházelo ChatGPT. V téhle epizodě Deeplink Show procházíme celou historií umělé inteligence od Alana Turinga a prvního chatbota Eliza přes Deep Blue, AlphaGo a AlphaFold 2 až po transformery, GPT moment a dnešní závod modelů - včetně toho, kde vlastně stojíme na cestě k AGI. Pokud chceš pochopit, proč AI není žádná novinka a co muselo přijít, aby vznikl svět, ve kterém žijeme dnes, tenhle díl je přesně pro tebe.
Poslouchat na platformách
Souhrn
Sedmdesát let výzkumu, dvě AI zimy a čtyři vývojové éry předcházely momentu, kdy ChatGPT získal sto milionů uživatelů za pouhé dva měsíce. V epizodě procházíme celou historií umělé inteligence — od Turingova testu z roku 1950 a prvního chatbota Eliza přes expertní systémy 80. let, Deep Blue, AlphaGo a průlomový paper Attention is all you need z roku 2017 až po dnešní závod velkých modelů. Klíčovým tématem je, že AI kolem nás fungovala dlouhá léta skrytě — v doporučovacích algoritmech, vyhledávačích nebo spamových filtrech — dávno před tím, než si ji lidé mohli osahat přes chat rozhraní. Diskutujeme také o pojmech AGI a ASI a proč hranici obecné umělé inteligence pravděpodobně budeme schopni rozpoznat až zpětně, nikoliv ve chvíli, kdy nastane.
Transcript
Jindřich: Název bug v programování, co teď momentálně označuje chybu softwaru, takhle je vznikal tak, že tam přilítná kámoucha nebo brouk a on neprosvítil tu díru v tom děrném štítku.
Filip: Za pět dní tak oni byli schopni nabrat milion uživatelů a za dva měsíce sto milionů uživatelů.
Jindřich: Rozhodně to nebude tak, že se jednou ráno probudíme a přečteme si v novinách, že tady AGI.
Filip: Já troufnu tvrdit, že ty chatboty píšou líp než některý lidi.
Jindřich: No a obecně tak generativní uměla inteligence vlastně nepřišla, zničila nic, jo, to je skutečná historie, už tady v tohle ten okamžik nějakých 70 let s několika zimami.
Filip: AI je kolem nás jako fakt dlouhou dobu, jenom je schovaná a my ji prostě nevidíme a tomu často říkám takové jako invisible AI.
Jindřich: Právě posloucháte DeepLink Show. Filipe, vítej u další epizody podcastu DeepLink Show a zdravím stejně tak i naše posluchače. Pojďme si dneska říct něco k historii umělý inteligence, protože to, co my vlastně v téhle ten okamžik a poslední roky vnímáme jako AI revoluci takzvaně, tak to vlastně do jistý míry revoluci je, ale možná co to spíš je, tak je taky vyvrcholení ty dlouhý cesty plný větších nebo menších úspěchů. Pojďme si něco říct od úplných začátků, od Alan Turinga až po Claude 4.7 a aktuální modely, aktuální trendy. Můžeme se zase zafilosofovat, co přijde potom. A obecně si pojďme to sdělit do takové symbolické čtyři éry. Každá éra má svůj vlastní paradigma. No a obecně tak generativní uměla inteligence vlastně nepřišla, zničila nic. A to je skutečná historie, už tady v tomhle okamžitě nějakých 70 let s několika zimami. Ale tak, či onak, bez toho, pokud bychom těla těch předchozích 70 let neměli, tak ChatGPT by nevzniklo a to, co máme teď, bychom vlastně vůbec neměli. Tak pojďme se na to podívat do trochu většího detailu.
Filip: Intro, zdravím tě, zdravíme naše posluchače a za mě dneska jako super téma, protože umělí inteligenci všichni žijou posledních pár let a je to prostě téma číslo jedna a píše se o tom i v klasických médiích nebo nějaký technický. Ale jak si naznačil, ta historie šahá mnohem mnohem dál a je zajímavý se na to podívat z toho jako většího obrázku, kdy vlastně před nějakýma, kolik to je, 70, skoro 80 lety začaly jako první lidi o tom přemýšlet, nebo respektive samozřejmě dřív už to, dřív už byly taky nějaký zmínky, ale asi takovou nejznámější myšlenkou, kterou si myslím, že zná dneska prakticky každej, tak je tzv. Turingův test. Ten Turingův test, s tím přišel Alan Turing v roce 1950, což už je nějaké 75-76 let zpátky. A ten test spočívá v tom, že snaží se odhalit nebo definovat, jestli ten stroj dokáže přemýšlet a on na to šel tím stylem, že vlastně pokud ten stroj dokáže oblafnout člověka v tom, že si myslí, že je to člověk, že vlastně ty jako člověk nepoznáš, že na druhý straně je počítač, tak tím testem prošel. A ten test spočívá v tom, že máš dva účastníky, který si vlastně jako nevidějí, s kým si píšou a vedou prostě konverzaci. No a na jedný straně máš buď to počítač, anebo toho člověka. A pokud ten vlastně člověk na té druhé straně, ten co dělá ten test, není schopnej poznat, jestli naproti němu sedí ten počítač nebo člověk, tak pokud tam je počítač a on řekl, že si myslí, že to je člověk, tak ten počítač takzvaně jako prošel Turingův test a to znamená, že vlastně jako dokáže přemýšlet, dokáže mimikovat lidský chování, řekněme. Ono, ten test je trošku složitější, ono tam pak hraje s nějakou úspěšností toho přesvědčení, ale jako Ve zjednodušeným podání se to dá říct nějak takhle. Takže už přes sedmdesáti skoro lety se přemýšlelo o tom, jak definovat, jestli počítač nebo nějaká umělá inteligence vlastně dokáže přemýšlet.
Jindřich: To je vlastně dost zajímavé, protože ten Alan Turing je považován za otce teoretické informatiky. A přesně ten test, který jsi zmínil, ten v širším kontextu teoretické informatiky dává základy těm počítačům a výpočtům, kterými v ten okamžik máme. To si zmínil ten rok 1950, takže tady je důležitý si uvědomit to, že dá se říct, že tady byl přerod těch děrných štítků. My jsme skoro ještě v době děrných štítků, byť řekněme, že už v těchto padesátejch letech bylo jasné, že je to trošku přežitá technologie. Tak jenom bychom si to historicky zasadili do toho kontextu, kde jsme.
Filip: Už dávám přesně, co jsou děrný štítky pro posluchače, který třeba nejsou tak technický.
Jindřich: Jasně, je to, když to vezmu, nebo když to hodně shlednu, tak je to vlastně jakýsi počítadlo, historický paměťový medium, což vypadalo přesně tak, jak si to člověk dokáže představit, štítek, klasický kůsek papíru a tam se přesně dělaly bytový dírky třeba do jednotevých částí. jedničky a nuly, přesně tak jako do jednoduchých částí papíru. Teď se zaznamenal ten binární kód do toho a pak byl stroj, který dělal tam dírky a pak byl stroj, který to četl. Mimochodem, když hodně odbočím od mé myšlenky, když přišli děrní štítky a stroj to měl číst, měl prosvítit ty díry, které tam byly, Název bug v programování, co teď momentálně označuje chybu softwaru, tak právě vznikl tak, že tam přilítná kámoucha nebo brouk a on neprosvítil tu díru v tom děrném štítku. a tak momentálně vznikl vlastně ten termín bug. Jak ho známe dodnes, když máme nějaký problém softwaru, chybu, tak je to bug. No ale kam jsem se tímto chtěl dostat? O šest let později, v 1956, byla takzvaná Dartmouth Conference. A to byl okamžik oficiálního zhradu toho termínu AI, jako Artificial Intelligence. Ono říká se mu konference, ale ve skutečnosti to byly jenom pár počítačových nadšenců přesně v této době v těch 50 letech, který se sjeli a řekli si, že tak uděláme umělou inteligenci. Paradigma ten byl takový, že vytvořej program, který se bude zlepšovat sám sebe. Jak asi už tušíme, k ničemu takovému tam nedošlo. Ti borci se zase zbalili. 20 let se samozřejmě nic nedělo. Ale ten jejich naivní optimismus byl takovej, kdy oni prohlásili, že do 25 let stroj porazí mistra světa v šachu. 1956, tohleto byl rok. No a ono do jistý míry trefa. Ono se to stalo v 1997, nebylo to v 1925 poté, bylo to samozřejmě mnohem později. V tento okamžik jsme se dostávali do zrodu umělý inteligence a předpokladů, že někdy ten výpočetní výkon bude natolik dobrý a natolik autonomní, že takhle komplexní hru jako v šach vyhraje oproti mistrově světa. A to byl ten okamžik, kdy ten samotný termín Artificial Intelligence vlastně vznikl.
Filip: To je zajímavý, že už je to fakt takhle dávno. A co mi přijde ještě zajímavější, když ještě trošku ukročím k tomu Turingovu testu zpátky. Vezmi si, že když vezmeš dnešní modely, dnešní chatovací asistenty, agenty a chtěl bys na ně aplikovat Turingův test nebo vlastně obecně to, co se na té konferenci jako řešilo, tak za mě, mně to přijde, že jsme jako překonali ten milník jako násobně, že jako před x lety, když jsme se bavili před možná třeba pěti lety, kdy ještě vlastně byly jenom raný verze chat GPT, tak ten Turingův test pořád byl takový grál, že jako i já jsem si říkal, hele, když prostě mě ten, že jako s těma chatbotama si prostě komunikoval, ale poznal, že to je jako ten počítač. Bylo to prostě takový… jako prostě jsi to poznal, ten pocit. Nedokážeš ještě jako definovat, kvantifikovat, ale prostě byl tam ten pocit. Ale dneska tyho, já si troufnu tvrdím, že ty chatboty píšou líp než některý lidi. Takže jako tyhle ty zákony, myslím si, že kdyby pánové žili v dnešní době nebo viděli, co za těch 70 let přijde, tak by byli jako extrémně překvapený, kam se to posunulo.
Jindřich: Jak já si vzpomínám, když jsem štěstí studoval aplikovanou informatiku na věžce, tak jsme měli teoretickou informatiku. Přesně tohle jsme řešili. Turingův test a ve skutečnosti těch testů je potom několik. A několik je těchho paradigmat právě od alentůringa. A povědně mě někdo může víc omilu, ale teď dáte třeba jen 8 let zpátky, 10, 8 let zpátky něco takového, tak už tehdy jsme nepředpokládali úplně, že by v dohledný době tím Turingovým testem ten stroj mohl projít.
Filip: Minimálně já ne, takže když tak nás uvěděte, jsem umiluji v komentářích. No a jak si ty si zmiňoval, tak potom teda byla tady ta konference, definovalo se to slovíčko artificial intelligence, no a pak co se dělo, vlastně se moc jako nedělo, byla takzvaná jako AI winter a to je pojem se kterým se tady setkáme několikrát a možná se s ním jako setkáme i třeba v budoucnu, protože je to jeden z pojmů, se kterým se taky, nebo o kterým se mluvilo i v současném stavu AI, jestli něco takového nepřichází, byť já takový pocit teďka jako nemám, ale zkrátka ten pojem říká ten AI Vinter, že se nic neděje v tom období, že ten pokrok je tak jako zamrzlej a jsou možná nějaký malý inkrementální vylepšení, ale zkrátka čeká se na nějaký průlom, protože něco nedoskat ač už je to vypočetní výkon nebo ty algoritmy nebo ty metody na naučení těch neuronek, což v této době ještě To ještě se jim ani jako nesnělo o nějakých neuronových sítí. Nicméně, dnes bylo to tak, že by se nedělo nic, ale v šedesátých letech tak ten se nese v duchu vzniku nebo svíče rozvoje robotiky. A tady mám takovej jeden strašně zajímavý fun fact. Ty jsi říkal, že tak zajímavý není, ale já jsem ho zem protlačil. A to, že robot, slovo robot, tak je vlastně českýho původu. A přišel s ním Karel Čapek ve svý hře R.U.R. To znamená ve svý Třeba, že to je divadelní hra a později z toho i knížka, doufám, teď nechci kecat, ale zajímavé je, že nepřišel s tím Karel Čapek, přišel s tím jeho brater a Josef Čapek a je to slovo, které si myslím, že je snad nejvíc používané slovo na světě z těch našich českých slov, které mají původ u nás, protože se přijalo úplně doslovně do angličtiny.
Jindřich: Jo přesně a pokud se nepletu, tak nejen do angličtiny, jestli si správně pamatuji, ještě hodiny dějepisu ze základní školy. Myslím, že do spousty jazyků.
Jindřich: Pojďme se posunout teda. to se někde pár let dál a přichází rok 1966 a tam vlastně vzniká první chatbot a ten chatbot se jmenuje Eliza nebo respektive typ toho chatbotu se jmenuje Eliza a je to od jakýho se Josepha Weizenbauma z MIT. z americké univerzity. A ten nejznámější se jmenoval doktor. Takový tematický název. Ale co si myslím tady extrémně důležitý, tak on samozřejmě vůbec nerozuměl tomu, co člověk říká, co člověk píše, jak se s ním komunikuje, ale měl definovanou sadu pravidel. Člověk standardní if, then. To, co známe dnes. Přesně tak prakticky kontriviální. Ten, který má relativně… vysoký limity nebo perspektivě nízký limity. V praxi je to relativně nepoužitelné na většinu zorku dat. Každopádně, když se třeba užívatel mu napsal, že mám pocit, že mě nikdo nerozumí, například, tak on nepotřebuje respektovat Eliza, tak se zeptala, proč si myslíte, že vám nikdo nerozumí. Prakticky straight as this. Ale co se tam vlastně zašlo pozorovat nebo ten psychologický efekt, který tam vědci zašli pozorovat, A ten samotný největší význam toho četbota v této době ukázal, že člověk snadno může nabít dojmu, že mu stroj rozumí. A nebylo to některá ve spojitosti s tím, že by mu ten člověk rozuměl, ale přesně na to, že měl definovaných těchto dojistý míry pár v 1966. roce i v den pravidel. Takže když člověk mu kladl specifické otázky, tak on dokázal relativně rozumně… kdejší dobu odpovídat. A tohleto tak to do jistý míry byl ten první, řekněme, mylník, co se týče těch četbotů v našem slova smyslu aktuálních četovacích asistentů.
Filip: Na mě na tohle přijde nejvíc fascinující to, Vlastně ten lidský mozek si je schopnej jako velmi dobře oklamat, protože tohle fakt bylo jako i v Else, tam nebyla žádná neuronová síť, něco, co by predikovalo, co má odpověď, je prostě fakt jako rozhodovací strom a já jsem na tohle dělal video už jako dlouho zpátky a vlastně tady ta vlastnost lidská, že jako přisuzuješ ty lidský vlastnosti neživým objektům, tak jí se říká antropomorfismus, složitý slovo, ale zkrátka je to jako běžná věc, která se děje a nemusí to být jenom u umělý inteligence, ale děje se to třeba i u plišáků animovaných vlastně pohádek nebo u zvířat a zkrátka jako my lidi máme takovou jako snahu vidět v různých neživejch věcech, když vypadají jako lidi nebo se trošku projevujou jako lidi nebo projevujou nějaký trošku emoce a zkrátka jako napodobujou to lidské chování, tak najednou máme jako tendenci jim přisuzovat ty lidské vlastnosti a vidět v nich tu živou bytost a krásně to je vidět třeba i u té robotiky. když jsme ji předtím nakousli, ten vznik robotiky, tak jak byly, jak máme dneska humanoidní roboty, tak jako jeden z argumentů, proč dělat roboty, který vypadá jako lidi, tak je právě ten, že lidi, jako budí to v lidech jako jinačí pocity, než když ten robot vypadá třeba jako nějaký zvíře nebo něco jinýho, zkrátka když nemá tu konstituci toho člověka. No a, to se určitě zaregistroval, takový ty videa, kdy se ty humanoidní roboti jako splašili, že jo, a ještě snažili se vyvlíknout, nebo bylo video, kdy vlastně oni ukazovali toho robota a byl tam lidský DAF před ním a někdo na něj šáhnul a on tak jako na něj jako vystartoval, prostě jak kdyby říkal, hej, co děláš. A lidi měli strašnou tendenci na internetu tomu přísluzu, jako hej, ten robot jako nabil vědomí, nebo se mu to prostě nelíbilo a tak toho člověka jako osočil, ale byla to chyba, že jo, byl to nějaký bug, ale to je celá ta tendence nás lidí k tomu antropomorfismu zkrátka jako přisuzovat tady těm neživejm objektům ty vlastnosti. Mně to přijde strašně jako fascinující a to se asi k tomu pak dostaneme na konci, ale i dnešní Čerpoti. Jako, definoval bys, že ti jako rozumí, nebo ne, že jo, když jsi říkal u tý Elízy, že vlastně těm lidem vůbec nerozuměla, co říkaj. To jsou taky jako zajímavý otázečky, ale to bychom se dostali od
Jindřich: té historie někam dál. Je to extrémně zajímavý, velmi pravděpodobně jako jiný téma, ale určitě možná to by se nám spíš hodil jaký expert třeba z oboru psychologie, nebo někdo takovej. Kdo v tom má tu expertise a dokázal by s náma toto téma vlastně otevřít. Další téma, který s tím velmi úzce spojený je, že existují případy, kde se člověk zamiloval hlavně do této čerpota, nebo této umělý inteligence. Vlastně ani nevím pořádně, jak bych to měl opsat.
Filip: Já si myslím, že to bylo i u tý Elízy, že byly případy, kdy ty lidi si začali budovat nějaký vztah a mně přijde hezky, jak to ukazuje vlastně tu jednoduchost toho, že když někdo umí naslouchat, tak stačí se ptát na ty otázky a rozvíjet to, co ti ten člověk řekl, což na tom byla postavená ta Elíza, a jak to dokáže vybudovat ten vztah.
Jindřich: To mám vlastně mnohé lidi, že když jsou jako charizmatický, tak nemusí ani moc mluvit, stačí jenom, když prostoukají a implicitně už jim mají ostatní rádi. Jako je to extrémně zajímavý fenomen.
Filip: No nic, pojďme dál, ať se nezasekneme u psychologie, byť strašně zajímavý téma. No přicházejí teda sedmdesátý let a po Elize. Přichází první AI zima a přichází také zklamání z toho, kdy výzkumníci slibovali to, že bude rychlej pokrok. Že teď už to bude fakt rychle, ale narazilo se na spoustu limitů. Data zkrátka nebyly, byly pomalý počítače v těch 70. letech. To, co máme dnes v kapce, v telefon, tak se v té době o tom ani nemohlo snít. Takže i ten vypočetní výkon byl strašně malej. A ty metody nějakého tvorby umělé inteligence byly na samých počátcích. Takže ten problém se ukázal těžší, než se čekalo. A po nějakých deset let se prakticky nic moc nedělo v tom oboru.
Jindřich: Ok, pojďme se možná zase ještě o kousek poslou, přesně jak jsi řekl, dlouho se nic nedělo a tam je důležitý si uvědomit jako té historické konsekvence k tomu, že vlastně tohle se furt opakuje, dřív nebo pozdě, jako ve všech operách, že nějaká ingredience, nějaký úhel pohledu k tomu chybí. Dřív třeba tam byly ty inženýři, oni měli tu představu, že to potenciálně mohlo fungovat, ale nebyl ten výpočetní výkon, takže chyběla tam nějaká nižší vrstva té informatiky obecně. Proto, aby mohli ty vědci dělat, co třeba vlastně měli namyšlený. My se pak tomu třeba dostaneme, ale i když třeba přišlo jako první neuronní sítě, nebo jaký základ, jako machine learning, algoritmy, tak my jsme už měli výpočetní výkon, měli jsme ten logaritmus, ale například jsme třeba neměli dostatečný množství dát, dostatečný kvalitní množství dát. A takhle je to v různých oborech, když byla nevím průvyslová revoluce, tak zase vytvářly se stroje, ale nebyl materiál například, ze kterých se to potom vyráběl a tak dále. Takže tohleto je důležitý, co tím chci říct, že je hodně důležitý si uvědomit, že ty úspěchy, které třeba máme dnes, tak jsou složené ze spoustu různých konsekvencí. Obrovský jako butterfly efekt z nějakých relativně drobností, ale ty kdyby nebyly, tak vlastně nejsme tam, kde jsme. No a když se posuneme víc tím osmdesátým letem, osmdesátým letům, tak tam přišel tzv. Mycin, což byl software nebo respektive systém, který byl vytvořený pro podporu diagnostiky infekčních onemocnění v medicíně. A důležité je si tam uvědomit to, že Z tohle okamžik přišel velký komerční úspěch. A byť ten systém jako takovej se sám nikter tak neprodal, tak už tam byl vidět ten potenciál toho typu potenciální komerce, toho, že by se to mohlo prodávat, toho, že by tady byly potenciální kupci, který by mohli mít o takovýhle systém zájem. A vlastně byl tady obrovský důvod pro to, umělí inteligence a asi ne úplně ne, ale obecně jako do těch počítačových systémů, který s tím tehdy velmi úžasně souviseli, hodně financovat a zkrátka dávat do toho nějaké prostředky pro to, aby tento ten obor se rozvíjel mnohem rychlejším tempem, než se třeba rozvíjel dosud.
Filip: Pořád nutno říct, nejsme u neuronových sítí, tedy mluvíme o tzv. expertních systémech, což Zjednodušené řečeno obrovská sada pravidel podle kterých se má ten počítačový program vlastně jako rozhodovat a to se ukázalo i jako ta největší bolest toho že jako byť ty jsi schopný v tom expertním systému vymodelovat jako velmi komplexní věci. a pak provádět simulaci, diagnostiku. Tady ten Mycin, co jsem zmiňoval, to byla diagnostika infečních onemocnění. Takže byl jsi schopnej třeba hledat nějaké paterny nebo dávat tomu nějaký smysl těm datům, co jsi měl, ale ten problém byl, že ty pravidla prostě neškálujou. Když to zase porovnám s tou dnešní AI a neuronovéma sítěma, tak tam ta obrovská výhoda je, že ty nemusíš definovat natvrdo ty pravidla, ty nedefinuješ když něco takto znamená tohle a když to vztáhnu k třeba k té diagnostice, tak že všechny tyto příznaky dohromady tak znamenají tohle a když tam je nějakej jinej, tak to neznamená tu nemoc a zkrátka to asi cítí každej, že se v tom postupně člověk začne ztrácet v těch pravidlech a u těch neuronových sítí tyto to neděláš, necháš ty neuronky sami se natrénovat na velký množství dat a hledat vlastně ty vzorce, jednodušeně řečeno. Tady pořád nemluvíme o AI, jaký známe dneska, ale už to byl nějaký první zajímavější úspěch, kdy už firmy a investoři viděli tu vizi, že bude možné to aplikovat v tom reálu. Nicméně, jak jsem říkal, ta komplexnost těch pravidel tak nedovolila. tomu rozvoji a přišla nám druhá AI vinter, druhá AI zima a to byl těch konec osmdesátejch let, kdy byly nějaké pokroky v těch expertních systémech, ale vlastně nic moc se neposunulo. Ty zkrátka jako nejsi schopný zmapovat všechny ty možný pravidla, všechny ty kejsy a nejenom zmapovat, ale hlavně udržovat. To je ten největší kámen úrazu, když se ti vyvíjí nějaký systém, což utrtiví většinu věcí, jako je ta diagnostika nemocí, predikce textu, překlady, cokoliv. To jsou dynamické systémy. Ty nejsi schopnej zamknout do nějaké pevné sady pravidel, takže tam to prostě na tom, nechci říct, rozkotalo, ale nebyla to škálovatelná ulička pro složitější a
Jindřich: složitější problémy. Přesně tak. V těch 80. letech těch expertních systémů byla celá řada. Vždycky byly velmi uspecializovaný, ale přesně jak jsi zmínil, vždycky byly založený jenom na sadě pravidel, který dal někdo dohromady a není možné všechny zmapovat. My se k tomu ještě dostaneme, k číslům a rozdílům, které se do jistý míry nakousnul, ale myslím se, že tímhletím se můžeme trochu přesunout do té naší symbolicky druhé éry, kterou jsem změnil a tím je právě ta machine learning era. Což samozřejmě ten echo machine learning už sám o sobě je něco odlišného než definování těchto triviálních if-then pravidel. A to je to, co chci říct. Takže místo toho psaní a definice těch jednodlivých pravidel od A do Z, tak ten systém se učí ze statistik nebo respektive z těch dat. Takže my už máme algoritmy, máme jakou… sadu dat, která nám dává vstup a ten potenciální výstup. Přesně tímhle pomocí těch dat naučíme ten náš machine learning algoritmus. No a tady asi stojí za zmínku rok 1986 a tam vlastně zjíkal takzvaný backpropagation algoritmus, možná systém, nevím. No ale tak či onak, tak to byl ten algoritmus pro training samotných neuronovéch sítí. 1986, takže my vlastně jsme 20 let od toho, kdy si někdo říkal, že OK, tak my tady budeme tvořit program, který bude zlepšovat sám sebe. To se jim přes 20 lety tehda nepovedlo, neměli ty prostředky, neměli ani ty znalostní možnosti v té době, ale voilà, o 20 let později a vlastně to, o co oni se vlastně tehda snažili, tak vlastně přišlo.
Filip: No, vlastně začaly vznikat ty machine learning algoritmy, které jsou schopný vzít nějaké množství dat a na tom se učit, nebo na nich dělat vlastně, nebo dávat ty výsledky. A jak jsem zmiňoval, je to Decision Trees, Random Forest, Bayerovská statistika a jako delší vlastně algoritmy. Mně se líbí ta definice toho machine learningu, no jich je samozřejmě jako spousta, ale jedna z nich je od Toma Mitchella a říká, že program se vlastně učí a zlepšuje s tím, čím má k dispozici víc těch trénovacích dat, samozřejmě jako relevantních, aby dávalo smysl se na nich učit, ale zkrátka, že ten program není jenom pevně definovaný, ale zlepšuje se na základě toho, když ho dotrénováváš. Samozřejmě pak se tam můžeme dostat do nějakých dalších detailů, kdy řešíš nějaký overfitting a další věci, ale… zkrátka dokáže se ten algoritmu zlepšovat. Je důležitý říct, že i přesto, že jsme teprve v té druhé éře, tak tyto algoritmy se dneska jako úplně běžně používají, protože na všechno musíš používat nějaké pokročilé neuronové sítě, nebo generativní AI a tak dál, zkrátka jako machine learning, se dneska běžně používá. Ty různý metody jsou skvělý v různých odvětvích, ale typicky je to hledání nějakých vzorců, nějakých anomálí v těch datech, kdy ty nepotřebuješ nějaké ještě pokročilejší věci a jsou třeba rychlejší někdy. Takže to je vlastně k tomu machine learningu. No a když bychom hledali pak nějaký zajímavý milník, který tak nějak byl známej hodně na veřejnosti, protože tohle jsou pořád dost technické věci, tak za mě ten přišel v roce 1997, kdy vlastně bylo Deep Blue, což je algoritmus, machine learning algoritmus, který vlastně porazil Garryho Kasparova, Garryho Kasparova v šachách. Garry Kasparov to je jeden asi z nejznámějších hráčů, který v šachách kdy byl, nejsem úplně šachový jako veldmistr, takže nevím, jestli to jeho prvenství dneska platí, ale minimálně v té době, tak to byla prostě elita a ve chvíli, kdy umělá inteligence porazila Garryho Kasparova v šachách. Co už mimochodem predikovali, to bylo v tom roku na té konferenci, v roce 1956. Takže o nějaký 41 let později. Tak to bylo… O tom se psalo ve všech novinách a zkrátka o tom mluvil každej, protože to byla velká údálost.
Jindřich: Já bych určitě doporučil, tak existuje na to dokument, mám většinu pocit, že se není i na Netflixu, jmenuje se Game Over, tak to je krásný krásný název, ale přesně jako jak jsi říkal a Možná doplním není samozřejmě, takhle jako Garry Kasparov je všechno šechový velmístr, ale on všechny pravděpodobně nehraje, ale je obecně jako považovaný za nejlepšího hráče v historii. v tom právě v roce 1997, tak proti téhle tomu samotnému softwaru prohrál. On teda paradoxně prohrál, nebo možná taková zajímavost, to asi neúplně paradox, ale prohrál jako na několikátej pokus. Vlastně ten Deep Blue, ten algoritmus byl od Google a Google nejdřív přišel a šel Kasparov vyhrát. Přišel po druhý, Kasparov vyhrál. Zlepšovali ho pořád. Ale přesně, takže oni ho zlepšili a prakticky Garry Kasparov potom jednou prohlásil, že počítač není možné porazit, což se myslím, že v dnešní době už pravděpodobně platí vzhledem ke komplexitě
Filip: šachu. Důležité je tam vlastně zmínit, že šachy jsou úzce zaměřená disciplína. Máš tam sadu jasně ohrančených pravidel, máš jasně daný tohrací poletu, šachovnici. A mluvíme o takzvaného narrow AI, kdy to máš úzce zaměřené na ten jeden specifický úkol, a Deep Blue by si nemohl vzít a říct mu, vygeneruj mi odpověď na tu zprávu. To by nezvládlo. Nebo diagnostikuj mi tady tu nemoc. Zkrátka je to klasický Machine Learning Algorithmus, který jede takovým trošku jako Brute Force způsobem. Tomu se říká Brute Force, znamená, že vlastně hledáš všechny ty možnosti a zkoušíš, jak by ta partie mohla dopadnout. Jsou tam pak samozřejmě nějaké optimalizace, protože těch možností je extrémní množství, takže oni museli velmi chytře vybírat ty tahy, který dávají smysl a který rozvíje dál a který vedou do slepý uličky, ale i tak pořád oproti dnešní AI, tak je to pořád trošku jinej
Jindřich: přístup. Je tady vlastně ještě v praktický době AI, nebo tak jak to známe my, v našem slavném smyslu, tak ještě nejsme. A zase myslím, že je důležitý zmínit a to nejdůležitější tam je, že ten software jako takovej, tak on si sám simuloval veškerý ty cesty potenciální, kudy by mohl jít Takže ty jsi to nazval brute force, jasně, tak to bylo, ale on vždycky, když to hodně zjedonuším, tak ten samotný algoritmus zapřemýšlel tady nad x tisíce potenciálníma možnostmi, jaký tak bude následovat a jaký tak bude následovat potom a potom a z toho vybral ten nejoptimálnější. Ale k těm samotným milníkům, pokud bychom měli nějaký doplnit, tak v roce 2005 byla ta DARPA Grand Challenge a přesně o tým jsme tady mluvili v minulém dílu, protože to byla ta první výzva pro autonomní vozy. Tehdy, jestli si správně pamatuji, tak ona začala v roce 2004, ale tehdy ji žádný autonomní vůz nedokončil. Až potom v roce 2005 tak ji v té mohavské poušti už se strojený autonomní vůz dokončil. Ale každopádně do většího detailu, přesně tohletý Grand Challenge DARPA, tak jdeme víc v tom třináctém dílu o autonomních autech. Takže to
Filip: poručujeme se podívat, buď to bude odkaz dale v popisku, a když ne, tak to najdete na kanálu DeepLink Show, kde si rovnou můžete kliknout odebírat Nicméně, pojďme dál, přicházejí 90. léta, respektive něco kolem roku 2000, tam přichází internet. Jako doposud bylo spousta možností, jak aplikovat ten machine learning, ale byly to poměrně jako složitý domeny, nebo aspoň tak já to vnímám, že pokud to chceš aplikovat na řízení auta, pokud to chceš aplikovat na diagnostiku nemocí a dalších věcí, tak je to poměrně jako rizikový a musí se spolehnout na ty výsledky. Nicméně přišel internet a najednou přišla nutnost mít možnost nějakým způsobem klasifikovat ty výsledky na tom internetu, vyhledávat tam. Zrodil se i Google search. různý doporučovací algoritmy, kdy na jednou na internetu máš spoustu obsahu. I přesto, že v té době, nebo i v té době následující potom, ty dva tisíce až, nevím, dva tisíce osmnáct, až do posud, tak troufnu tvrdit, že spousta věcí na internetu skítá nějakou umělou inteligenci, ten primárně machine learning. jenom to prostě není vidět. Jakýkoliv doporučení vyhledávání na Google, když člověk něco vyhledá, tak je tam, vlastně dalo by se to definovat jako AI a nemyslím teď ty AI overviews, myslím fakt klasický vyhledávání. Recommendations dneska na Netflixu, Amazonu, YouTubeu, Taky. Prostě máš obrovský množství obsahu a ty musíš tomu divákovi personalizovat to, co on vidí na domovské stránce. To je taky obrovská challenge. Nebo různý spamový filtry, IT obecně, bezpečnost, tak tam se velmi používají machine learning, algoritmy, neuronové sítě a další věci. Takže vlastně byť… Dneska máme pocit, že je AI všude kolem nás, protože je tady ten AI hype, tak ale už AI je kolem nás dlouhou dobu, jenom je schovaná a my ji prostě nevidíme. Já tomu často říkám takovou jako invisible AI. Je tam, ale jako běžnej člověk si to prostě neuvědomuješ. No mnohdy nejen my,
Jindřich: ale asi celá řada populace tak často jako zaměňuje ty termíny, že jo, nebo jeden používá jako pro druhej a mnohdy to jde jako na tolik ruku v ruce, že ty vlastně přesně nedokážeš říct, kdy to přestala být jako statistika a kdy to začala být umělá inteligence, protože přece jenom všechno zatím jsou jenom obrovský nebo je zatím jenom obrovský množství matematických a statistických výpočtů a všechny tyto algoritmy někdo tehdy musel navrhnout a ty základní statistické modely, které zatím jsou, tak tehdy někdo musel počítat jenom s tužkou a kusem papíru, možná když se mu poštěstilo, tak obyčejnou kalkulečkou. Ale v dnešní době s tím složitým a komplexním výpočtům, tak vlastně říkáme do jisté míry umělá inteligence. No a určitě tady stojí za zmínku asi jméno Tomáš Mikolov. Myslím si, že drtivá většina lidí při největším z naší sociální bubleny tak toho člověka z toho určitě zná. A je to jednak z klíčových osobností asi největších jmén umělý inteligence a zpracování jazyka. České republice. Je to člověk, který působil Google ve Facebooku. A zajímavé je, na čem pracoval právě ve Facebooku. A to byl algoritmus takzvaný Word2Vec, který vlastně dělal to, že převáděl slova do takzvané vektorové podoby. Když to hodně si jednoduším, to tým jde, do jaké toho já rozumím, tak když se vezmu třeba král mínus muž plus žena rovná s královna. Takový je asi nejzákladnější příklad. Nicméně přesně k tomuto tomu se dostaneme za chvíli, protože to byl velký mylník pro Google překladač. To jsme zaregistrovali dost možná všichni, ale nepřímo. Každopádně v okamžik, kdy Google překvadač začal používat podobné modely nebo respektive podobné principe, tak ty výstupy začaly být na jednou level, ještě lepší do všech světových jazyků prakticky. Nicméně předbíhám. Pojďme tím možná ukončit tu naši pomyslnou druhou éru. Pojďme se pustit do třetí.
Filip: Třetí, pomyslná éra, tak je deep learning, což je podmnožená machine learningu, ale nastala ideální doba, kdy se sešly tři ingredience, data, výpočetní výkon a lepší algoritmy. vlastně vznikají neuronové sítě, pokud se nepletu. Takže najednou ty nepotřebuješ mít ten algoritmus… Nebo jinak, ty najednou můžeš nechat vytvořit ten algoritmus pomocí velkého množství dát. Jsou nějaké postupy, ale v principu se dá říct, že jsi schopnej vzít obrovské množství dát a natrénovat na tom tu neuronovou sítě, která pomocí VAH, což jsou řekněme, takové jednoduché matematické rovnice, které upravují ten výpočet, když prochází dota s tou neuronovou sítí, tak ty jsi schopnej váhy pomocí velkého množství trénovacích dat upravovat a na základě toho ti neuronová sítí dá nějaký výsledek. A ten výsledek může být binární jedna nula, nebo to může být nějaký range, případně nějaké takové výsledky. No a… Byla to revoluce v tom, kdy vlastně ty najednou nemusíš, nebo ty najednou můžeš si prostě jako velký množství dat a na základě toho nechat tvořit tady ty algoritmy a Mně třeba osobně to přijde až jako magie, kdy vlastně jako když se podíváš na tu neurónku, tak máš nějaký vstupy, máš nějaký výstupy a uprostřed máš ty jako jako vrstvy a v rámci těch vrstev tak máš spojení a máš tam ty jednotlivý neurony, což jsou vlastně ty funkce, co něco vypočítávají a je to vlastně jako zkombinování více nebo spousty malejch matematických výpočtů v kombinaci s nějakýma konstantama. To jsou ty váhy, které se upravujou. A jenom na základě tohodle, tak jsi schopnej predikovat to, co má být na tom výstupu, predikovat ty výsledky. Potom jsi schopnej do neurónky na vstupu dát nějaký data, které nikdy neviděla, on to tím projde, a dostaneš ten nějaký výstup, třeba odhad, jak moc je něco na obrázku. A to byla jedna ze zajímavých soutěží v roce 2012. Myslím, že se jmenovala AlexNet, kdy neurónová síť vyhrála soutěž nějakým rozpoznáváním obrázku. A… To už je jako docela dávno, od roku 2000, ale zároveň je to 14 let od dneška, tak už v té době byly různé neurónky, které byly schopný rozpoznávat třeba nějaké zvířatané obrázku nebo nějaké
Jindřich: objekty. Jako ten algoritmický výpočetní výkon, tak opravdu roste exponenciálně. S tímhletím vlastně i velmi úspěšně spojený ten Moorův zákon, který říká, že každý dva roky se násový počet transistorů v procesoru. Tím pádem exponenciálně roste výpočetní výkon. My to tady samozřejmě hodně zjednodušujeme a hodně to popisujeme tak, jak to my rozumíme. My říkáme, že je to jako velmi složitá tematika, když je někdo expert. na neuronové sítě, tak netočí podkasty. Ale samozřejmě je to extrémně zajímavé. My jsme tady přesně kolem toho roku 2010 a tam přesně ty tři ingredience, které ty jsi zmiňoval. My máme ty inženýry, které udělali ty výborné algoritmy. Do toho máme už spoustu dát, které stají z sociálních sítí, z telefonů a lidi zkrátka každej den tvoří obrovský množství dát. Do toho tady máme i ten samotný výpočetní výkon, to GPU. Takže tohle byl právě okamžik, kdy… Vlastně co tím chci říct, že zkrátka tato doba byl zlatý důl pro Nvidia a pro Google a přesně pro tyto společnosti, které buď mají data, nebo mají ten výpočetní výkon, který je právě potřeba pro tyto neuronové sítě. Co tam je dobrý zmínit,
Filip: tak to, že mají ty data, umožnil rozvmah internetu, telefonu, zkrátka takového toho, myslím, že se tomu říká web 2.0. Doufám, že to nepletu webem 3.0, myslím, že to je web 2.0. Web 1.0 byl takovýto klasický statický HTML, a web 2.0 bylo, kdy ty vlastně nahráváš aktivně obsah na ten internet a Jako předtím, než byly mobilní telefony, sociální sítě a podobný, tak jako jak si vytvořil databázy třeba fotek jako psu? To musel být strašně složitý, že jo? Musel si sbírat ty fotky, fotit je, obcházet lidi, ale ve chvíli, kdy prostě přišel Facebook nebo samozřejmě jako spousta dalších platform, tak nejednou lidi začaly odevzdávat tady ty svoje data tak nějak dobrovolně. A ty nejednou si měl obrovské množství dat. No a proto třeba business model Facebooku, a nejenom Facebooku, ale podobných společností, nebo třeba Google, který je jeden z vedoucích labů nebo firm, který i dnes dominují v tom AI, tak může víc, protože má extrémní množství dat, ke kterýmu má přístup, může je použít. A… Zase sešly se věci, které dávaly smysl. Nebylo to jen o algoritmech, nebylo to jen o principech, ale krásně to zapadlo do té doby, kdy se najednou začalo generovat násobně víc data, než to, kdy bylo historicky možné. Mimochodem, tady ta křivka, já si nepamatuju přesné čísla, ale to, co my dnes generujeme za data, to jde exponenciálně nahoru. To množství je úplně šílené.
Jindřich: Zároveň s tím samozřejmě je fajn, že postupuje taky technologie v těch datových úložištích a vůbec jak cena těch datových úložiští radikálně klesá, jinak samozřejmě by nebylo možné tohleto někde skladovat. Ale ještě k té datové náročnosti, tak ty jsi mluvil tady o tom, o tý AlexNet Challenge, což vlastně byla ta neuronová síť, která vyhrála tu soutěž rozpoznání obrázku. A samozřejmě ten neuronová cícko samotná, tak ta se musela taky na něčem trénovat. Takže tam muselo i na vstupu být nějaký obrázek, nějaké labelování a popis toho, co na tom obrázku je. Tak ten samotný AlexNet byl trénovánej na více jak 14 milionů anotovaných obrázků. Takže typicky pro zjednodušení obrázek psa a vedle toho titule pes. Například. Samozřejmě bylo to asi mnohem složitější. Ale ostatně jako těch větších a důležitějších omilníků tady byla celá řada během těchto těch řekněme nějakých roku 2010 až nějakých 2017 například. Ale pokud bych měl nějaké věci vypíchnout, tak to byl rok 2016. A k těm vlastně algoritmům z AlphaGo, tak vyhrála člověk jménem Lee Sedol, se jmenuje, a to byl zase mistr ve hře Go. To je taková ta mříška, tuším, 19x19 s těmi bílejmi a černými kamenemi. Obecně ta hra je exponenciálně složitější než šachy a můžeš tam mít víc pozic těch jednotlivých kamenů na té herní desce, než je atomů ve známě ve smíru. Takže tady to je Poláka. obecně extrémně složitý jako výpočetní model zatím. Stejně tak, jak my jsme tady v roce 1997 se bavili o vítězství algoritmu Deep Blue v šachu, tak v roce 2016, prakticky 20 let později, tak právě ten algoritmus AlphaGo vyhrál poráží už toho velmistra. ve hře Go. A mimochodem zase tady dáme referenci na dokument na Netflixu a ten má na ČSFD, to je snad 90% nebo 86%, něco takového, produhodně. A přesně tam rozjebírají tento okamžik a je tam nahlídnutí do té technické části tohoto algoritmu a obecně to považováno za obrovský milník právě v té éře deep learningu.
Filip: To je důležité si říct. Já jsem tu hru nikdy nehrál, ale když jsem se o ní četl a koukal jsem na ten dokument, tak ona je násobně těžší než šachy. Těch možností, které ty můžeš v tom tahu udělat, je mnohem víc. A tím pádem to roste exponenciálně, protože to nemáš jenom, že máš třeba pětkrát víc možností, ale z každé možnosti máš delších pětkrát víc možností a tím pádem ta množina tahů, které musíš simulovat, úplně řádově, ale fakt řádově jako jinde. Takže proto to bylo takhle zajímavé. No a pak, co bylo taky zajímavé, tak oni, pokud se nepletu, tak tady to učili na partiích, které už byly odehrané lidma. A rok později ten AlphaGo pak, nebo jinak, AlphaZero se to jmenovalo, tak to nechali, ten algoritmus, pochopit tu hru a naučit se jí sám. to znamená bez těch vzorových dat těch lidských partií, to znamená, že ten algoritmus měl jenom ty pravidla a byl schopnej hrát sám proti sobě a na tom si vybudovat vlastně tu znalost těch různých tahů, nebo že nepotřeboval zkrátka ty lidské vzory, jaký tahy jsou třeba dobrý a jaký ne. Nicméně, pojďme se posunout k tomu, co vlastně známe dneska nejvíc, a to je ta generativní AI. A co je extrémně zajímavé, tak ta první vlaštovka té generativní AI, kterou máme dneska a která je tak extrémně populární, myslím ty textový transformery, tak je paper, který vydal Google v roce 2017 a ten se jmenuje Attention is all you need. a to je paper, který v tu dobu byl jako zajímavý, ale některé jako nerezonoval tou komunitou, ale co je zajímavý, tak tenhle ten paper definuje tu architekturu tzv. transformerů, na kterých jsou postaveny dnešní jazykový modely. s různými modifikacemi a vylepšeními, tak tuto architekturu používají dodnes. Vznikají teď i nové, ale je zajímavé, že v roce 2017 už ten algoritmus vyšel, ale trvalo nějakých… Kolik to bylo? Čtyři, pět let, než to udělalo díru do světa. Začaly vzniknout první modely, které s tímhle pracovali, ale než se to dostalo do funkční podoby, tak to trvalo ještě dalších několik let.
Jindřich: Pro zjednodušení je důležitý pochopit, když dnešně vůbec přišel ten přístup, který představil ta vědecká studie, tak obecně, když byl nějaký třeba textový řetěz, tak ten algoritmus začal zleva do prava. Což logicky, čím delší text, nebo čím obsáhlejší ten text, tak větší kontext, mnohem náročnější na výpočetní výkon na paměť primárně. A nebylo to škalové, nebylo to utržitelné. Zatímco ten nový, ten revoluční přístup, tak ten spočíval v tom, že ten algoritmus si načetl celý ten text a sám usoudil, co pro ně je důležitější. Takže potom vynechal to jistý míry ty slova třeba, které důležité pro ně nejsou, nebo nejsou důležité pro tu volbu, kterou má splnit, nejsou důležité pro ten samotný kontext a dokázal ten text pochopit vlastně jako celek, nežže by ho zpracovával zleva do prava. On je ve skutečnosti velmi složitě představitelný pro nás jako pro lidi, protože my jsme zvyklí šířit zleva do prava. My nemůžeme vlastně si vzít úplně všechno na jednou v jeden okamžik a pak si z toho vyzoba to nejdůležitější. Takže možná i tohle byl ten důvod, proč, jak jsi zmínil, v té komunitě ten algoritm zase tak nerezanoval. Byl velmi
Filip: složitý na pochopení. No hlavně, já si myslím, že pro lidi, co se tím zabývají, tak pro ně to jako smysl dává, ale přiznám se, že já jsem se ten algoritm snažil několikrát pochopit a být jako hodně obecně tak nějak rozumím, jak to funguje, ale dohloubky bych to nikomu nedokázal vysvětlit. Když pak se podíváš na ty modely, které jsou dneska, tak těch vrstev, těch attention vrstev, tam je celá řada a je tam mnohem víc těch mechanismů. Takže je to komplikovaná věc. Takže nicméně už tu dobu se položili základy a na něj začaly navazovat pak další algoritmy. Přednám se, že teďka jsi nejsem jistý, máme tam v roce 2018 přišel od Google Bert. Mně teďka vypadlo, co to bylo. Můžeš to rozvést?
Jindřich: Algoritmus pro zpracování natural language processing, takže přesně proto, že zpracoval zkrátka nějaký text a pochopil z toho ten význam. Už se to souvisí s tím paperem, kterým jsme se bavili a to byl přesně ten algoritmus pro zpracování kontextu. Yes, no a
Filip: pak přichází, to už tak nějak asi nikoho nepřekvapí, OpenAI a GPT-1. Ale v tu dobu tak o tom ještě nikdo nevěděl a přiznam se, já jsem taky netušil o firmě OpenAI a modelu GPT-1, protože měl na dnešní dobu vlastně směšných 117 milionů parametrů. Což je jako extrémně
Jindřich: málo, že? On je takhle důležitý zmínit, že tato GPT jednačně nebylo veřejný, takže ono vlastně se o něm bavilo jenom v těch komunitách, přesně tak byly research články jenom pro nadšence prakticky, takže ty jako o tom věděli, ty asi věděli i o OpenAI, ale každopádně jak jsi zmínil rok 2018 a prakticky až teď i vlastně když se podíváme na tu délku našeho podcastu 52. minutě a vlastně až teď se dostáváme do té ery dnešního AI, dnešní umílí inteligence, tak jak my jí známe. Takže opravdu I toto to nám krásně ilustruje, jak dlouhá historie byla proto, abysme vůbec se mohli dostat, abysme historicky si mohli do toho kontextu správně zasadit ten okamžik, kdy vzniká ta generativní uměla inteligence tak vlastně,
Filip: jak jí známe nyní. Generativní AI, tak to je vlastně čtvrtá naše éra, tu, kterou už věrně všichni dobře dneska známe. Ta definice je vlastně jako relativně jednoduchá. Předchozí Machine Learning algoritmy, tak všechno, co jsme si řekli, tak byla nějaká klasifikace, nějaká predikce, hodnocení. Nic novýho se vlastně netvořilo. Jasně, dalo by se argumentovat třeba u hry šach, že vlastně se jako tvořil ten novej tah, ale ve výsledku pořád to byla nějaká klasifikace, kde si jako predikoval, který tah je pro tebe nejvýhodnější, no ale přichází teďka ta éra té generativní umílí inteligence, kdy vlastně se tvoří novej obsah, generuje se text, generují se obrázky, generuje se hudba, generuje se prakticky dneska jako cokoliv, video, audio. A tato éra odstartovala právě tím paperem Attention is all you need v roce 2017, kdy přicházely tady ty modely. První byla GPT-1, to už jsme si říkali. Za rok později přišlo v únoru 2019 GPT-2. ta už měla 1,5 bilionu respektive miliard parametrů, ale značí se to byl, to je mimochodem takovej úplně hloupej fakt jako v českým jazyce, že v angličtině je miliarda bilion a v česktině bilion je pak trilion anglicky a já to vždycky pletu a už mě jako spousta lidí nachytalo, že řeknu, že tenhle model má 1,5 bilionu parametrů. No to není pravda, je to miliard, tak jenom tak jako upřesně jako je fun fact a je dost možný, že to řeknu ještě někdy špatně. Nicméně, co mě přišlo jako extrémně zajímavé, tak už v tom únoru 2019, tak OpenAI nechtělo tady ten model zveřejnit, protože tvrdili, že je příliš nebezpečný. To mi přijde jako, když si vezmeš, jestli jsi zkoušel nějaký modely, který mají těch 1,5 miliardy parametrů, tak oni jako nejsou moc schopný. Ale Kápu, že v porovnání s dnešníma agentama je to usměvné, ale v té době to bylo fascinující, že něco ti dokáže odpovídat, dokáže to predikovat, ten následující text atd. Takže to mě překvapilo, že už v té době se výzkumníkom to zdálo trošku nebezpečné.
Jindřich: Já si myslím, že my úplně stejně potom v tom historickém kontextu po nějakým čase budeme podobnou optikou koukat třeba na ten Mythos, který taky teď říkali, že je příliš nebezpečný, odhaluje tady 490 nebo kolik potenciálních softwarech zranitelnosti ve Firefoxu a tak dále. Takže ta doba je fascinující a vlastně od toho roku 2016, tak ta rychlost toho technologického pokroku je naprosto neskutečná. Možná pro doplnění tak se asi sluší říci, že v roce 2021 vzniká Anthropic. Daria a Danielu Amodei odcházejí z OpenAI a zakládají společnost Anthropic, čímž vlastně vzniká konkurentní společnost pro OpenAI. My jsme tady obecně ten příběh společnosti Anthropic už v našem předchozím dílu mapovali, takže pokud by to někoho zajímalo, do většího detailu, obecně historii Anthropicu, tak se podívejte na náš předchozí díl. V 2021. vznikají i generátory obrázků, text to image, dálí, například v roce 2022 vzniká dálí 2. ale tam vznikají i diffusion modely pro generování obrázků jako například stable diffusion a tak podobně. Rok 2022 se stává symbolickým rokem, kdy se to generování obrázků dostává do komerční sféry. Já si myslím, že to možná byl i rok, kdy já jsem s ním přišel do styku. Teď se člověk musel instorovat Discord, přidat se na ten server, dobít si ty kredity, napsat si tam ten svůj vlastní prompt, pak několik minut čekat, než dostal nějaký takový OK, jaksi něco vygenerovanýho. Ale bylo to fascinující. Zase tam byl vidět ten extrémní technologický pokrok. Ty si napsal, co chceš a najednou jsi to dostal. Nemusel ti to nikdo malovat. A tak zkrátka to byla extrémně zajímavá doba. Znovu opakuju, my vlastně nejsme zastarali jako historie. My jsme čtyři roky zpátky. A ty nástroje, které máme teď, tak jsou zase nebe a dudy, absolutně nepodobatelné to, co jsme měli tenkrát a nepřestane mě to fascinovat. Je to zkrátka krásný a žijeme ve fascinící době. Bez
Filip: pochyby. Člověku až zůstává rozum stát, co je dnes možný. Zmíně v této době, myslím si, že to bylo ještě před GPT momentem, tak vyšel za mě fascinující algoritmus, což byl Alpha Fold dvojka. Bytě je to strašně technický a snažil jsem se několikrát pochopit, co přesně to dělá, ale zkrátka spočívá to v tom, že v biologii Biologii a medicíně je jeden z velkých problémů skládání proteínů, což vlastně řeší, že máš ty aminokyseliny a teď oni v tom 3D prostoru se můžou natočit do různých tvarů a to určuje jejich funkci, nebo jestli vůbec fungují a co mají plnit za účel. No a vždycky tady to vypočítat, to skládání bylo strašně komplikované a proto to zabralo měsíce, než se nějaká ta pozice spočítala. A pak přišel ten algoritmus AlphaFold2 a rázem během chvíle, v porovnání s těmi měsícemi, spočítal skoro všechny možné varianty. A to je nějakých 200 milionů struktur, což je fakt fascinující. Ale proč jsem se k tomu dostal, nebo jak jsem se od toho dozvěděl, tak Denis Hassabis a jeho kolega Jumper dostali nobelovou cenu za chymy. v roce 2024. Právě na základě toho algoritmu. A Denis Hassabis, tak doporučuji mimochodem s ním různé rozhovory, tak je CEO DeepMindu, což je právě AI divize od Google. Takže velmi zajímavý člověk. Takže rozhodně doporučuji nějaké rozhovory s ním. Strašně zajímavý. No ale pojďme se posunout k tomu GPT momentu. 30. listopad 2022. GPT 3.5. za pět dní byli schopni nabrat milion uživatelů a za dva měsíce 100 milionů uživatelů. Jako takovouhle křivku neměl žádný program, žádná aplikace, nic prostě v historii. Zkrátka ta uživatelská základna vyrostla tak rychle, že myslím si, že i je to překvapilo. A změnilo se to, že najednou Aspoň z mého pohledu, ten největší moment byl, že najednou ty si mohl šáhnout na tu AI. Už to nebylo někde schované za rozhraním, že ti to doporučovalo, ty filmy, výsledky a další věci, ale najednou ty si mohl něco zadat a dostal jsi odpověď, dostal jsi ten výsledek v textový formě. A já si vzpomínám, když jsem to zkoušel poprvé, tak jsem si řekl, wow. To je hustý, že jo? Zkoušeli jsme různý věci. Člověk tomu posílal články, ať mu to zhrne, a ono to nešlo, protože to nemělo přístup na internet. Teď si to vymyslelo, ty fakta, ale někdy se to trefilo, tak si říkal, tak to umí, neumí. Bylo to strašně zajímavé, když si to člověk zkoušel. Z dnešního pohledu to bylo strašně hloupý, ale v tu dobu fakt nezapomenu na to, když to vyšlo a zkoušel jsem to, tak jsem z toho byl fakt unešený.
Jindřich: Ty adopci uživatelů, tak shodou okolostí, já jsem viděl nějakou vizualizaci dneska ráno. A tam přesně bylo takovéto porovnání, že jak dlouho trvalo jednotlivým technologiím, než získali 10 milionů uživatelů. Takže tam byly aerolinky, na hře to bylo nějakých 68 let nebo tak nějakého, přesně si nespomínáme takovéto číslo. Pak tam byly telefony, to bylo třeba nějakých 40 let, ale takhle to postupně klesalo přes internet, YouTube, co si vzpomínám, tak tam byly 4 roky. A potom tam byl nejrychlejší, že asi TikTok to nebo NTD nebo jak dlouho a přesně jako GPT pak jako jednotky dnů. Jasně, samozřejmě ten software se škáluje mnohem snadněji než například aerolinky, ale ta doba, jak se zrychlila, tak to je fascinující. K doplnění ještě možná sluší do 2023 a přichází čet GPD+, jedinými slovy 20 dolarů, subscription a můžeš zvesela mít své vlastní AI, svého vlastního assistenta. A společně s tím tak přichází tzv. závod těch komerčních modelů. Když to jako jenom rychle schrdene, co koukám tady do poznámek, tak 2023, 14. března, tak přichází 4x4, který už je multimodální a má lepší reasoning. Stejně tak březnu 2023 přichází Claude a koncem roku přichází Gemini. od Google samozřejmě. Do 2024 tak se sluší asi zbídnit, že přichází v březnu Claude 3 Family, respektive ty jejich modely jednotlivých velikostí, Haiku, Sonnet a Opus. V 2024 ten zase přichází GPT-4O až po celou řadu dalších věcí, ale možná v řejnu 2024, taky stojí za zmínku Computer Use, který měl Claude 3.5 Sonnet. Jinými slovy, ty zase tomu AI modelu prakticky můžeš svěřit svůj vlastní počítač, aby ho ovládal, aby se učilo ovládat. A jsou to samozřejmě začátky. Takže i s tímhle tím, kterým se dokážeme v dohledný době velmi pravděpodobně dostat, vyhradně dál. No a koncem roku tak se dostáváme k dalšímu logickému vyústění veškerých těchto historických milníků a tím je možnost generování videa a přichází SORA od OpenAI.
Filip: Potom přichází za mě obrovské eventy nebo údávosti v roce 2025, kdy v lednu 2025, což je rok a kousek zpátky, byl takzvaný deep-seek moment. Čína předsala deep-seek R1, což byl takový první reasoning model, který byl open weight, který si mohl stáhnout a provozovat nenutně u sebe na počítači, to by člověk úplně nerozjel, na nějakém serveru. Zkrátka nemusel z toho volat přes API, kde platíš za tokeny. Dobrý… Já bych možná ještě řekl k těm reasoning modelům. Ty už jste na kous. Ale ten reasoning za mě byl extrémní posun, kdy předtím ty modely nebyly moc dobré na logické úlohy, ale když přišel ten reasoning, tak mimochodem ten reasoning vzniknul tak, že ještě před reasoningem stačilo tomu modelu říct, že přemýšlej nahlas nebo krok po kroku, A najednou se ty odpovědi na logické otázky toho modelu mnohem víc zlepšovaly, protože ten model si vygeneroval víc tokenů, na základě kterých on pak přemýšlel, protože ten attention mechanism dělá to, že on se vygeneruje novej token, teď se to celé vezme, ten model se na to podívá a ty myšlenky nebo ty tokeny, co si generuje v té odpovědi mu pomáhají. v tom zlepšit tu predikci toho následujícího slova, že to tak řekneme. No a ten reasoning není nic jiného, než že se ten proces zapekl do těch modelů, že to dělají v základu, by default. A zkrátka to se můžete si všimnout, pokud to třeba nepozorujete, když si napíšete teďka asi prakticky s jakýmkoliv včetovacím asistencem, tak jsou tam takové malé konverzace, které jsou schovávané a když se je rozkliknete, tak tam je vidět ten vnitřní monolog těch modelů. No a právě DeepSeek byl první reasoning model, který byl takhle open-weight, což znamená, že ty se můžeš provozovat, ale není open-source. Ten rozdíl tady je jako zajímavý, kdy open-source model znamená ten, že ty máš k dispozici přesně ty trénovací postupy. Víš, na jakých datech to bylo trénované a jsi schopnej replikovat to vytvoření toho modelu od začátku. Open weight znamená, že ty nejseš schopnej to replikovat, ale máš k dispozici ten model, ty výsledný váhy, tu síť a můžeš si ji někam nasadit a můžeš s ní pak jako pracovat. No. Nicméně pak přicházejí delší modely, když to pro lítem před těch release je tam fakt jako spoustu. V únoru 2025 tak přichází slavnej Claude 3.7 Sonnet, který měl pokročilejší tady ten reasoning. V květnu, což jsou dva měsíce potom, přichází Claude 4 a zároveň představuje Anthropic i svůj novej model Opus. Potom v srpnu 2025 je GPT 5, tam zase v GPT 5 se pokud se nepletu, tak tam byly ty různé úrovně toho přemýšlení, kdy ten model byl schopnej vlastně vybírat, jak hodně má nad tím daným úkolem přemýšlet. Sonnet 4.5 hnedka v září 2025 v listopadu Opus 4.5, což za mě i byl jako obrovský milník, který vlastně jako začal definovat ten agentic engineering. Vlastně celý podzim minulýho roku tak se nesl v duchu těch AI agentů a to bylo primárně vlastně tím modelem i Sonnet 4.5., ale hlavně tím OPUS 4.5. A to nejednou se dostáváme do úplně jiné sféry. Už se nebavíme o četovacích asistentech, ale o těch pravých AI agentech, kteří jsou schopni vykonat takové velmi pokročilé úkoly. No a teď už se dostáváme skoro do současnosti v únoru v roce 2026. Takže v tomhle roce vyšel Claude Opus 4.6., který měl milion tokenů, kontextový okno, což Jako u takhle silnýho modelu bylo dobrý nebo zajímavý milion kontextový okno už předtím měl třeba Gemini x měsíců naspět. No a. Teď už to jde taky strašně rychle. Únor, duben, GPT 5.3, 5.4, 5.5. Jsou skoro týdny, kdy se vydávají nové věci. Microsoft přichází s Copilotem, kdy má integrovanýho clouda v sobě. Mezi tím vznikly nástroje, to už bylo před rokem, ale začaly být populární nástroje jako Cloud Code, Claude Code. Zkrátka, najednou mi přijde, že se to přesouvá od těch modelů, který jsou pořád extrémně důležitý, tak hodně k tomu toolingu vokolo, aby jsme z těch modelů dokázali vyžijímat co nejvíc.
Jindřich: Vlastně ten závod tu umělou inteligenci je naprosto neskutečný. Když my si vezmeme jenom tu velkou trojku, Google, OpenAI, Anthropic, XAI, když tomu například přidáme a nebo i tu Čínu, tak jako ta kadence těch novinek, nových modelů, úprav, nových nástrojů opravdu neskutečná, takže to, co my jsme tady jenom prolétli, tak je do jistý míry jenom kapka v moři. Teď to jsou asi takový ty největší údálosti, které se staly, nebo ty největší release, které byly a zase do většího detailu jsme to probírali v epizodě o Anthropicu, mimo jiné. Ale co já si myslím, že se sluší ještě to možná trošičku kosumarizovat, když si porovnáme to, co máme dnes oproti tomu, co jsme měli v listopadu 2022, nebo to, co jsme neměli ještě v listopadu 2022. Tak jinak jsou to reasoning modely a přesně to o čem jsem mluvil, takže nějakej vnitřní monolog vlastně toho modelu. Máme multimodality, tudíž můžeme využívat jak text, tak obraz, video, audio. Máme agenti pro různé autonomní úkoly, nejen ten četovací asistent, ale přesně Claude a to bude GPT agent a podobně. Cena tokenů extrémně padá. Když porovnám GPT-3, tak dnešku to máme o 99% levnější, což je šílený porovnání. Roste kontextový okno. Měli jsme nějakých 8 tisíc, pak jsme měli 200 tisíc a teď jsme nějakých milionů například. – To dokonce
Filip: je dvou milionový už dneska. dokonce, tak
Jindřich: se dostaneme. Samozřejmě obrovský závod je i tady o ty open source, nebo respektive o ty open weight modely, takže například Lama, DeepSeek nebo Mistral. No a v neposlední řadě, tak ať tady nemluvíme jenom o těch samotných modelech, tak máme celý ten tooling okolo, ať už je to Google Workspace nebo Microsoft 365, které jsou skutečně skrz na skrz pro špikování různýma AI funkcema, tak pak máme celou řadu, obrovské množství dedikovaných AI nástrojů pro konkrétní využití nebo pro konkrétní use cases, za kterýma jsou schovaný zase nějaké modely, které jsme zmínili, ale tam asi nemáme se vůbec chodit, protože ty opravdu rostou jak houby po dešti a to bychom mohli vidět ještě dlouho.
Filip: Těch tématů je spousta. Teď se můžeme začít bavit o tom, co je to Artificial General Intelligence, AGI. To je taky slyšet od různých CEO z velkých společností. Tak jenom, když to tak prolítnu, tak o čem jsme se bavili předtím, tak to byla takzvaná Artificial Narrow Intelligence, kdy máš úzce zaměřený ten scope na jeden problém, kdy ta umělá inteligence je skvělá v hraní šachu, ale nedokáže ti udělat něco jiného, nedokáže ti třeba predikovat diagnozu nebo napsat e-mail. Pak máš Artificial General Intelligence, to je to, kde se polemizuje, jsme tam, nejsme tam, budeme tam, podle mě se nikdo neschodne, ale zkrátka Artificial General Intelligence je vlastně jako definice AI, která dokáže to samé, co vlastně průměrný člověk, co normální člověk a dokáže to v jakýkoliv kognitivní úloze napříč různýma oborama, To znamená, že je flexibilní a univerzální. Mně třeba tady z té definice přijde, že už tam dneska jsme. Byť nějaké otázky nebo domény ty modely nezvládají, ale je to taková… Je podle mě strašně těžké to definovat, protože těch definic je spousta. A ten zásadní problém, který já s tím mám, je, že i spousta průměrných lidí ani zdaleka nešlapou na paty umělé inteligence v trtivých většině oblastích. Samozřejmě jsou pak nějaký malý uskysi, kdy třeba mají takový ten common sense, ale těžce se to definuje, takže pořád se o AGI píše, někdo tvrdí, že už jsme dávno za, někdo, že tam teprve jdeme, jestli tam vůbec dojdem. Zkrátka, já si myslím, že my spíš v budoucnu se podíváme do history a řekneme si, jo, tyjo, někde přelom 25, 26, možná 27, tak třeba tam začala vznikat ta AGI, ale my to z našeho pohledu asi nebudeme schopný úplně roseknout, protože pořád člověk bude hledat nebo spochybnovat nějaké ty body a vždycky tam budou nějaké ale. Takže spíš si myslím, že to budeme schopný posoudit až zpětně. No a pak taková výhled do budoucna, tak je Artificial Superintelligence, což je inteligence, která je diametralně chytřejší než člověk. ve všech doménách, které existují, a… Zkrátka, nemá konkurenci. Tam se můžeme jenom domnívat, co by něco takového znamenalo, protože žádný člověk by s ní nebyl schopný držet krok. Samozřejmě uměla inteligence by dokázala vylepšovat sama sebe. Procesory, čipy, na kterých běží algoritmy, atd. A to už je na jiný díl, kdybychom si mohli zafilosofovat, kam to celé může dojít. Ale zkrátka to jsou takové základní pojmy, se kterými se dnes operuje. Takže je fajn o tom třeba trošku tušit.
Jindřich: To je důležité si uvědomit, že přesně to, co jsi zmínil, ta AGI nebo ASI a podobně, tak to není žádná konkrétní technologie, žádný konkrétní algoritmus. Je to spíš paradigma, který, jak jsi zmínil, my asi nedokážeme říct, že ok, bylo to včera, nebo bylo to tady 15. května. nebo kdykoliv ale zkrátka potom jako s postupem času až řekněme odborná komunita a věci se shodnou na tom že bude, že je nastala doba AGI nebo že už jsme za ní tak pak možná zpětně to to uvidíme. Ale rozhodně to nebude tak že se jednou ráno probudíme a přečteme si v novinách že tady AGI protože není to úplně tak jak by to Nebo zkrátka takhle to není. Takže to jediné, co my můžeme dělat je počkat, mít nějaký svůj vlastní názor a až se odborná komunita shodne, tak potom nějakou dobu, nějaký rok, nějaké třeba rozpětí let, tak považovat za vznik AGI, ale to všechno uvidíme až potom so vstupem času. Standardně Filipe, jako vždycky, velmi zajímavý díl. Díky za tvůj vlet, je to neskutečný, zase se cítím obohacenej a doufám, že stejně tak se cítí i naši posluchači. Bylo to extrémně
Filip: zajímavé. Při tom, kdy jsem se spoustu nových věcí dozvěděl. Je to zajímavé. 70 let, čtyři takové éry, dvě AI zimy, kdy se nic moc nedělo. Takový hype cyklus. Jsem zvědavý, jestli bude už teď jenom AI a bude to růst do nekonečná, nebo nás čeká třeba nějaká další AI winter. Ale… O čem není pochyb, je, že umělá inteligence mění, změnila a bude měnit naše fungování extrémním způsobem. A byť to třeba… Myslím si, že to vidíme všichni, ale pokud to někteří třeba nevnímají tolik, tak je to podle mě nevyhnutelné a ten dopad té technologie bude extrémní. Takže… Za mě extrémně zajímavá doba, v které žijem, a jsem strašně rád, že jsme v ní a můžeme dělat to, co děláme, můžeme si o tom povídat. Je to strašně zajímavé.
Jindřich: S tím souhlasujeme, je tady krásně vidět v těch historických konsekvencích, kterými jsme zmínili, jak ty hype cykly okolo těch technologií a nejen okolem umělé inteligence, tak se opakují. Ale to, co se vlastně neopakuje, nebo to, co přichází najednou pak jako strašně rychle, tak jsou ty samotné schopnosti. Takže my najednou, jak jsme zmínili, kontextové okno a výpočetí výkona a podobně, tak tam je vždycky ta radikální změna. Ale vždycky je to jenom za předpokladu, že se sejdou ty ingredience. Stejně tak, jako se sešly ty tři, který my jsme tady zmiňovali, tak to všechno dalo základ tomu. správný ingredience, dali základ tomu, že vůbec něco jako umělá inteligence, něco jako neurónový sítí a mešený modeli a podobně, tak mohly vzniknout. Ale to už zas možná zacházím do trochu jiného tématu. Jak jsi zmínil, Filipe, bylo to super a těším se na další díly. Taky
Filip: měj se krásně, Jindro. Zdravím i naše posluchače. Dejte nám vědět do komentářů, jestli jsme třeba nějaké zajímavé okamžiky vynechali, co by jsme měli my nebo i ostatní posluchači určitě vědět. A budem se na vás těšit u další epizody, takže nezapomeňte DeepLink Show odebírat, jak na Spotify, YouTube. nebo dalších podcastových platformách, ať vám další díly neuniknou, protože nechystáme díly jen s námi, ale chystáme díly i s hosty. A můžete třeba už teď na YouTube najít rozhovor s Jirkou Štěpánkem, což je CEO AI startupu, do kterého zainvestoval i Mython a kde nasazují AI agenty pro obohacování e-shopových feedů a obecně Jirková cesta podnikatele a jak se dostal ke AI je strašně zajímavá, takže doporučuji. tady tu epizodu. Myslím, drou, bychom si s Jirkou vydrželi povídat klidně pět hodin, jenom jsme se ten díl snažili udržet v rozumných mezích, takže myslím, že má kolik hodinu? Čtyřicet pět. Ale určitě, jako za mě, rozhodně dobrý si poslechnul. Takže tak. Díky, že jste nás poslouchali a budeme se těšit na vás příště. Díky, čau.