Je umělá inteligence jen opakujícím papouškem?

14. 11. 2023

V debatách ohledně umělé inteligence hojně zaznívá argument, že současné velké jazykové modely neoriginálně skládají naučené kousky textů na základě pravděpodobností. Ale je tomu tak?

Názor z perexu poněkud opomíjí fakt, že současná AI je z větší části založená na principech, které se uplatňují také v našich mozcích – takže pokud o ní uvažujeme jako o stochastickém papouškovi, platilo by víceméně totéž i o našem vlastním uvažování.

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

V čem je tedy současná umělá inteligence (AI) odlišná od našich a zvířecích mozků? Hlavní rozdíl spočívá v tom, že AI „běží“ na tradiční výpočetní infrastruktuře sestávající z křemíkových čipů a počítačových programů, kdežto přírodní nervové soustavy jsou tvořeny mnoha druhy neuronů uspořádanými do komplexní sítě, jejíž činnost ovlivňují různé řídicí a regulační subsystémy (například více než stovka neurotransmiterů atd.). Nicméně samotná aplikační vrstva, tedy umělá neuronová síť (artificial neural network), už poměrně věrně napodobuje jak fungování jednotlivých biologických neuronů, tak do jisté míry i strukturu a funkcionalitu mozku.

Není proto překvapení, že historicky obor AI, tedy strojové učení a výzkum umělé inteligence, vycházel ze stejných poznatků jako neurovědy, mezi něž počítáme kognitivní vědu a neurobiologii. A snažil se také nalézat odpovědi na obdobné otázky: jak pracuje lidská paměť, jak vznikají schopnosti abstrakce nebo generalizace či samotné vědomí?

Teorie stochastického papouška

S pojmem stochastického papouška přišla v roce 2021 Emily Benderová se svými spolupracovnicemi v článku Nebezpeční stochastičtí papoušci: Jsou jazykové modely příliš velké? V něm se ve zkratce tvrdí, že jazykové modely nerozumějí jazyku, protože si nejsou schopné vytvořit model reálného světa jako lidé. Autorky se domnívají, že lidé disponují jedinečným chápáním jazyka, které je zprostředkováno naší jazykovou kompetencí a predispozicí k interpretaci lidské komunikace.

Podle nich tedy velké jazykové modely (large language models) jsou systémy, které chaoticky, jen na základě pravděpodobnosti, kombinují úryvky tréninkových textů, ovšem bez jejich skutečného pochopení – pro takový model pak razí označení „stochastický papoušek“. Stochastičtí papoušci pouze předvádějí řečové výstupy, které lidé chybně zaměňují za smysluplný jazykový projev, a jsou díky této iluzi „porozumění“ také schopní ošidit různé testy včetně proslulého Turingova.

Vše však nasvědčuje tomu, že se Benderová mýlí. Současná generativní AI už produkuje výstupy, které jsou k nerozeznání od těch lidských, ať už jde o texty, obrazy nebo hudbu. A umělé neuronové sítě obstojí v souboji s lidmi i v nejrůznějších benchmarkových testech měřících rozumové schopnosti nebo v testech vyhodnocujících způsobilost lidí pro výkon povolání. Umožňují jí to emergentní schopnosti jako schopnost vytvořit si vlastní reprezentaci světa, logické a analogické uvažování, abstraktní myšlení a zobecňování, jež jsou výsledkem škálování samotných sítí i souborů tréninkových dat.

Teorie stochastického papouška tedy sice správně upozorňuje na fakt, že ANN nedělají o moc více než „násobení matic“, ale současně opomíjí skutečnost, že mozek a jeho činnost lze také s přiměřenou mírou zjednodušení matematicky a statisticky modelovat – počínaje nejjednodušší přirozenou jednotkou neuronem a konče komplexními strukturami zodpovědnými za senzorické vjemy nebo paměť.

Podobnosti mozků a umělých sítí

Jaké jsou tedy podobnosti mezi přirozenými a umělými neuronovými sítěmi? Začněme na úrovni jednotlivých neuronů. Jak už samotná etymologie naznačuje, neuron umělých neuronových sítí byl přímo inspirován neuronem biologickým. Dnešní umělé neuronové sítě jsou také tvořeny neurony – matematickými modely zpracovávajícími vstupní signály, v nichž je síla synapsí vyjádřena parametry (váhami) – v matematickém vyjádření v nich dochází k transformaci vstupních vektorů na požadované vektory výstupní. V procesu jejich učení se pak postupuje tak, že se ze základního nastavení upravují vstupní váhy těchto neuronů.

První matematické modely imitující synapse a šíření elektrického signálu v biologických neuronech vznikly už ve čtyřicátých letech minulého století, mezi nimi McCulloch-Pittsův neuron z roku 1943, který popisoval excitační a inhibiční buzení v biologickém neuronu. V biologickém neuronu jsou to dendrity a axony, které přijímají a šíří vzruchy v centrální nebo periferní nervové soustavě, a toto základní schéma dodržují i umělé neuronové sítě, byť je v nich fungování neuronů zjednodušené.

Neurobiologií bylo inspirováno také Hebbovo pravidlo formulované v roce 1949, které umožnilo neuron učit změnou vah jeho vstupů, analogicky tomu, jak se učí živé organismy. V roce 1957 představil Rosenblatt umělou neuronovou síť perceptron, jejíž architektura si brala za vzor lidskou sítnici a byla schopná rozpoznávat znaky a následně signál dále přenášet.

I další pokroky v oblasti AI byly inspirovány poznatky neurověd o struktuře a činnosti zvířecích či lidských mozků, a neurovědy rovněž umožňují pokroky v AI validovat. Při modelování biologické struktury či kognitivních procesů totiž není vždy nutné jít do naprostých detailů, abychom funkčnost mozku v umělých sítích napodobili, a leckdy to kvůli odlišnosti křemíkových technologií od biologických tkání ani není možné.

Hluboké a zpětnovazební učení

Kromě jednoduchých sítí byl nejvýznamnějším posunem rozvoj metod hlubokého (deep) a zpětnovazebného učení (reinforcement learning) s dohledem i algoritmus zpětného šíření (backpropagation), které umožnily učení v sítích složených z několika vrstev, obdobně jako v mozku.

Na rozdíl od klasických počítačových programů založených na sériových logických operacích se symboly mozek zpracovává vstupní informace paralelně a stochasticky, což podnítilo badatele k formulaci myšlenky distribuované vektorové reprezentace slov i vět a vývoji konvolučních neurálních sítí (convolutional neural networks), které využívají postupy objevené při výzkumu primární zrakové mozkové kůry savců (oblast V1), jež má na starosti filtraci a zpracování zrakových vjemů. Tyto části mozků tedy typicky transformují vizuální informace ve složitější funkce, invariantní vůči transformacím typu otočení nebo změny osvětlení a měřítka, a umožňují tak přesné rozpoznávání objektů. Dalším milníkem byl již zmiňovaný objev zpětnovazebného učení, vycházejícího z výzkumů podmíněných reflexů a učení u zvířat.

Paměť a pozornost

Poznatky neurověd vedly dále k objevení algoritmů, které napodobují paměťové mechanismy, například epizodickou paměť a rychlé (one-shot) ukládání zkušeností, při němž hraje velkou úlohu součást velkého mozku hipokampus. Jednou z klíčových složek lidské inteligence je také pracovní paměť, jež pomáhá mozku ukládat informace a manipulovat s nimi.

Kognitivní vědy přišly s poznatkem, že při aktivaci pracovní paměti má mimořádnou roli prefrontální kůra a s ní spojené oblasti, což vedlo k vývoji rekurentních neuronových sítí (recurrent neural networks) a jejich podmnožiny s dlouhou krátkodobou pamětí (long-short-term memory), které mají potenciál udržovat informace po mnoho tisíc tréninkových cyklů, a proto jsou klíčové například pro porozumění významu textů v jazykových modelech.

Biologický mozek je strukturovaný a modulární a současné umělé neuronové sítě tento poznatek zohledňují ve funkci zvané pozornost (attention), která zajišťuje, že se pozornost při zpracování vstupů přesouvá mezi jednotlivými objekty a zaměřuje se na ty, jež jsou v daném okamžiku relevantní.

Selektivní pozornost, kdy sítě ignorují nepodstatné informace, velice zpřesnila klasifikaci objektů v obrazu a rovněž vedla ke snížení výpočetní náročnosti těchto úloh oproti předchozím metodám využívajícím jen RNN (LSTM). Dalším případem nasazení této funkce je strojový překlad, který se jejím zavedením rapidně zlepšil a zefektivnil. Další vylepšení mechanismu pozornosti pak přinesly transformery (transformers), jež už přímo vydláždily cestu současným úspěšným aplikacím, jako je ChatGPT, postaveným na architektuře generative pre-trained transformer.

Právě aplikace jako ChatGPT 4 evidentně disponují schopnostmi, které je přibližují lidským. Benderová ve svých úvahách pravděpodobně podcenila možnost vzniku těchto emergentních schopností ve velkých jazykových modelech – jejich objevení bylo ostatně překvapivé i pro jejich tvůrce, kteří je předem plně neanticipovali. Proto v případě, že bychom přijali tezi o tom, že umělé neuronové sítě jsou jen stochastickými papoušky, museli bychom se zákonitě ptát, zda jimi nejsou i lidé, protože současná AI je svojí strukturou i funkcionalitou jednotlivým komponentám lidského mozku značně podobná.

Stoupenci teorie stochastického papouška často argumentují jednoduchostí artificiálních sítí. Na tento argument však lze snadno odpovědět analogií s létáním. Průkopníci létání měli předobrazy svých strojů v biologických organismech, jenže balony, vzducholodě, letadla nebo helikoptéry mají do jejich složitosti daleko a napodobují je jen částečně. A přesto tyto vynálezy fungují a mnohdy dosahují lepších výkonů než originály.

Je to díky tomu, že byly odhaleny základní zákony a principy jejich fungování, které spolu s inženýrskými dovednostmi umožnily jejich konstrukci. Podobně je tomu u umělých neuronových sítí, jež využívají prakticky totožné principy zpracování informací jako mozky, a proto se jim začínají přibližovat nebo je i překonávat.

Článek vyšel v magazínu Computerworld 11/23.

Petr Jedlička

Témata:

umělá inteligence

Sdílet

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Teorie stochastického papouška

Jak poznáte, že už s tím máte seknout

Podobnosti mozků a umělých sítí

Hluboké a zpětnovazební učení

Konec pohádky. Nejvyšší platy už nerostou. Nejvíc si vydělá IT ředitel v Praze

Paměť a pozornost

Jak spolehlivé jsou harddisky ve skutečnosti?

Autor článku

Petr Jedlička

Témata:

Komerční sdělení

Technologie mění svět. Jak držet krok s IT trendy?

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Je čas se rozhodnout – AI závod začíná! Stane se vaše firma lídrem, nebo zůstane pozadu?

Co dnes musí člověk umět, aby byl úspěšný v práci?

Canalys: Trh tabletů před vánoční sezonou vyrostl o 11 %

Karel Diviš: Firmy potřebují jednoho stabilního dodavatele IT

Odvody OSVČ se od roku 2025 zvýší zhruba o tisícovku. Ještě více poroste paušální daň

Denisa Arslanianová a Veronika Schieblová posilují marketing Samsungu v ČR a SR

Podzimní vydání CIO Business Worldu je tady

Limit na volnočasové benefity v roce 2025 je štědřejší

SWS získala distribuční smlouvu na spotřební materiál HP

Je umělá inteligence jen opakujícím papouškem?

Sdílet

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Teorie stochastického papouška

Jak poznáte, že už s tím máte seknout

Podobnosti mozků a umělých sítí

Hluboké a zpětnovazební učení

Konec pohádky. Nejvyšší platy už nerostou. Nejvíc si vydělá IT ředitel v Praze

Paměť a pozornost

Jak spolehlivé jsou harddisky ve skutečnosti?

Autor článku

Petr Jedlička

Témata:

Komerční sdělení

Technologie mění svět. Jak držet krok s IT trendy?

Mohlo by vás zajímat

Máte umělou inteligenci v malíku? Ověřte si to v našem kvízu

Facebook a Instagram vrací do hry rozpoznávání obličeje, aby nás „chránily“

Co se dočtete v novém Computerworldu 11/2024?

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Je čas se rozhodnout – AI závod začíná! Stane se vaše firma lídrem, nebo zůstane pozadu?

Co dnes musí člověk umět, aby byl úspěšný v práci?

Canalys: Trh tabletů před vánoční sezonou vyrostl o 11 %

Karel Diviš: Firmy potřebují jednoho stabilního dodavatele IT

Odvody OSVČ se od roku 2025 zvýší zhruba o tisícovku. Ještě více poroste paušální daň

Denisa Arslanianová a Veronika Schieblová posilují marketing Samsungu v ČR a SR

Podzimní vydání CIO Business Worldu je tady

Limit na volnočasové benefity v roce 2025 je štědřejší

SWS získala distribuční smlouvu na spotřební materiál HP

Dále u nás najdete

Záchranná záplata KB5044384 přináší nové potíže do Windows

Microsoft brzdí aktualizaci Windows 11 24H2

Jak českým firmám pomáhá digitální transformace?

Jak Češi využívají domácí tiskárny

Ministr Válek má rakovinu, lékaři ji odhalili při prevenci

Bolest prsu nemusí hned značit vážné onemocnění

Firmy hledají rovnováhu mezi AI inovacemi a technologiemi

Padá vám Outlook? Zkuste tyto jednoduché kroky!

Část kloubních výživ na bolavá kolena zákazníky šidí

Evropská komise vyšetřuje Temu

Resort spravedlnosti nestíhá digitalizaci, ČR tím přišlo o miliony

Jak ovlivní průměrná a minimální mzda zdanění zaměstnanců?

Řetězce falšují slevy záměrně. Měly by dostávat vyšší sankce

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Trh chytrých telefonů vyrostl o 5 %, Apple lámal rekordy

Žloutenka C je vyléčitelná bez nutnosti odběru vzorku jater

Bude to cirkusová show? Markeťáci komentují vstup Fialy na TikTok

Na mixéru hledala tlačítko zpět. Nyní má ořechová másla jako dítě

Slavné oběti syfilis: Známý hudební skladatel i oblíbený malíř

Chronický chrapot může být banální, ale může jít o rakovinu