Hlavní navigace

Mohly by počítače číst gesta a výrazy tváře?

25. 10. 2010

Sdílet

V systémech městské hromadné dopravy, na letištích nebo v nákupních centrech pak z chování lidí mohl software skrytý za kamerovým systémem odhalit úzkost nebo paniku a podle toho provést potřebné opatření – třeba zastavit eskalátor.

Počítače dnes už neovládáme jen pomocí klávesnice a myši. Jsou zde dotykové displeje nebo rozpoznávání hlasu. Nešlo by ale zajít ještě dál, nemohly by automatické systémy číst i „body language“, tedy zejména výrazy tváře a gesta rukou?

Projekt Miauce, který financuje Evropská unie, se snaží právě o vývoj takových systémů. Chaabane Djeraba z CNRS (Centre National de la Recherche Scientifique) ve francouzském Lille uvádí, že cílem projektu je, aby počítače mohly být vyhodnocovat situaci bez toho, že by s nimi lidé vědomě komunikovali. Lidé by prostě řešili své vlastní záležitosti a automatické systémy byly v prostředí skryté.

Například v systémech městské hromadné dopravy, na letištích nebo v nákupních centrech by pak z chování lidí mohl software skrytý za kamerovým systémem odhalit úzkost nebo paniku a podle toho provést potřebné opatření – třeba zastavit eskalátor. Aby to celé mělo smysl, musí vše samozřejmě fungovat v reálném čase, což je vzhledem k množství vstupních dat při videostreamech docela náročný úkol. Vyhodnocování nemusí být založeno jen na gestech či výrazech tváře, ale i třeba na neobvyklém chování davu jako celku (všichni běží jedním směrem) nebo nezvyklých pohybech jediného těla (typicky pád).

Příslušné technologie ale mají i další možnosti využití. Majitel supermarketu by třeba chtěl vědět, na jakých místech se lidé usmívají a kde se nad nabídkou naopak zamračí, nebo i kam se vůbec dívají, jaké zboží či cedulka přitahuje pohled. Nemusí přitom jít jen o chování zákazníků uvnitř obchodu, ale i o výrazy tváří lidí, kteří jsou kolem po ulici a reagují na „poutače“, jež se je snaží dostat dovnitř. Automatickým rozpoznáváním výrazů tváře by mohly být doplněny i reklamní billboardy.

Další možnou aplikací jsou interaktivní televize nebo i počítačové aplikace. Kamera by sledovala oko diváka a podle směru jeho pohledu by systém prováděl příslušný zoom nebo zobrazoval kontextovou informaci (jméno hráče ve sportovním přenosu, herce ve filmu...). Na této části projektu se podílí i lotyšská softwarová firma Tilde. Ve vývoji je rovněž aplikace, při níž by systém snímal lidskou tvář a vkládal ji interaktivně do přednastaveného modelu. Tímto způsobem by si lidé mohli vybírat např. oblečení nebo účes u kadeřníka.

Samozřejmě, že všechny tyto technologie s sebou nesou i otázky ohledně ochrany soukromí, potřebu sledované lidi analyzovat, ale současně anonymizovat (např. aby snímací systémy nemohly propojit analyzované tváře s profily na Facebooku) atd. Lze si představit, že špatná implementace systémů a falešné poplachy mohou třeba na letištích přinášet cestujícím zbytečné komplikace. Jak se má aplikace vypořádat s tím, že někdo zakopne a upadne, má počkat, zda člověk zase vstane nebo ihned vyhlásit poplach? Nicméně rámcově asi platí, že než muset v metru mačkat např. tlačítko signalizující pád osoby do kolejiště, je efektivnější, když to bezpečnostní systém zaregistruje sám.

 

Cloud22

Zdroj: ScienceDaily