Strojové učení se stává dostupným díky open source

11. 9. 2020

Autor: © agsandrew - Fotolia.com

Se zrychlující se digitalizací shromažďují firmy stále větší množství dat. Podívat se na ně očima stroje pak může přinést větší vhled do vlastního byznysu i objevování nečekaných příležitostí. Stejně tak se ale zvyšuje i komplexita využívaných systémů. Šéfové firem či management proto musí sledovat stále více ukazatelů, tabulek, grafů a statistik, aby se mohli efektivně rozhodovat.

Do hry vstupuje množství z tradičního pohledu externích datových zdrojů, které dokážou výrazně rozšířit možnosti rozhodování. Kombinace externích a interních dat přináší novou příležitost, zejména pokud firma naplno využívá možností strojového učení.

Paradoxně skutečná příležitost netkví v technologiích, ty jsou pouze podmínkou pro automatizaci a urychlení celého procesu. Příležitost je primárně v hlubším pochopení vlastního pracovního prostoru a možnost rozhodování se na základě mnohem větší množiny informací. Firmy, které projdou evoluční transformací a digitalizaci procesů rozšíří o data-driven rozhodování, získají klíčovou výhodu oproti konkurenci.

Nejprve je třeba data propojit a vybudovat ekosystém informací

Informace vznikají a mění svoje parametry v reálném čase, pokoušet se udržet všechny procesy a evidence v jednom monolitickém systému je proto ambice patřící do minulosti. Základ pro poznání vlastního datového prostoru umožňuje přístup Master data management, kde každý typ informace by měl mít přesně určený zdroj.

Může se jednat o účetní systém, výrobní systém, bankovní systém, CRM, uživatelská data, open data nebo také dokumenty, tabulky a volné texty či znalostní báze. Zajímavé obohacení může přijít do systému ve formě komerčně dostupných datasetů. Pro ekosystém informací je podstatné pochopit a zavést takové procesy, které tato data dokážou propojit a umožní jejich efektivní vytěžení bez zásahu člověka.

Algoritmy strojového učení pomohou se složitějšími otázkami

V dalších krocích zpracování dat vznikají odvozená data v procesu zavedení automatizovaných matematických operací. Často tak dochází k dopočítání různých statistických ukazatelů, sumářů či porovnání v čase. V tomto bodě většinou končí první fáze budování datového ekosystému.

Jakmile si jeho využívání firma osvojí, přichází na řadu sofistikovanější otázky: Jak zvýšit prodej? Jak vyladit proces výroby? Jak předpovídat kritické situace? Zde je prostor pro zavedení algoritmů strojového učení a v některých případech zpracování big data, jejichž výstupem je další skupina dat potřebných pro efektivní rozhodování.

Kdo se na data bude dívat?

Uvedení ekosystému do života má několik forem. Unifikovaný a propojený pohled na data se vrací do zdrojových systémů, které využívají rozšířené informace z jiných systémů nebo výpočtů. Automatizované procesy sledují důležité ukazatele v širších kontextech a spouští procesy upozornění nebo zásahů.

Data se většinou transformují rovněž do datových kostek, které využívají datoví analytici. Ti připravují pro sebe nebo management různé pohledy, často ve formě automatických reportů v e-mailech, znalostních bázích nebo v produktech business intelligence. Většinou jde o živý proces, při kterém se datový ekosystém průběžně rozšiřuje, zvyšuje se kvalita dat a aplikují se další algoritmy.

Jak open source platformy a implementace algoritmů strojového učení využívají světové korporace

Jeden z klientů podnikající v agrochemii, který prodává své produkty po celém světě, evidoval potřebu sdílení informací mezi obchodníky z různých domén. Problém byl v nízkém cross-selling prodeji – každý segment si prodával pouze svoje produkty, přitom potenciál pro cross-selling byl obrovský. Firma stimulovala komunikaci mezi obchodníky různými programy a eventy, ale výsledky se dostavovaly jen ojediněle.

Naše řešení využilo konsolidovaná data z téměř všech zemí světa. Pro ověření hypotéz jsme zvolili open source platformu Apache Spark s knihovnou strojového učení MLlib, která měla potenciál pro nasazení v rámci superpočítače. V takto distribuovaném výpočtovém prostředí jsme dosáhli nečekaných výsledků – řešení dokáže identifikovat zajímavé cross-selling prodeje na různých trzích a doporučit obchodníkům sofistikované nabídky až na úroveň konkrétního zákazníka. Řešení se následně stalo součástí rozvojové strategie společnosti a poukázalo na obrovský potenciál zvoleného open source řešení v daném segmentu.

Digitální transformace neznamená nahradit člověka, ale ulehčit rozhodování

Nejen v digitálním světě existuje řada oblastí, které lze snadno automatizovat. Určitě to ale neznamená nahrazení člověka strojem, který bude na základě získaných dat činit kvalifikovaná rozhodnutí. Strojové učení přináší nové dimenze do ekosystému informací, na základě kterého se rozhodujeme. Pochopení a vhodné interpretování informací v organizaci je však složitá úloha, kterou nevyřeší technologie, ale je záležitostí dobře postaveného týmu a procesů.

Tento fakt se projevuje u většiny úspěšných projektů zapojením expertů a externích konzultantů přímo do procesů managementu. Úlohou managementu je pak potřebné transformační projekty řídit a definovat zadání pro IT oddělení.

Úkolem konzultačního partnera je především poznat klientův byznys – využít své zkušenosti z dané domény a vybrat IT řešení na základě skutečných potřeb klienta. Z toho důvodu je třeba mít pro všechny důležité komponenty několik alternativ včetně open source řešení.

Z dosavadních zkušeností tedy open source často vychází jako optimální cesta pro klienta. Jeho velkou výhodou je totiž nejen široká vývojářská komunita, a tedy i sdílené know-how, ale i nezávislost na dodavateli řešení. S vendor lockem se totiž neustále potýkají nejen státní instituce, ale i řada firem.

Autor je CEO BOOTIQ EEA

Našli jste v článku chybu?

Líbí

Nelíbí

Sdílet

Byl pro vás článek přínosný?

Autor článku

Gabriel Lachmann

Témata:

Mohlo by vás zajímat

Anketa

Jak spravujete více cloudů ve vaší firmě?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Strojové učení se stává dostupným díky open source

Sdílet

Byl pro vás článek přínosný?

Autor článku

Gabriel Lachmann

Témata:

Mohlo by vás zajímat

Podle zjištění společnosti Thales jsou cloudové zdroje největším cílem kybernetických útoků

Jste připraveni na firemní aplikace s podporou generativní AI?

Podcast: Kybernetická bezpečnost s Computerworldem II.

Podle zjištění společnosti Thales jsou cloudové zdroje největším cílem kybernetických útoků

Anketa

Jak spravujete více cloudů ve vaší firmě?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Dále u nás najdete

CrowdStrike: slabá představivost a problém lidského faktoru

Tajemství úspěšných hackathonů

Výrobce koupelnového vybavení Laufen čeká oživení poptávky

Motání hlavy může být způsobeno problémy s krčními tepnami

Plavání s hlavou nad vodou vám ubližuje

Allegro v ČR spouští výdejní boxy, WE|DO se mění na One by Allegro

Pořad 168 hodin v České televizi končí

Podcast: Umělá inteligence není jen ta generativní, upozorňuje odborník David Filgas

Průjmů z masa je letos víc než jindy, nakazit se lze i z melounů

Jednu vanilkovou, nebo spíš kopeček slaného karamelu?

Zvýšenou teplotu není nutné srážet. Počkejte na horečku

Češi jsou mezi globálními lídry krypto světa, tvrdí Stablelabs

Češi stále nejvíc milují kuřecí řízek a smažák

Muž zkolaboval na benzince. Zachránili ho díky defibrilátoru

Kdo má povinnost vydávat výroční zprávu a co musí obsahovat?

Stačí kapka krve z patičky a test odhalí dvacítku vážných nemocí

Praktické tipy pro fyzické osoby, jak ušetřit na daních

Musk: Humanoidní roboty začne Tesla používat už příští rok

Firmy se zajímají o kybernetické pojištění a zlepšily ochranu

Připravte se, už příští rok bude drtivá většina B2B prodeje probíhat digitálně