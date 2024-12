V důsledku všech těchto zkušeností by společnosti měly vědět, jak si zajistit, že používají správně licencovaný kód, jak kontrolovat výskyt zranitelností a jak vše udržovat v aktuálním stavu.

„Některé open source modely vám dokonce umožňují vidět, co se používá k usuzování a co nikoli,“ dodává. Auditovatelnost je podle něj důležitá pro prevenci halucinací.

„Nepodceňujte však své schopnosti a možnosti si s těmito modely pohrát,“ připomíná. „Protože jde o open source, je snadné to udělat a případně je vyměnit.“ Navíc se zmenšuje výkonnostní propast mezi modely open source a jejich komerčními alternativami s uzavřeným zdrojem, dodává.

GenAI ale nemá jen podobu kódu. Jsou to také tréninková data, váhy modelu a jemné vyladění. Všechny tyto věci jsou zásadní pro pochopení toho, jak model funguje, a pro identifikaci potenciálních zkreslení (předpojatost apod.).

To přivádí k dalšímu aspektu licencování open source – tradiční software open source je představovaný kódem. Skutečnost, že jde o open source, znamená, že můžete vidět, co dělá a zda jsou v něm potenciální problémy nebo zranitelnosti.

S GenAI navíc přichází několik nových komplikací. Za prvé, existují nové typy licencí, které patří do kategorie open source jen ve smyslu velmi volné definice tohoto pojmu.

Scenérie různých typů licencí open source je už dost komplikovaná. Lze projekt bezpečně využívat komerčně, nebo jen pro nekomerční implementace? Lze ho upravit a distribuovat? Lze ho bezpečně začlenit do proprietární kódové základny?

Tento přístup „tisíce očí“ k open source zabezpečení však funguje jen v případě, že ve skutečnosti existuje tisíc očí schopných porozumět tomu, co vidí. A takový stav u GenAI zatím není.

Jakmile společnost dokončí ověření konceptu, nasadí komerční model do produkčního prostředí a začnou narůstat placené částky, může nastat čas podívat se na open source alternativy. „Využití verze open source ale vyžaduje odborné znalosti,“ upozorňuje.

V oboru GenAI to ale představuje velký problém. Nikdo nemá dlouholeté zkušenosti, protože technologie je nová. Pokud tedy organizace s generativní umělou inteligencí teprve začíná nebo se chce rychle posunout, je pro ni bezpečnější začít s proprietární platformou, radí Rao.

„Když je model součástí většího systému a jeho výstup využívá i jiná jeho část, potom pokud hacker dokáže kompromitovat způsob, jakým model vytváří výstup, naruší to celý systém, což může být pro podnik rizikové.“

Pokud model umělé inteligence přidá do svého výstupu vodoznak, může hacker kód analyzovat, aby reverzním inženýrstvím přišel na postup pro odstranění takového vodoznaku. Útočníci by také mohli analyzovat model nebo jiný podpůrný kód a nástroje k nalezení oblastí zranitelnosti.

„Není to jen styl pokus-omyl,“ varuje Rao. Útočníci mohou tréninková data analyzovat, například aby našli způsoby, jak přimět model, aby nesprávně identifikoval obrázky nebo překročil restrikce v případě neškodně vypadajícího promptu.

V případě projektu open source nemusí být v týmu nikdo, kdo by sledoval případné příznaky jailbreakingu. Zločinci si navíc mohou tyto modely stáhnout zdarma a provozovat je ve svých vlastních prostředích s cílem otestovat funkčnost možných způsobů napadení.

Je ale nepravděpodobné, že by si zločinci pořídili podnikové verze produktů, které běží v privátních prostředích, kde se prompty nepředávají dodavateli za účelem vylepšení modelu.

„Je to potenciální problém a nikdo ve skutečnosti vlastně neví, jak některé z probíhajících soudních sporů dopadnou,“ upozorňuje Guarrera z EY. Podle něj můžeme směřovat do světa, kde bude muset existovat nějaká kompenzace za soubory dat.

Ale co když se domnívají, že jejich práva k duševnímu vlastnictví porušuje open source model, ale dostatek financí na kompenzaci mají jen podniky, které tento model začlenily do svých produktů či služeb? Mohou být žalované samy podniky?

Proprietární modely své systémové prompty nezpřístupňují, protože přístup k nim by mohl hackerům umožnit zjistit, jak na model úspěšně zaútočit.

Mohli by například infiltrovat vývojový tým ve špatně řízeném projektu a přidat škodlivý kód do samotného softwaru. Také mohou otrávit tréninková data, jemné ladění nebo váhy, varuje Sügis.

„Snažila bych se získat co nejvíce dokumentace, otestovat i zhodnotit model a sama implementovat nějaké mantinely,“ doporučuje.

V současnosti neexistuje žádný nezávislý orgán, který by bezpečnost open source modelů GenAI vyhodnocoval, konstatuje Sügis. Evropský zákon o AI bude vyžadovat část této dokumentace, ale většina jeho ustanovení vstoupí v platnost až za dva roky, popisuje.

Podniky hledající model LLM pouze pro zkoušení nemusejí nutně vědět, do které kategorie ten jimi vybraný spadá.

Místo toho lidé považují rozhraní API a další rozhraní hlavních dodavatelů, jako je OpenAI, za vznikající de facto standardy. „Je to vidět na tom, jak probíhá praxe,“ dodává Dolezal.

Nejběžnější nástroj pro vytváření agentů, LangChain, je spíše framework než standard, popisuje. A organizace, které vytvářejí poptávku po standardech, ještě nejsou připravené, vysvětluje. „Většina koncových uživatelů neví, co chtějí, dokud si s tím nezačnou hrát.“

„To jsem zatím neviděl, ale přivítal bych to,“ prohlašuje. „Přijít na způsoby, jak nejen nechat agenty plnit jejich specifické úkoly, ale také jak to propojit.“

Zmiňuje, že už existuje společný datový standard pro vektorové databáze, ale žádný standardní dotazovací jazyk. A co standardy pro autonomní agenty?

Podle něj nyní probíhají některé rozhovory v souvislosti s klasifikací dat a o potřebě standardního formátu pro tréninková data, pro rozhraní API a pro prompty. Zatím to však jsou jen rozhovory, dodává.

„Je to vznikající oblast,“ konstatuje Taylor Dolezal, šéf IT a vedoucí ekosystémů v nadaci CNCF (Cloud Native Computing Foundation).

Zaměřuje se také do značné míry na rizika a otázky řízení či správy. Pokud však jde o technické standardy, zatím toho existuje málo.

Společnosti produkující proprietární software by na druhé straně mohly dát přednost tomu, aby byli jejich zákazníci uvězněni v jejich ekosystémech. Pokud byste však předpokládali, že budou všechny open source projekty GenAI založené na standardech, mýlili byste se.

Možná si myslíte, že open source modely jsou ze své podstaty transparentnější. Někdy to ale tak být nemusí. Velké komerční projekty mohou mít více prostředků na vytváření dokumentace, popisuje Eric Sydell, šéf analytické platformy Vero AI.

Je běžné, že projekty open source se forkují (paralelně se rozvíjejí původní nápady), ale když se to stane s GenAI, vznikají rizika, která u tradičního softwaru nejsou.

Nové stínové IT

Společnosti využívající komponenty open source jako součást svého vývoje softwaru mají už zpravidla zavedené procesy k prověření knihoven a aktuálnosti komponent. Zajišťují tím, aby jejich projekty byly dobře podporované, aby řešily bezpečnostní problémy a aby měl software odpovídající licenční podmínky.

V případě GenAI však lidé, kteří mají takové prověření zajistit, nemusejí vědět, co vlastně mají hledat. Navíc projekty s GenAI někdy vybočují ze standardních procesů vývoje softwaru.

Mohou je totiž iniciovat týmy datové vědy nebo izolované, nezávisle fungující oddělení. Vývojáři si stáhnou modely, aby si s nimi mohli pohrát, a nakonec je začnou šířeji používat.

Nebo mohou firemní uživatelé sledovat on-line výukové programy a nakonfigurovat si vlastní GenAI, takže vlastně zcela obejdou IT oddělení.

Nejnovější evoluce generativní AI či autonomní agenty mají potenciál vložit do rukou těchto neevidovaných či nechválených systémů obrovskou moc a pozvednout potenciál rizik do nových výšin.

„Pokud s tím budete experimentovat, vytvořte si pro tento účel izolované prostředí, abyste to udělali způsobem, který je pro vaši organizaci bezpečný,“ doporučuje Kelley Misata, šéfka pro open source ve společnosti Corelight.

Za to by podle ní měl odpovídat firemní tým pro řízení rizik. Osobou, která má zajistit, aby vývojáři a firma jako celek pochopili, že takový postup existuje, je ředitel IT.

„Mají nejlepší pozici k nastavení kultury,“ vysvětluje. „Mohou říci: ‚Pojďme využít inovace a veškerou skvělost, kterou open source nabízí, ale dělejme to prozíravě.‘“