AWS a Anthropic posilují spolupráci kvůli vývoji AI čipů

26. 11. 2024

Sdílet

 Autor: Computerworld.cz s využitím Dall-E
Společnost AWS se pro Anthropic (modely Claude) stane primárním partnerem pro trénování jeho jazykových modelů.

Anthropic bude pro trénování modelů Claude používat procesory AWS Trainium. Amazon navíc do startupu investuje další čtyři miliardy dolarů, čímž svou celkovou investici navýší na osm miliard.

AWS je už dnes hlavním poskytovatelem cloudu pro Anthropic a dokonce i konkurenční OpenAI bude k trénování svých základních modelů primárně využívat čipy Trainium a Inferentia. Anthropic se bude rovněž podílet na vývoji Trainium, a to v rámci toho, co společnosti nazývají „hardwarově-softwarovým přístupem k vývoji“.

Využíváte už některé z inovativních metod šifrování?

Ačkoli není jasné, zda dohoda vyžaduje, aby Anthropic používal výhradně čipy AWS, z pohledu Amazonu jde o krok, který lze vnímat jako hozenou rukavici společnostem jako Nvidia a dalším. 

„Je to první krok k rozšíření dostupnosti generativní AI a AI modelů,“ říká Alvin Nguyen, senior analytik společnosti Forrester.

Zrychlení vývoje Clauda

Společnost Anthropic, která zahájila svou činnost v roce 2021, letos s vývojem velkého jazykového modelu (LLM) Claude významně pokročila. Její Claude 3 rodina zahrnuje tři LLM: Sonnet, Haiku (nejrychlejší a nejkompaktnější) a Opus (pro složitější úlohy), které jsou všechny k dispozici na Amazon Bedrock. Všechny mají schopnosti interpretovat obraz a kontextové okno pro 200 000 tokenů, což znamená, že podporují velké objemy dat, které se rovnají zhruba 150 000 slov nebo 500 stranám materiálu.

Za zmínku také stojí, že minulý měsíc společnost Anthropic představila aplikaci „Computer Use“ pro Claude 3.5 Sonnet. Ta umožňuje modelu používat počítač stejně jako lidé; kromě generativních schopností dokáže rychle pohybovat kurzorem, přepínat mezi kartami, procházet webové stránky, klikat na tlačítka, psát a vytvářet vědecké dokumenty. Společnost tvrdí, že Sonnet překonává všechny ostatní dostupné modely v úlohách kódování.

Video ke kávě

Máte čas na rychlé a informativní video?

Od svého přidání do Amazon Bedrock, plně spravované služby AWS pro vytváření generativních AI modelů, v dubnu 2023 zaznamenal Claude rychlé přijetí a nyní podle AWS podporuje „desítky tisíc“ společností z mnoha odvětví. Základní modely jsou používány k vytváření řady funkcí, včetně chatbotů nebo kódovacích asistentů.

„Letošek byl pro Claude rokem průlomového růstu a naše spolupráce se společností Amazon byla klíčová pro zpřístupnění jeho schopností milionům koncových uživatelů,“ uvedl v oznámení Dario Amodei, spoluzakladatel a generální ředitel Anthropicu.

Rozšířené partnerství mezi oběma společnostmi je strategické pro obě strany a signalizuje, že modely společnosti Anthropic jsou výkonné a všestranné a že infrastruktura AWS dokáže zvládnout intenzivní generativní zátěž AI způsobem, který konkuruje společnosti Nvidia a dalším.

Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?
Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?
0:00/

„Z pohledu Anthropicu je výhodou pevná infrastruktura a možnost neustále rozšiřovat schopnosti svých modelů. Ukazuje to také, že mohou dobře spolupracovat s dalšími partnery,“ tvrdí Nguyen. A AWS má podle něj na druhé straně v Anthropicu „premiérového klienta, jednu z tváří AI.“

Od křemíku po celý stack

V rámci rozšířeného partnerství bude Anthropic také pomáhat s vývojem a optimalizací budoucích verzí speciálního čipu Trainium. Tento čip pro strojové učení podporuje trénování hlubokého učení pro modely s více než 100 miliardami parametrů.

Společnost Anthropic uvedla, že úzce spolupracuje s laboratořemi Annapurna Labs společnosti AWS na psaní low-level jader, která jí umožní komunikovat s křemíkem Trainium. Přispívá také k softwarovému zásobníku AWS Neuron, aby pomohla posílit Trainium, a spolupracuje s týmem pro návrh čipu v oblasti výpočetní účinnosti hardwaru.

HP Knowledge HUB pro moderní firemní IT

NOVINKA Navštivte novou speciální on-line zónu CIO Business Worldu, kde vám ve spolupráci s HP budeme průběžně radit, jak snadno a bezpečně pracovat na cestách, jak si usnadnit život používám správných nástrojů, jak zvládnout přechod z kanceláří domů a zase nazpátek a jak se přitom chovat ekologicky.

Pomoc a inspiraci pro moderní IT najdete v našem HP Knowledge HUBu.

„Tento úzký přístup k vývoji hardwaru a softwaru v kombinaci se silným poměrem ceny a výkonu a masivní škálovatelností platforem Trainium nám umožňuje optimalizovat každý aspekt trénování modelů od křemíku až po celý stack,“ napsala společnost Anthropic v čerstvém blogovém příspěvku.

bitcoin školení listopad 24

Tento přístup poskytuje výhodu oproti univerzálnějšímu hardwaru (jako jsou GPU společnosti Nvidia), který dělá více, než je „nezbytně nutné“, zdůrazňuje Nguyen. Dlouholetá spolupráce společností také znamená, že mohou „otupit“ výhody optimalizace výkonu, které má Nvidia se svou platformou CUDA.

„Tento typ úzké spolupráce mezi softwarovými a hardwarovými inženýry/vývojáři umožňuje optimalizace v hardwaru i softwaru, jaké není pokaždé možné najít při samostatné práci,“ řekl Nguyen.

 

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.