Zbliżenie układu AI Trainium 2

pociąg 2
fotografia: Usługi internetowe Amazona

w tej historii

Usługi internetowe Amazona (AMZN+1,15%) Firma zaprezentowała chip szkoleniowy sztucznej inteligencji nowej generacji, który ma być szybszy i zużywać mniej energii.

Trainium3 to pierwszy chip AWS, Proces 3 nanometrów Jest to najbardziej zaawansowana jak dotąd technologia półprzewodników, umożliwiająca zwiększenie wydajności i efektywności energetycznej. Oczekuje się, że pierwsze chipy Trainium3 zostaną wprowadzone na rynek pod koniec przyszłego roku, ogłosił AWS we wtorek na konferencji re:Invent.

AWS twierdzi, że serwery UltraServers z Trainium3 mogą spodziewać się 4 razy lepszej wydajności niż UltraServery z chipami Trainium2. Dzięki temu „klienci będą mogli szybciej wykonywać iteracje podczas budowania modeli i osiągać lepszą wydajność w czasie rzeczywistym podczas wdrażania”.

AWS twierdzi, że chip Trainium2 należący do giganta chmurowego, który jest czterokrotnie szybszy niż poprzednia generacja, jest już ogólnie dostępny. Instancje Amazon Elastic Compute Cloud (Amazon EC2) obsługiwane przez Trainium2 zapewniają od 30% do 40% lepszą wydajność cenową niż obecne chipy i są zasilane przez 16 chipów Trainium2. AWS twierdzi, że nowe instancje Amazon EC2 są „idealne do szkolenia i wdrażania LLM z miliardami parametrów”.

Gigant chmurowy powiedział, że współpracuje ze start-upem AI Anthropic, zwanym Project Rainier, nad zbudowaniem EC2 UltraCluster dla UltraServers obsługiwanego przez Trainium2. W listopadzie AWS ogłosiło następujące inicjatywy w związku z poprzednią inwestycją wynoszącą 4 miliardy dolarów w start-upy AI. Kolejne 4 miliardy dolarów. W kolejnej fazie partnerstwa firma Anthropic będzie używać AWS jako swojego głównego partnera szkoleniowego w zakresie sztucznej inteligencji.

„Trainium2 zostało zaprojektowane specjalnie, aby obsługiwać największe, najnowocześniejsze obciążenia generatywnej sztucznej inteligencji zarówno na potrzeby szkolenia, jak i wnioskowania, a także oferować najlepszą wydajność cenową na platformie AWS” – powiedział wiceprezes AWS ds. obliczeń i sieci. oświadczenie. „Rozumiemy, że parametry modeli sięgają bilionów, dlatego też nasi klienci potrzebują także nowego podejścia do szkolenia i obsługi wielkoskalowych obciążeń, co zapewnia najszybszą na świecie wydajność szkoleń i wnioskowania, pomagając organizacjom każdej wielkości szybciej szkolić i wdrażać największe modele na świecie i niższym kosztem.

Dyrektor generalny AWS Matt Garman ogłosił także rodzinę instancji Nvidia P6 nowej generacji. (NVDA+0,48%) AWS jest zasilany przez nowe chipy Blackwell producenta chipów. Według Garmana Blackwell ma 2,5 razy szybsze przetwarzanie niż procesory graficzne (GPU) obecnej generacji.

Source link