Wersja tego artykułu została pierwotnie opublikowana w weekendowym biuletynie tylko dla członków kwarcu. Członkowie kwarcu mogą uzyskać dostęp do ekskluzywnych listów informacyjnych. Zarejestruj się tutaj

Wkrótce po ogłoszeniu Chatgpt wyciek e -mail Powiedział Google Wiele osób myślało, ale niewielu odważy się mówić głośno. „Nie mamy fosy. Otwarcie nie ma miejsca”. W tym samym miesiącu, w drodze dookoła świata, przedsiębiorca o imieniu Liang Wenfeng po cichu utworzył Deepeek w Chinach.

Półtora roku później Deepseek udowodni proroctwo Google. Deepseek Ujawniłem model V3 W grudniu w grudniu firma stwierdziła, że ​​przeszkoliła zaledwie 5,6 miliona dolarów za pomocą słabych układów, mniej niż 6 % kosztów szkolenia GPT-4. Później, w zeszłym tygodniu, firma ogłosiła R1. R1 ogłosił nowy model wnioskowania, który może stopniowo rozważać złożone problemy pasujące do funkcji specjalistycznych systemów wnioskowania Openai.

Te przełom wysłane Wysokie tech w Stanach Zjednoczonych jest w poniedziałek w poniedziałek za wolny upadek Odsłonięta nieprzyjemna prawda. AI może w ogóle nie mieć fosy. Bariery techniczne, które chroniły amerykańską kontrolę AI, od zaawansowanych układów po dużych centrach danych, to więcej miR niż fortece. Jednak modele te mogą oznaczać problemy dla banków i rund finansowania o dużej skali dla własnych korzyści, ale Deepseek jest bardziej wydajny i dostępny rozwój sztucznej inteligencji.

Hit nie był jedyną firmą, która buduje wygenerowaną sztuczną inteligencję. Dla inwestorów, którzy uważali Nvidię za idealne „wybór i łopatę”, objawienie Deepseek było niszczące z powodu niepewnej pośpiechu złota AI. Akcje spółki były kraterowe w poniedziałek, Płynie prawie 600 miliardów dolarów Największa wartość rynkowa dnia w historii. Jak ostrzega Google, widać, że może nie być fosy oprogramowania, ale może nie być sprzętu. Jest to nieprzyjemne dla firmy, która ma szybką rosnącą ocenę opartą na idei, że apetyt AI dla państwa -Krzem z części rośnie tylko.

Przełom Deepseek narodził się z szkolenia około 2000 modeli NVIDIA H800 GPU. Jest to specjalnie zaprojektowany układ z funkcją zmniejszającą funkcje zgodne z eksportem USA. Są to zło H100, które jest pożądane przez amerykańskie firmy, oraz prędkość komunikacji od układów, która miała być niewystarczająca do zaawansowanego szkolenia modelu AI, jest celowo ograniczona. Jednak pomimo tych ograniczeń Deepseek stworzył model konkurencyjny.

Zaawansowane sankcje chipów Uzgodnienie przez administrację Biden miało dokładnie zapobiec temu scenariuszowi. Jednak zamiast osłabić chińskie zdolności AI, wydaje się, że embargo było katalizatorem. Deepseek został zmuszony do wprowadzania innowacji w taki sposób, aby zakwestionować podstawowe założenia Doliny Krzemowej, pomimo faktu, że założyciel Wenfeng ma wysokowydajny chip bez butelki. Według Wall Street Journal

Wpływ na żetony przekracza koszty szkolenia. Jeśli firma znajdzie bardziej wydajne sposoby szkolenia modeli AI, wydajność ta zostanie odziedziczona przez sposób wykonywania modeli w codziennym użyciu, to znaczy, że jest to powszechne. Deepseek pobiera token wyjściowy o wartości 2,19 USD za milion dolarów w porównaniu z najnowszym modelem Openai 15 USD. Nie jest to wąska wydajność, którą można rozwinąć, ale 7 -krotność różnicy w gospodarce wdrażania AI.

Niektórzy liderzy technologii Zastanawiam się Deepseek zrobił to, czy było to naprawdę możliwe dzięki budżetowi i dostawie wiórów. Doniesiono, że meta została ustawionaWallroom, żeby się dowiedzieć ” Te modele. Microsoft jest Zbadam, czy jest to Deepseek Byłem w stanie uzyskać dostęp do Openai Tech, która może być za pewnymi umiejętnościami.

Jeśli roszczenie Deepseek zostanie zachowane, budynek z entuzjastycznych centrów danych w całych Stanach Zjednoczonych zmieni się. Projekt Gate Gate 500 milionów dolarów Został ogłoszony w zeszłym tygodniu w Białym Domu. Wszystkie te duże obiekty były pilnie w oparciu o koszty astronomiczne amerykańskiego szkolenia modelu. „Więcej” 100 milionów dolarów Dario Amday, dyrektor generalny, na szkolenie, przewidział, że możemy go zobaczyć. Model 10 miliardów dolarów W tym roku.

Jeśli jednak możesz trenować w części kosztu przy potężnym sprzęcie, pośpiech kompilacji może wydawać się kosztowną nadmierną reakcją. Niektórzy ludzie, jak główny naukowca AI Meta, Yann Lecunn Twierdzę, że ta infrastruktura jest nadal potrzebna Wykonaj usługi AI na dużą skalę. Jednak przełom Deepseek sugeruje, że zarówno szkolenie, jak i rozwój nadal mają dużą wydajność, a naukowcy powinni być podekscytowani.

Jest to wzór, który można zobaczyć w kółko.

Ponieważ koszt przetwarzania komputerowego spadł od pierwszej głównej ramki, smartfony pakowały więcej mocy obliczeniowej niż maszyna wysyłana przez astronautów na Księżycu, ale duża energia sztucznej inteligencji. . Pierwsze powtórzenie wszystkich technologii było rzadko wydajne, a wygenerowany rachunek AI zawsze nadchodził. Firmy muszą ostatecznie zarabiać pieniądze, prawdopodobnie nie na obecnym poziomie zużycia energii.

Lub, jak powiedział Brian Cahn z Sequoia Capital, 600 miliardów pytań (To, podczas gdy inwestycja AI wciąż się rozwija, rozszerzyła się z pierwszych 200 miliardów dolarów zeszłego lata, ale zyski pozostały nie do zniesienia) -Firma wysoka stała się AI. robisz.

Przełom Deepseek może pomóc w wypełnieniu tej luki. Ponieważ jest to open source, nie ma nic, co nie ma zapobiegania amerykańskim firmom wysokiej techu do przyjęcia tych wydajnych technologii. Unikalne koszty szkolenia i wnioskowania mogą spadać. A niedroga sztuczna inteligencja może wydawać się złą wieścią dla gigantów wysokich -tech, ale Satiya Nadera wygląda inaczej. „”Jevons Paradox Uderz ponownie! CEO Microsoft Post do x。 „Jeśli AI stanie się bardziej wydajna i łatwa w dostępie, użycie szybko wzrośnie i zmieni go na produkt, który nie wystarczy”.

Objawienie open source może oznaczać coś więcej niż tylko techniczny punkt zwrotny. Historia sztucznej inteligencji pokazuje, że największy przełom jest często od badaczy, którzy otwarcie budują się od rozwoju sieci nerwów, po transformator, który działa na dzisiejszą sztuczną inteligencję.

Możesz odwrócić to, co FrançoisChollet, badacz Google, jest największym efektem Openai.5 do 10 latKiedy zatrzymał publikację badań, zachęcił go do ograniczenia udziału we wszystkich dziedzinach w celu ochrony korzyści.

Fosę nigdy tam nie było.

Ale wiara w to mogła utrudnić AI, a nie ograniczenia techniczne.

Source link

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj