Da li je pojava DipSik modela poziv za buđenje Silicijumske doline

Forbes 29. jan 2025. 11:23

Foto: Shutterstock

29. jan 2025. 11:23

Kineska kompanija DipSik (DeepSeek), koja je nedavno objavila otvoreni kod za veliki jezički model za koji tvrdi da je na nivou najnaprednijih AI sistema kompanije OpenAI, trenutno je u središtu pažnje AI zajednice. Njena tehnologija hvaljena je kao jedan od najboljih otvorenih izazivača vodećim američkim AI modelima. To podstiče zabrinutost zbog kineske snage u sve intenzivnijoj međunarodnoj trci za dominaciju u oblasti AI-a. I tjera američke startape da preispitaju svoj rad nakon što je strani rival postigao mnogo sa značajno manje resursa.

Krajem decembra, mala kineska laboratorija iz Hangdžoua lansirala je V3, jezički model sa 671 milijardom parametara. Navodno je treniran dva mjeseca za samo 5,58 miliona dolara. To je trošak daleko manji od OpenAI GPT-4, većeg modela sa procijenjenih 1,8 biliona parametara, izgrađenog uz cijenu od 100 miliona dolara. Prošle nedjelje, DeepSeek je podigao ulog objavljivanjem modela pod nazivom R-1, za koji tvrdi da je rival OpenAI o1 modelu u „zadacima zaključivanja“, poput kodiranja i rješavanja složenih matematičkih i naučnih problema. OpenAI naplaćuje korisnicima 200 dolara mjesečno za takve modele. DipSik svoj nudi besplatno.

Preispitivanje cijena

Snaga DipSik modela i njegova cijena već mijenjaju način na koji američki AI startapi vode svoje poslovanje. To je jeftina i privlačna alternativa ponudama etabliranih igrača poput OpenAI-a, izjavio je Džesi Džang (Mark Chen), direktor Decagona, kompanije koja razvija AI agente za korisničku podršku, za Forbes. Novi model kompanije DipSik vjerovatno će natjerati američke AI gigante poput OpenAI i Anthropica da preispitaju svoje cijene.

Eiso Kant, CTO i suosnivač Poolside AI, jednoroga koji razvija AI za softversko inženjerstvo, rekao je za Forbes da je snaga DipSik-a u sposobnosti inženjeringa da postigne više sa manje resursa.

„Ono što DipSik pokazuje svijetu jeste da, kada se snažno fokusirate na efikasnost računarske obrade tokom obuke, možete postići mnogo“, rekao je on. „Nevjerovatne stvari se još mogu izvući iz ovih Envidija (Nvidia) čipova kako bi bili nevjerovatno efikasniji“.

S obzirom na to da je OpenAI o1 model navodno nadmašen u određenim mjerilima, neki startapi su već počeli da prikupljaju podatke za obuku naprednijih sistema, rekao je Manu Šarma (Manu Sharma), izvršni direktor kompanije za podatke Labelbox, za Forbes. „Mislim da je trka za AGI na neki način resetovana“, rekao je on. „Vidjećemo mnogo veću konkurenciju na svim nivoima“.

Za i protiv

Aleksandr Vang (Alexandr Wang), milijarder i direktor giganta za obuku podataka Scale AI, nedavno je ovaj model nazvao „revolucionarnim“. Aravind Šrinivas (Aravind Srinivas), direktor AI pretraživača Perplexity vrijednog devet milijardi dolara, integrisao je model u svoj glavni pretraživački proizvod. AI kompanija za čipove Groq već je dodala DeepSeek R1 model u svoje jezičke procesorske jedinice. (U junu je Forbes poslao Perplexity-u nalog za prekid korišćenja podataka nakon optužbi da je koristio informacije bez dozvole).

Drugi nisu toliko impresionirani. Mej Habib (May Habib), direktorka kompanije Writer, izjavila je za Forbes da nije iznenađena što su DipSik-ovi modeli, trenirani sa značajno manjim budžetom, uspjeli da dostignu najinteligentnije američke modele. U oktobru je Writer lansirao model koji je treniran sa samo 700.000 dolara uloženih u GPU-ove. Dok je OpenAI za izgradnju GPT-4, modela sličnih sposobnosti, navodno potrošio 100 miliona dolara. Writer je koristio sintetičke podatke kako bi smanjio troškove obuke.

„Čak i prije nego što je DipSikov model postao popularan, govorili smo da ovi modeli postaju roba. Postaju sve dostupniji“, rekla je Habib.

Uzbuna među gigantima

Tokom vikenda, dok je interesovanje za kompaniju raslo, DipSik je prestigao ČetGPT na Eplovoj (Apple) prodavnici aplikacija, zauzevši prvo mjesto među besplatnim aplikacijama u SAD. Zatim, u ponedjeljak, više američkih tehnoloških akcija je naglo palo uslijed panike izazvane uspješnim lansiranjem DipSik modela. Do kraja dana, tržišna vrijednost AI giganta Envidije smanjena je za skoro 600 milijardi dolara.

Bio je to zapanjujući preokret u poretku AI svijeta. „Prilično je nevjerovatno da neko uloži stotine miliona dolara u zatvoreni model,“ rekao je Greg Kamradt, predsjednik neprofitne organizacije ARC Prize, koja vrši upoređivanje AI modela, za Forbes. „I onda odjednom imate otvoreni model koji je besplatno dostupan“.

Već nedjeljama DipSik modele hvale neka od najistaknutijih imena u AI industriji, uključujući glavnog AI naučnika Mete Jana Lekuna (Yann LeCun), suosnivača OpenAI-a Andreja Karpatija (Andrej Karpathy) i višeg istraživača Envidije Džima Fana (Jim Fan.). Međutim, vijest o najnovijem uspjehu kompanije izazvala je uzbunu među američkim AI gigantima koji pokušavaju da shvate kako kineska kompanija postiže tako impresivne rezultate uz mnogo manja ulaganja.

Veliki pad na berzi: Američki gigant izgubio 500 milijardi vrijednosti

Forbes Slovenija

Vještačka inteligencija: Blizanac kojeg smo oduvijek željeli

Forbes

Velika promjena

„DipSik R1 je Sputnjik trenutak za AI“, napisao je milijarder i investitor Mark Andresin (Marc Andreessen) na platformi X.

Uprkos pompi i buci oko nedavnih AI inicijativa administracije Donalda Trampa, DipSik je pojačao strahove da SAD gube prednost u oblasti AI. Posebno zato što je kompanija postigla ovakav uspjeh uprkos strogim američkim izvoznim kontrolama. One joj onemogućavaju korišćenje najnaprednijih Envidija AI čipova. Najnovije dostignuće kompanije predstavlja ozbiljnu kontratežu projektu Stargate. To je zajednički poduhvat OpenAI, Orakla (Oracle) i japanskog tehnološkog konglomerata Softbank. Plan je da se uloži 500 milijardi dolara u AI infrastrukturu.

Uoči sastanka sa republikancima u Floridi u ponedjeljak, Tramp je priznao prijetnju. „Lansiranje DipSika trebalo bi da bude signal upozorenja za naše industrije da moramo biti laserski fokusirani na konkurenciju i pobjedu“, rekao je.

Ograničenja DipSika

Ipak, postoje ograničenja u vezi sa najnovijim uspjehom DipSika. Istraživači su otkrili da njegovi AI modeli imaju tendenciju samocenzure kada je riječ o temama koje su osjetljive za Komunističku partiju Kine (KPK). Bezbjednosna istraživačica Džejn Mančun Vong (Jane Manchun Wong) rekla je za Forbes da DipSik modeli ne odgovaraju na pitanja o kineskom predsiedniku Si Đinpingu (Xi Jinping) i protestima na Trgu Tjenanmen 1989. godine. Pored toga, postoje i zabrinutosti u vezi sa privatnošću. Podaci unijeti u DipSik modele čuvaju se na serverima u Kini, prema njegovim politikama.

Divjanš Kaušik (Divyansh Kaushik), potpredsjednik firme za nacionalnu bezbjednost Beacon Global Strategies, upozorio je za Forbes da ljudi ne koriste DipSik bez temeljne provjere. „Dok ne budemo imali jasne procjene o nacionalnoj bezbjednosti i slobodi govora kineskih modela, treba ih tretirati kao propagandne instrumente KPK“, rekao je on. „Treba ih tretirati kao Huavei na steroidima“,

Problem je u vrijednosti koju DipSik nudi. Najnapredniji AI model koji je besplatan za korišćenje u svijetu zatvorenih i komercijalnih AI modela koje razvijaju kompanije poput OpenAI i Antropika. „Mnogo je bolje imati kineski otvoreni model nego američki zatvoreni“, rekao je Šarma iz Labelbox-a.

Rashi Shrivastava, Richard Nieva, Forbes

The Chinese AI Company Trump Says Is A ‘Wakeup Call’ For Silicon Valley

tagovi

DeepSeek Vještačka inteligencija