DipSik lansirao novu generaciju AI modela – evo po čemu se razlikuje

featured image

30. sep 2025. 18:48

Kineski startap DipSik (DeepSeek) predstavio je najnoviji eksperimentalni model koji obećava veću efikasnost i bolju sposobnost vještačke inteligencije da obrađuje velike količine informacija uz djelić dosadašnjih troškova. Ipak, ostaju pitanja koliko je arhitektura zaista djelotvorna i bezbjedna.

DipSik je prošle godine iznenadio Silicijumsku dolinu kada je niotkuda lansirao svoj prvi model R1, pokazujući da je moguće brzo obučavati velike jezičke modele (LLM) na slabijim čipovima i uz manje resursa.

Kompanija je u ponedjeljak objavila DeepSeek-V3.2-Exp, eksperimentalnu verziju sadašnjeg modela DeepSeek-V3.1-Terminus, koja dodatno razvija misiju povećanja efikasnosti AI sistema, navodi se u objavi na forumu Hugging Face.

„DeepSeek V3.2 nastavlja da se fokusira na efikasnost, smanjenje troškova i otvoreno dijeljenje koda“, rekla je Adina Jakefu (Adina Yakefu), rukovoditeljka kineske zajednice na Hugging Face-u, za CNBC. „Veliko unapređenje je nova funkcija pod nazivom DSA (DeepSeek Sparse Attention), koja omogućava bolju obradu dugih dokumenata i razgovora. Takođe prepolovljava troškove rada modela u odnosu na prethodnu verziju.“

„To je značajno jer bi model trebalo da bude brži i isplativiji za korišćenje, bez primjetnog pada u performansama“, dodao je Nik Pejšens (Nick Patience), potpredsjednik i AI analitičar u The Futurum Group. „Ovo čini moćnu AI tehnologiju dostupnijom diveloperima, istraživačima i manjim kompanijama, što može dovesti do talasa novih i inovativnih aplikacija.“

Foto: Shutterstock

Prednosti i mane „sparse attention“ pristupa

Model veštačke inteligencije donosi odluke na osnovu podataka o obuci i novih informacija, kao što je prompt. Primjera radi, ako aviokompanija traži najbolju rutu od tačke A do B, postoje mnoge opcije, ali nisu sve realne. Filtriranjem manje izvedivih ruta štedi se vrijeme, gorivo i novac. To je upravo ono što radi sparse attention – uzima u obzir samo podatke koje smatra važnim za zadati zadatak, dok dosadašnji modeli obrađuju sve podatke.

„U suštini, izbacuju se stvari koje nijesu važne“, objašnjava Jekaterina Almask (Ekaterina Almasque), suosnivačica i partner u investicionom fondu BlankPage Capital.

Sparse attention donosi veću efikasnost i skalabilnost jer zahtijeva manje resursa. Ipak, postoji bojazan da bi mogao da umanji pouzdanost modela, jer nije uvijek jasno zašto i na osnovu čega se određeni podaci odbacuju.

„Realnost je da ovi modeli gube mnogo nijansi“, kaže Almask. „Pravo pitanje je – imaju li pravi mehanizam da isključe nebitne podatke ili se možda isključuju i zaista važni, pa je rezultat mnogo manje relevantan?“

To bi moglo predstavljati poseban problem za bezbjednost i inkluzivnost AI-ja, dodaje ona, ističući da ovakav pristup možda nije „ni optimalan ni najsigurniji“ u poređenju s konkurencijom ili tradicionalnim arhitekturama.

Kineski čipovi i otvoreni kod

DipSik, međutim, tvrdi da eksperimentalni model radi jednako dobro kao i V3.1-Terminus. Uprkos pričama o „balonu“ na tržištu, AI ostaje u centru geopolitičkog nadmetanja između SAD i Kine. Jakefu ističe da DipSik modeli rade „odmah po instalaciji“ na kineskim čipovima kao što su Ascend i Cambricon, što znači da se mogu pokretati lokalno, bez dodatne pripreme.

Kompanija je podijelila i programski kod i alate potrebne za korišćenje eksperimentalnog modela. „To znači da drugi mogu učiti iz njega i graditi sopstvena unapređenja“, kaže Jakefu.

Za Almask, upravo to što je tehnologija otvorena znači da nije lako odbraniti konkurentsku prednost. „Pristup nije potpuno nov“, ističe ona, podsjećajući da se o sparse modelima govori još od 2015. godine, te da DipSik ne može da patentira rješenje jer je riječ o open-source tehnologiji. Prednost kompanije, prema njenim riječima, leži u načinu kako bira podatke koje će uključiti.

Sama kompanija priznaje da je V3.2-Exp „srednji korak ka našoj arhitekturi nove generacije“, navodi se u objavi na Hugging Face-u.

Kako zaključuje Pejšens, „to je upravo vrijednost DipSik-a: efikasnost postaje jednako važna kao i sirova snaga“.

„DipSik igra na duge staze kako bi zajednica ostala uz njih“, dodaje Jakefu. „Ljudi će uvijek birati ono što je jeftino, pouzdano i efikasno.“