Kineski DeepSeek lansirao novi model veštačke inteligencije: Spušta cene za 50 odsto
Sumirano
- DeepSeek objavio eksperimentalni model DeepSeek-V3.2-Exp
- Model efikasniji u učenju i obradi dugih nizova teksta
- Model bi mogao pritisnuti konkurente
Kineska kompanija za razvoj veštačke inteligencije DipSik (DeepSeek) objavila je svoj najnoviji eksperimentalni model, za koji tvrdi da je efikasniji u učenju i bolji u obradi dugih nizova teksta od svojih prethodnih iteracija velikih jezičkih modela.
Kompanija sa sedištem u Hangdžouu nazvala je model DeepSeek-V3.2-Exp, navodeći na forumu za razvojne programere Hugging Face da predstavlja korak ka njihovoj arhitekturi naredne generacije.
Ta arhitektura će verovatno biti najznačajnije izdanje proizvoda startapa otkako su modeli V3 i R1 izazvali pažnju Silicijumske doline i tehnoloških investitora van Kine.
Model V3.2-Exp uključuje mehanizam nazvan DeepSeek Sparse Attention, za koji kineska kompanija tvrdi da može smanjiti troškove računanja i poboljšati performanse određenih tipova modela. DeepSeek je u ponedeljak na platformi Iks objavio da snižava cene interfejsa za programiranje aplikacija (API) za više od 50 odsto.
Iako je malo verovatno da će arhitektura naredne generacije startapa DeepSeek potresti tržišta kao što su to učinile prethodne verzije u januaru, i dalje bi mogla značajno pritisnuti domaće konkurente poput Alibabinog Qwena i američke rivale poput OpenAI-a, ukoliko ponovi uspeh DeepSeeka R1 i V3.
To bi od modela zahtevalo da pokaže visok nivo sposobnosti, a istovremeno koristi samo deo resursa koje konkurenti naplaćuju i troše na obuku modela.
(Ubrzanje.rs/Magazin HRT)