Ang nakakagulat na Deepseek ay murang mga hamon sa modelo ng AI na mga pamantayan sa industriya. Habang ipinagmamalaki ang isang $ 6 milyon na pre-pagsasanay na gastos para sa modelo ng Deepseek V3, ang katotohanan ay mas kumplikado. Ang figure na naiulat ng sarili ng kumpanya ay tinanggal ang malaking pananaliksik, pagpipino, pagproseso ng data, at mga gastos sa imprastraktura.
Ang modelo ng V3 ng Deepseek ay gumagamit ng mga makabagong teknolohiya: Multi-Token Prediction (MTP) Para sa sabay-sabay na hula ng salita, pinaghalong mga eksperto (MOE) na gumagamit ng 256 neural network, at * multi-head latent pansin (MLA) * Para sa pinahusay na pagtuon sa mga pangunahing elemento ng pangungusap.
Imahe: ensigame.com
Gayunpaman, ang isang ulat ng semianalysis ay nagpapakita ng isang mas malaking pamumuhunan. Ang Deepseek ay nagpapatakbo ng isang napakalaking imprastraktura ng computational, na gumagamit ng humigit -kumulang na 50,000 NVIDIA HOPPER GPU sa maraming mga sentro ng data, na kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon at mga gastos sa pagpapatakbo malapit sa $ 944 milyon.
Imahe: ensigame.com
Taliwas ito sa paunang pag -angkin ng kaunting gastos. Ang Deepseek, isang subsidiary ng high-flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data nito, pag-aalaga ng kontrol at mabilis na pagbabago. Ang kalikasan na pinondohan ng sarili ay nagpapabuti ng liksi. Ang kumpanya ay umaakit sa nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon.
Imahe: ensigame.com
Ang aktwal na pamumuhunan ng development ng Deepseek ay lumampas sa $ 500 milyon. Habang ang sandalan na istraktura nito ay nagpapadali sa pagbabago, ang salaysay na "rebolusyonaryong badyet" ay nakaliligaw. Ang paghahambing sa mga kakumpitensya ay nagtatampok ng pagkakaiba -iba: Ang modelo ng R1 ng Deepseek ay nagkakahalaga ng $ 5 milyon, habang ang Chatgpt 4 ay nagkakahalaga ng $ 100 milyon. Sa kabila ng napalaki na pag-angkin, ang tagumpay ng Deepseek ay binibigyang diin ang potensyal ng mahusay na pondo na independiyenteng mga kumpanya ng AI upang makipagkumpetensya nang epektibo sa mga itinatag na higante.
Imahe: ensigame.com
Sa huli, ang tagumpay ng Deepseek ay nagmula sa malaking pamumuhunan, pagsulong sa teknolohiya, at isang bihasang koponan, hindi isang mahimalang mababang badyet. Gayunpaman, kahit na sa totoong gastos nito, nananatiling mas mura ito kaysa sa mga katunggali nito.