Deepseek yang mengejutkan model AI yang murah mencabar norma industri. Walaupun mempunyai kos pra-latihan hanya $ 6 juta untuk model DeepSeek V3, realiti jauh lebih kompleks. Angka yang dilaporkan sendiri oleh syarikat itu menghilangkan penyelidikan, penghalusan, pemprosesan data, dan perbelanjaan infrastruktur yang besar.
Model V3 DeepSeek menggunakan teknologi inovatif: Ramalan Multi-Token (MTP) Untuk Ramalan Word Serentak, Campuran Pakar (MOE) Menggunakan 256 Rangkaian Neural, dan * Perhatian Laten Multi-Head (MLA) * Untuk tumpuan yang lebih baik pada elemen kalimat utama.
imej: ensigame.com
Walau bagaimanapun, laporan semianalisis mendedahkan pelaburan yang jauh lebih besar. DeepSeek mengendalikan infrastruktur pengiraan besar -besaran, menggunakan kira -kira 50,000 GPU NVIDIA Hopper di pelbagai pusat data, yang mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion dan kos operasi berhampiran $ 944 juta.
imej: ensigame.com
Ini bertentangan dengan tuntutan awal kos minimum. Deepseek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memupuk kawalan dan inovasi pesat. Sifat yang dibiayai sendiri meningkatkan ketangkasan. Syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun.
imej: ensigame.com
Pelaburan pembangunan AI sebenar DeepSeek melebihi $ 500 juta. Walaupun struktur kurusnya memudahkan inovasi, naratif "bajet revolusioner" adalah mengelirukan. Perbandingan dengan pesaing menyoroti percanggahan: Model R1 DeepSeek berharga $ 5 juta, manakala CHATGPT 4 berharga $ 100 juta. Walaupun tuntutan yang melambung, kejayaan DeepSeek menggariskan potensi syarikat AI yang dibiayai dengan baik untuk bersaing dengan berkesan dengan gergasi yang ditubuhkan.
imej: ensigame.com
Pada akhirnya, kejayaan DeepSeek berpunca dari pelaburan yang besar, kemajuan teknologi, dan pasukan mahir, bukan anggaran yang ajaib. Walau bagaimanapun, walaupun dengan kos sebenar, ia tetap lebih murah daripada pesaingnya.