Deepseekの驚くほど安価なAIモデルは、業界の規範に挑戦しています。 DeepSeek V3モデルのわずか600万ドルのトレーニングコストを誇っていますが、現実ははるかに複雑です。同社の自己申告の数値は、実質的な調査、洗練、データ処理、インフラストラクチャの費用を省略しています。
DeepSeekのV3モデルは革新的なテクノロジーを利用しています:マルチトークン予測(MTP)同時単語予測、専門家の混合(MOE) 256のニューラルネットワークを採用し、マルチヘッド潜在的注意(MLA) *重要な文化要素に焦点を合わせるために。
画像:Ensigame.com
ただし、セミアン癒合レポートは、はるかに大きな投資を明らかにしています。 Deepseekは、複数のデータセンターで約50,000のNVIDIAホッパーGPUを利用して、大規模な計算インフラストラクチャを運営しており、サーバーの合計投資は約16億ドル、運用コストは9億4,400万ドル近くになります。
画像:Ensigame.com
これは、最小コストの最初の主張と矛盾しています。中国のヘッジファンドであるHigh-Flyerの子会社であるDeepseekは、データセンターを所有しており、管理と迅速なイノベーションを促進しています。その自己資金の性質は敏ility性を高めます。同社は最高の才能を引き付け、一部の研究者は年間130万ドル以上を稼いでいます。
画像:Ensigame.com
Deepseekの実際のAI開発投資は5億ドルを超えています。その無駄のない構造はイノベーションを促進しますが、「革新的な予算」の物語は誤解を招くものです。競合他社との比較は、矛盾を強調しています。DeepSeekのR1モデルの価格は500万ドル、ChatGPT 4は1億ドルかかります。膨らんだ主張にもかかわらず、Deepseekの成功は、十分に資金提供された独立したAI企業が確立された巨人と効果的に競争する可能性を強調しています。
画像:Ensigame.com
最終的に、Deepseekの成功は、奇跡的に低い予算ではなく、実質的な投資、技術の進歩、熟練したチームに由来しています。ただし、真のコストがあっても、競合他社よりもかなり安いままです。