DeepSeek의 놀랍도록 저렴한 AI 모델은 업계 규범에 도전합니다. Deepseek V3 모델의 6 백만 달러에 불과한 6 백만 달러의 사전 훈련 비용을 자랑하는 동안 현실은 훨씬 더 복잡합니다. 이 회사의 자체보고 된 수치는 상당한 연구, 개선, 데이터 처리 및 인프라 비용을 생략합니다.
DeepSeek의 V3 모델은 혁신적인 기술을 사용합니다. 동시 단어 예측을 위해 MTP (Multi-Token Prediction) 전문가 혼합 (MOE) 256 개의 신경 네트워크 사용 및 MLA (Multi-Head Latent Interetic) * 주요 문장 요소에 중점을 둔 개선.
이미지 : ensigame.com
그러나 Semianalysis 보고서는 훨씬 더 많은 투자를 보여줍니다. DeepSeek은 여러 데이터 센터에서 약 50,000 개의 NVIDIA HOPPER GPU를 활용하여 대규모 계산 인프라를 운영하며, 총 서버 투자는 약 16 억 달러의 총 서버 투자와 9 억 9,400 만 달러에 가까운 운영 비용을 나타냅니다.
이미지 : ensigame.com
이는 최소 비용의 초기 청구와 모순됩니다. 중국 헤지 펀드 인 High-Flyer의 자회사 인 Deepseek는 데이터 센터를 소유하고 제어 및 빠른 혁신을 장려합니다. 자체 자금을 지원하는 자연은 민첩성을 향상시킵니다. 이 회사는 최고의 인재를 유치하며 일부 연구자들은 매년 130 만 달러 이상을 벌고 있습니다.
이미지 : ensigame.com
DeepSeek의 실제 AI 개발 투자는 5 억 달러를 초과합니다. 마른 구조는 혁신을 촉진하지만 "혁명 예산"이야기는 오해의 소지가 있습니다. 경쟁사와의 비교는 불일치를 강조합니다. DeepSeek의 R1 모델은 5 백만 달러, Chatgpt 4는 1 억 달러입니다. 팽창 된 주장에도 불구하고, Deepseek의 성공은 잘 자금을 지원하는 독립 AI 회사가 기존 거인들과 효과적으로 경쟁 할 수있는 잠재력을 강조합니다.
이미지 : ensigame.com
궁극적으로 DeepSeek의 성공은 기적적으로 낮은 예산이 아닌 상당한 투자, 기술 발전 및 숙련 된 팀에서 비롯됩니다. 그러나 실제 비용으로도 경쟁 업체보다 훨씬 저렴합니다.