El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. Mientras cuenta con solo un costo previo a la capacitación de $ 6 millones para su modelo V3 Deepseek, la realidad es mucho más compleja. La cifra autoinformada de la Compañía omite la investigación sustancial, el refinamiento, el procesamiento de datos y los gastos de infraestructura.
El modelo V3 de Deepseek utiliza tecnologías innovadoras: Predicción de token múltiple (MTP) Para predicción de palabras simultáneas, Mezcla de expertos (MOE) Empleando 256 redes neuronales y Atención latente de múltiples cabezas (MLA) * Para mejorar el enfoque en los elementos clave de las oraciones.
Imagen: Ensigame.com
Sin embargo, un informe de semianálisis revela una inversión mucho más sustancial. Deepseek opera una infraestructura computacional masiva, utilizando aproximadamente 50,000 GPU de la tolva nvidia en múltiples centros de datos, que representa una inversión total del servidor de aproximadamente $ 1.6 mil millones y costos operativos cerca de $ 944 millones.
Imagen: Ensigame.com
Esto contradice el reclamo inicial de un costo mínimo. Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, fomentando el control y la rápida innovación. Su naturaleza autofinanciada mejora la agilidad. La compañía atrae al máximo talento, con algunos investigadores ganando más de $ 1.3 millones anuales.
Imagen: Ensigame.com
La inversión real de desarrollo de IA de Deepseek supera los $ 500 millones. Si bien su estructura magra facilita la innovación, la narrativa del "presupuesto revolucionario" es engañosa. Una comparación con los competidores destaca la discrepancia: el modelo R1 de Deepseek cuesta $ 5 millones, mientras que ChatGPT 4 costó $ 100 millones. A pesar de las afirmaciones infladas, el éxito de Deepseek subraya el potencial de las compañías de IA independientes bien financiadas para competir de manera efectiva con los gigantes establecidos.
Imagen: Ensigame.com
En última instancia, el éxito de Deepseek proviene de una inversión sustancial, avances tecnológicos y un equipo calificado, no un presupuesto milagrosamente bajo. Sin embargo, incluso con sus verdaderos costos, sigue siendo significativamente más barato que sus competidores.