El modelo de IA sorprendentemente económico de Deepseek desafía a los gigantes de la industria. La compañía afirma haber capacitado a su poderosa red neuronal Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, un marcado contraste con los gastos de los competidores. Sin embargo, esta figura es engañosa.
Imagen: Ensigame.com
La arquitectura innovadora de Deepseek V3 contribuye a su eficiencia. Las tecnologías clave incluyen predicción múltiple (MTP), que predice múltiples palabras simultáneamente; Mezcla de expertos (MOE), empleando 256 redes neuronales para un procesamiento mejorado; y atención latente de múltiples cabezas (MLA), centrándose en elementos de oración cruciales para mejorar la precisión.
Imagen: Ensigame.com
Al contrario de su costo publicitado, el semianálisis revela que Deepseek opera una infraestructura masiva de aproximadamente 50,000 GPU NVIDIA, valoradas en aproximadamente $ 1.6 mil millones, con costos operativos que se acercan a $ 944 millones. Esta inversión sustancial, junto con altos salarios para sus investigadores (superiores a $ 1.3 millones anuales), supera significativamente el reclamo inicial de $ 6 millones.
Imagen: Ensigame.com
El éxito de Deepseek proviene de su estructura única: una subsidiaria de High-Flyer, un fondo de cobertura chino, es propietaria de sus centros de datos, fomentando una innovación rápida y la optimización. Su naturaleza autofinanciada mejora la agilidad. Si bien la narrativa "amigable con el presupuesto" es exagerada, la inversión general de Deepseek que supera los $ 500 millones todavía representa un enfoque relativamente delgado.
Imagen: Ensigame.com
El contraste con los competidores es sorprendente. El modelo R1 de Deepseek costó $ 5 millones, en comparación con los $ 100 millones de ChatGPT4O. El ejemplo de Deepseek muestra un camino hacia la competitividad, pero su éxito está innegablemente arraigado en una inversión sustancial y avances tecnológicos, no solo sus costos de capacitación supuestamente bajos. A pesar del reclamo inflado, todavía socava significativamente a los competidores.