DeepSeek: La disrupción de la IA
Por Alicia Bañuelo para La Opinion
DeepSeek, la innovadora IA china, sorprendió al mundo y provocó una caída del 17% en el valor de las acciones de NVIDIA en Wall Street, afectando también a otras empresas tecnológicas.
Hasta ahora, entrenar a los mejores modelos de IA era increíblemente caro. Empresas como OpenAI, Google, Meta, Microsoft, invierten más de 100 millones de dólares solo en hardware especializado, necesitando centros de datos enormes con miles de GPU de 40.000 dólares por unidad.

DeepSeek, sin embargo, ha replanteado todo desde cero y ha logrado hacer lo mismo por solo 5,6 millones de dólares. En lugar de usar un número con 32 decimales, utilizan 8 decimales, lo que reduce la memoria necesaria en un 75%.
Los modelos de DeepSeek igualan o superan a las estadounidenses GPT-4 (Open AI) y Claude (Anthropic) en muchas tareas.
Además, crearon un «sistema experto» que activa solo a los especialistas necesarios en lugar de tener una IA masiva que intenta saberlo todo. Esto significa que, aunque DeepSeek utiliza 671 mil millones de parámetros en total, solo 37 mil millones están activos a la vez mientras que en las que las otras utilizan 1,8 billones de parámetros que están activos todo el tiempo.
Los resultados son impresionantes:
Costo de entrenamiento: U$S 100 Millones → U$S 5,6 Millones
GPU necesarias: 100.000 → 2.000
Costos: 95% más baratos
Puede ejecutarse en GPU para juegos en lugar de hardware especializado (estas no se exportan a China).
Lo más sorprendente es que todo es de código abierto. Cualquiera puede comprobar su trabajo, ya que el código es público y los documentos técnicos explican todo. Esto rompe con el modelo de que solo las grandes empresas tecnológicas pueden participar en la IA.

Para NVIDIA, esto es aterrador, ya que su modelo de negocio se basa en la venta de GPU con márgenes del 90%. DeepSeek lo logró con un equipo de menos de 200 personas. Esta es una historia clásica de disrupción: los incumbentes optimizan los procesos existentes, mientras que los disruptores replantean el enfoque fundamental.
Las implicaciones son enormes:
El desarrollo de IA se vuelve más accesible.
La competencia aumenta drásticamente.
Las ventajas competitivas de las grandes empresas tecnológicas parecen ahora más bien desventajas.
Los requisitos de hardware (y los costos) se desploman.
Gigantes como OpenAI, Anthropic y el resto, probablemente ya estén implementando estas innovaciones, pero el genio de la eficiencia ya salió de la botella.
La IA está a punto de volverse mucho más accesible y barata. La pregunta es con qué rapidez afectará a los actores actuales. Trump anunció STARGATE con 500.000 millones de dólares (OpenAI, SoftBank, Oracle). Qué época interesante no toca presenciar, la maldición china a pleno.
China supera al mundo en muchas tecnologías, aunque EEUU y la Comunidad Europea le ponen trabas, embargos y aranceles a productos chinos, la discusión sobre el papel del estado se cierra sola.

Resumiendo:
Los resultados de DeepSeek son notables, con una reducción significativa en los costos de entrenamiento de la IA, el número de GPU necesarias y los costos de de la interfaz de programación de aplicaciones (API) para integrar modelos de IA en proyectos. Además, su modelo de código abierto desafía el dominio de las grandes empresas tecnológicas en el desarrollo de la IA, haciéndolo más accesible para una gama más amplia de organizaciones.
Esta disrupción tiene implicaciones significativas para la industria de la IA, lo que podría conducir a una mayor competencia, una disminución de las barreras de entrada y una accesibilidad y asequibilidad mucho mayores para el desarrollo de la IA.
El éxito de DeepSeek subraya el papel de China como líder tecnológico y plantea interrogantes sobre la futura dinámica de la industria de la IA.