Enable javascript in your browser for better experience. Need to know to enable it? Go here.

DeepSeek: Cinco cosas que líderes empresariales y tecnológicos deben saber

DeepSeek ha sacudido el mundo de los negocios y la tecnología. En medio de titulares sobre tensiones geopolíticas y caídas en los precios de las acciones, comprender exactamente qué significan los nuevos modelos de IA de DeepSeek para las empresas, desde la estrategia de IA a largo plazo hasta la experimentación tecnológica del día a día, puede ser un desafío.

 

Para ayudar a líderes tecnológicos y empresariales a contextualizar este panorama, respondemos cinco preguntas clave que pueden guiar sus próximos pasos, sin importar cómo evolucione el ciclo de noticias y el hype en las próximas semanas y meses.

 

¿Por qué DeepSeek está en las noticias?

 

DeepSeek es una startup china que lanzó dos nuevos modelos de IA —DeepSeek-R1 y DeepSeek R1-Zero, el 20 de enero de 2025. Ha captado la atención mediática porque su rendimiento parece estar a la par de competidores como Llama, Gemini, Claude y el modelo de "razonamiento" ChatGPT o1. Esto es particularmente notable dado que, según los reportes, fue entrenado con chips NVIDIA menos avanzados que los de gama alta utilizados por otros proveedores consolidados. (NVIDIA diseñó estos chips de manera que cumplan con las regulaciones del gobierno de EE.UU. sobre exportaciones a China, limitando su velocidad de interconexión, algo que los ingenieros de DeepSeek lograron mitigar con un enfoque innovador en su código).

 

Las repercusiones han sido significativas. El valor de mercado de NVIDIA ha caído en casi 600 mil millones de dólares, y la industria tecnológica de EE.UU. en general se ha visto sacudida ante el hecho de que una empresa china haya logrado competir en este terreno, incluso con acceso a hardware aparentemente inferior.

 

¿DeepSeek reducirá el costo de usar IA para las empresas?

 

DeepSeek-R1 está disponible en varios tamaños más pequeños y optimizados, lo que permite ejecutarlo en hardware estándar. Esto es importante porque poder ejecutar un modelo con un rendimiento similar a ChatGPT o1 sin depender de costos de API de terceros representa un cambio significativo. Es especialmente relevante en casos como la IA agentiva, donde la IA requiere múltiples ciclos de procesamiento para completar tareas complejas.

Aunque no es fácil determinar exactamente cuánto más barato será, se estima que el hardware utilizado por DeepSeek es entre 20 y 50 veces más económico que el de OpenAI. Algunas voces en la industria han cuestionado esta cifra, pero hay fuertes indicios de que es precisa. En teoría, esto debería hacer que la IA sea más accesible para las empresas, ya que no solo el entrenamiento del modelo es más barato, sino que su implementación y uso en aplicaciones también lo serían.

 

Sin embargo, esta es solo una hipótesis; quedan muchas preguntas por responder. Por ejemplo, la infraestructura más económica de DeepSeek podría implicar sacrificios aún no identificados. Además, es importante recordar la Paradoja de Jevons: cuando la eficiencia mejora, en lugar de reducir costos como se esperaría, la demanda aumenta, lo que puede terminar compensando la reducción de precios.

Mike Mason, Thoughtworks
Lo que DeepSeek parece haber logrado probablemente fomente un enfoque aún mayor en la eficiencia: hacer más con menos.
Mike Mason
Chief AI Officer, Thoughtworks
Lo que DeepSeek parece haber logrado probablemente fomente un enfoque aún mayor en la eficiencia: hacer más con menos.
Mike Mason
Chief AI Officer, Thoughtworks

¿DeepSeek reducirá el consumo de energía?

 

Los modelos de DeepSeek sugieren que es posible alcanzar un estándar de rendimiento increíblemente alto sin la misma escala de electricidad requerida por otros modelos establecidos. Como consecuencia, muchas compañías energéticas vieron una caída en el valor de sus acciones. Uno de los posibles beneficios, sin embargo, es que podría impulsar la adopción de la computación sustentable, en la cual los impactos ambientales de la computación se abordan a través de una mayor eficiencia. (Dicho esto, esto también podría llevarnos nuevamente a la Paradoja de Jevons, donde el consumo de energía aumentará a medida que se logren ganancias en eficiencia).

 

¿Qué significa esto para empresas como OpenAI y Google? Todavía está por verse. Estas empresas han planeado grandes inversiones en centros de datos y recursos en los próximos años: si DeepSeek realmente ha demostrado que es posible hacer más con menos, quizás veamos a estas empresas cambiar de rumbo. Aunque esto es solo especulación por ahora, no hay duda de que DeepSeek está obligando a la industria a repensar cuánta energía se requiere para construir y ejecutar un sistema de IA efectivo.

 

¿Esto impulsará otra ola de innovación en IA?

 

Lo que DeepSeek parece haber logrado probablemente fomente un mayor enfoque en la eficiencia: hacer más con menos. Los desafíos en el campo generalmente se han planteado en términos de escala: más poder de cómputo, entrenamiento de modelos más intensivo, modelos más grandes. Una de las mayores lecciones de DeepSeek es que quizás haya formas de innovar en IA que no requieren mayor escala, sino ingenio y optimización.

 

También vale la pena señalar que DeepSeek R-1 es lo que llamamos "casi abierto": abierto, pero sin cumplir completamente los requisitos estrictos para ser considerado open source. Esto significa que puede adaptarse y usarse de maneras en las que los sistemas propietarios no pueden, desafiando posiblemente el dominio actual de los modelos propietarios. Cuando combinas esto con la reducción de costos, se abre potencialmente la puerta para que un conjunto completamente nuevo de empresas considere sus opciones para construir sus propios modelos.

 

¿Cuáles deberían ser mis próximos pasos?

 

El panorama de la IA avanza tan rápido que avances como este seguirán ocurriendo. Por eso, es vital asegurarse de que el pipeline de experimentación y el proceso de evaluación de herramientas sean lo suficientemente ágiles para adaptarse al cambio. Nunca se sabe, podríamos obtener otro nuevo modelo de un proveedor diferente la próxima semana.

En este momento, sin embargo, hay muchos casos de uso potenciales que vale la pena explorar, desde construir una aplicación de chat simple hasta aprovecharlo para programación. Es innegablemente poderoso, así que experimenta con lo que puedas hacer con él. Andrew Ng señaló en LinkedIn que "la capa de modelos fundacionales siendo hipercompetitiva es excelente para las personas que construyen aplicaciones"; sin duda, es un momento emocionante para las organizaciones que buscan llevar la IA generativa a entornos de producción.

 

Dicho todo esto, sigue siendo importante tener en cuenta los riesgos de privacidad. Si bien esto es cierto para cualquier modelo de IA que utilices, algunos expertos en seguridad y privacidad han instado a tener especial precaución. Han expresado preocupación por cómo el gobierno chino podría aprovechar los datos de DeepSeek.

 

En Thoughtworks, nos entuciasma experimentar con DeepSeek y alentamos a la industria en general a evaluar continuamente y compartir el valor que obtienen de él. En última instancia, así es como aprendemos e innovamos. Más importante aún, nos ayudará a seguir brindando más valor a clientes.

¿Necesitas ayuda para hacer que la IA funcione para ti?