La carrera infinita por la IA: DeepSeek y una revolución de corto alcance

Se sintió como un pequeño paso para China, pero un salto gigante para la Inteligencia Artificial. DeepSeek, el primer modelo de lenguaje de extendido chino para uso mundial, fue lanzado a finales de enero de 2025. Lo que puso en alerta a OpenIA y Atrophic, las dos empresas más avanzadas y grandes de esta industria, es que DeepSeek mostró ser casi tan eficiente como ChatGPT y Claude, sus aplicaciones de lenguaje natural, pero a una a fracción de su costo monetario y computacional. Aunque es cuestión de tiempo para que su proeza se desvanezca.

La empresa DeepSeek fue fundada en 2023 por Lian Wenfeng, un ingeniero de sistemas y electrónico, que también es CEO y fundador de la High Flying, empresa que financió a DeepSeek.

Se estima que todo el sistema está montado sobre chips Nvidia A100, que Wenfeng adquirió antes de la escalada de restricciones que EE.UU ha venido imponiendo para vender este hardware en China desde 2022. No se sabe cuántos, pero se estima que toda la IA tiene alrededor de 50.000 chips, emparejando los de Nvidia con otros más baratos y menos refinados, pero que aún se pueden importar.

En broma, se dijo que los chinos habían hecho lo que saben: replicar con materiales más baratos tecnología de punta, o que la IA le había quitado su trabajo a otra IA. Y esto tiene algo de cierto.

El golpe

En el día del lanzamiento de DeepSeek la desarrolladora de procesadores Nvidia perdió 560 mil millones de dólares en el mercado de valores, posiblemente la mayor pérdida en un solo día de la historia. El 27 de enero de 2025 marcó un quiebre en el crecimiento constante que, durante varios años, tuvo la desarrolladora de microchips, el principal hardware sobre el que funcionan Modelos de Lenguaje Extendido, LLM por sus siglas en inglés, pero mejor conocidas como Inteligencias Artificiales.

Hasta ahora, la capacidad de procesamiento de estos softwares se había expandido de la forma más intuitiva: aumentar el número de chips y escalar su poder computacional. Lo que llegó a demostrar DeepSeek es que, utilizándolos de otra manera y entrenando los programas con ciertos parámetros, no es necesario utilizar tantos chips para lograr resultados similares.

Aunque la cifra real se desconoce, se ha insinuado que su desarrollo costó alrededor de 5.5 millones de dólares, frente a los más de 700.000 dólares que cuesta ChatGPT cada día y que, incluso con suscripciones de 200 dólares, está causando pérdidas para su desarrolladora. De acuerdo con IBM, es posible que DeepSeek sea un 96% más económica que ChatGPT.

Otro golpe para OpenAI es que la IA china es de código abierto, lo que significa que cualquier persona puede ver la manera en la que está construída e, incluso, colaborar para mejorarla o utilizarlo para sus propios desarrollos.

Esto es todo lo contrario a la estrategia de negocio de OpenAI que, si bien comenzó con la intención de hacer ChatGPT de código abierto, pronto se decantó por hacerlo privado, supuestamente buscando lograr un producto de mejor calidad, aunque de paso también logró aumentar las ganancias de su empresa.

De acuerdo con el portal de tecnología Xataka, “DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a las empresas de código privado”.

Un último revés que sufrió la empresa detrás de ChatGPT fue descubrir que, aparentemente, DeepSeek se basó o utilizó parte del entrenamiento de aprendizaje por refuerzo con el que entrenaron a ChatGPT.

Aunque es difícil comparar con exactitud las capacidades de las IAs, de acuerdo con el sistema de ranqueo NewsGuard, DeepSeek genera información falsa un 30% del tiempo y no contesta el 53% de las veces, mientras que ChatGPT y las diez principales IAs generan un 40% de respuestas falsas y no responden un 22% de las veces. Otros analistas compararon el desempeño de ambas IA para distintas tareas, como crear código o escribir.

Sin embargo, más allá de las capacidades computacionales de DeepSeek, el verdadero impacto de esta aplicación es la política y la economía detrás, pues esta empresa china demostró que la capacidad de procesamiento de estos softwares no depende exclusivamente de aumentar el número de procesadores, que era la manera como se habían aproximado en EE.UU.

Un sismo geopolítico

El principal miedo de Estados Unidos era perder su supremacía tecnológica ante China y, de alguna manera, se había estado preparando para esto. Como dijimos, desde hace años EE.UU. ha prohibido la venta de chips Nvidia a China, con el fin de frenar el desarrollo de esta tecnología.

Evidentemente estos esfuerzos no bastaron porque, como sostuvo el provocador inventor de Silicon Valley Marc Andreessen, "DeepSeek R1 es el momento Sputnik de la IA”. Por esto, muchos países han restringido o prohibido su uso. Estados Unidos, por supuesto, ha anunciado que presentará una ley para prohibir la aplicación allí, pero la NASA y otras agencias deferales ya la han bloqueado de sus sistemas.

Y EEUU no fue el único. Australia, Corea del Sur, Países Bajos, Taiwán, Canadá e Italia han prohibido y bloqueado el uso de DeepSeek a funcionarios del gobierno. En muchos de estos casos, se ha alertado que la aplicación utiliza abierta censura sobre preguntas que incomodan al gobierno Chino, como la masacre en la plaza de Tiananmen o preguntar sobre la independencia de Hong Kong.

Sin embargo, para el neurocientífico Kenan Malik, lo que realmente reveló este momento es que los modelos de negocio de las IAs están basadas en la anticipación o el ‘hype’. Es decir que parte de su poder económico y social se basa en el interés que tiene la gente por estos sistemas.

Un cabeza a cabeza por la AGI

Menos de dos semanas después de la irrupción de este competidor chino, OpenAI se sacudió el polvo, aceleró procesos y lanzó la versión o3-mini de ChatGPT que, de acuerdo con El País, supera a la IA china en capacidad de procesamiento y resolución de problemas.

Aunque la marea aún no ha bajado completamente, algunos expertos cuestionan el liderazgo que puedan llegar a tener DeepSeek y otras empresas chinas en el largo plazo, pues de todas maneras esta tecnología está vinculada no solo a mejor procesamiento de información, sino a mayor potencia, lo cual implica inevitablemente tener más y mejores chips.

"Se necesita menos computación por unidad de inteligencia, pero la gente va a seguir queriendo más unidades para escalar aún más", explica Miles Brundage, un investigador de políticas sobre IA que trabajó seis años en OpenAI.

El objetivo último de estos sistemas es lo que se conoce como Inteligencia Artificial General o AGI por sus siglas en inglés. La AGI es el punto en que estos sistemas serán capaces de igualar o superar las habilidades que requieran inteligencia humana. Por ahora, las IAs que conocemos se especializan en una parte, DeepSeek y ChatGPT, por ejemplo, se especializan en lenguaje natural, pero aún no logran igualar la sofisticación y el refinamiento con el que los humanos lo utilizamos.

En abril de 2024, Elon Musk dijo que la IA sería “más inteligente que cualquier humano” hacia finales de 2025. Una apuesta similar a la del CEO de OpenAI Sam Altman, quien cree que este año podríamos comenzar a ver los primeros ladrillos de la AGI.

Y es posible que sus pronósticos no estén desfasados. En 2024, la IA de Google quedó segunda durante las Olimpiadas Internacionales de Matemáticas en las que participan los bachilleres más brillantes en esta área. Este año, según se ha conocido, esta IA ha superado por primera vez a todos los concursantes.

Finalmente, a pesar de todos estos avances, el tsunami provocado por DeepSeek dejó muy malherido a otro competidor menos conocido: Meta. La empresa de Zuckerberg ha trabajado durante años en la IA Llama, cuya principal promesa era ser de código abierto, una ventaja que DeepSeek ya cumplió con creces.