DeepSeek: así ha puesto la IA china «low cost» contra las cuerdas a Silicon Valley
Con el inicio del Año de la Serpiente de Madera, un modesto laboratorio de investigación chino en inteligencia artificial, DeepSeek, ha irrumpido en el escenario global para sacudir a las principales firmas del sector y provocar el desplome de sus buques insignia en bolsa. Este nuevo modelo, más eficiente que ChatGPT y un 95% más económico, ha dejado a la industria atónita. Entrenada en apenas 55 días, la plataforma se presenta como un reto formidable para OpenAI y el ambicioso megaproyecto Stargate de la Casa Blanca, diseñado para dominar la IA. Este sorprendente acontecimiento ha sido interpretado por muchos como un primer golpe estratégico del régimen de Xi Jinping contra la nueva administración Trump y su cohorte de oligarcas tecnológicos.
La imagen estereotipada de China a menudo sigue siendo la de una economía manufacturera de capital intensivo, subvencionada por el Estado y centrada en la producción de equipos de bajo coste, como teléfonos inteligentes, paneles solares o vehículos eléctricos. La realidad es que hace tiempo se ha consolidado como una superpotencia mundial del software, superando a Occidente en cuestiones como el comercio electrónico o los servicios financieros digitales.
En este contexto de transformación, el nombre de Liang Wenfeng ha comenzado a resonar con fuerza. Hasta hace unas semanas, su perfil era relativamente bajo. Sin embargo, su reciente encuentro con el primer ministro chino, Li Qiang, en un simposio que reunió a destacados expertos para discutir los logros y desafíos de la segunda economía mundial, marcó el debut público de este nuevo héroe nacional, y elevó su estatus.
Un nuevo jugador en el tablero de la IA
DeepSeek, fundada en 2023 por el discreto empresario chino de 40 años, ha captado la atención de la industria en un tiempo récord. Su reciente lanzamiento de modelos de código abierto a principios de enero le ha catapultado a la cima de las descargas de iPhone, superando incluso a ChatGPT de OpenAI, un referente que pocos habrían pronosticado.
El nuevo esquema de razonamiento avanzado, denominado R1, ha sido aclamado por su notable eficiencia y su bajo costo de desarrollo, posicionándose como un competidor formidable frente a gigantes tecnológicos. Lo que hace excepcional de su ascenso es la capacidad para innovar sin depender de los escasos aceleradores de IA que enfrentan restricciones de exportación desde Estados Unidos. Esta autonomía refuerza su ventaja competitiva, y subraya la resiliencia de navegar en un entorno desafiante.
Este fenómeno ha puesto de relieve cómo la creatividad y las soluciones costo-efectivas pueden ser las claves para desarrollar productos de clase mundial. Su impacto ha resonado más allá de Silicon Valley, extendiéndose hasta Wall Street, donde la atención hacia esta emergente empresa ha crecido de manera exponencial.
En un revelador post en la red social X el día de Año Nuevo, Jim Fan, investigador sénior de Nvidia -la empresa más golpeada, tras perder más de 500.000 millones en bolsa-, calificó a DeepSeek como el "mayor caballo oscuro" del año en modelos de lenguaje de código abierto (LLM) tras el lanzamiento de su modelo actualizado, V3. Fan destacó que este sistema demuestra cómo la escasez de recursos puede impulsar la innovación. Con un presupuesto de solo 5,58 millones de dólares y desarrollado en apenas dos meses, el V3 se creó con una fracción del capital invertido por otras empresas tecnológicas.
Estratega en la intersección de las finanzas y la IA
Mientras los colosos tecnológicos están dirigidos por figuras de renombre, Liang Wenfeng se destaca como un ‘outsider’. Este discreto cuarentón, con raíces en el sector financiero, está desafiando las convenciones de la industria, aportando un enfoque pragmático que lo convierte en un verdadero disruptor.
Fue en Hangzhou, una ciudad emergente que rivaliza con Shenzhen como un centro de innovación y tecnología, donde se graduó en ingeniería informática en la Universidad de Zhejiang. Desde entonces, mostró un interés particular por la maximización de las ganancias en los mercados bursátiles a través de la tecnología.
El colapso del mercado bursátil de 2015, que arrastró a millones de inversores minoristas, creó un terreno fértil para ‘traders’ astutos. En este contexto, lanzó su segundo fondo de cobertura cuantitativo, High-Flyer, que, a pesar de las crecientes críticas del gobierno a la especulación financiera, logró rendimientos notables. Sus activos bajo gestión aumentaron de 1.000 millones de yuanes (unos 130 millones de euros) en 2016 a 10.000 millones de yuanes en 2019.
Con un enfoque exclusivo en el trading algorítmico basado en IA, el ingeniero se dio cuenta de la necesidad de robustecer la capacidad computacional de su fondo. Entre 2019 y 2020, High-Flyer invirtió 26 millones de euros en su primer superordenador, seguido de una inversión adicional de 130 millones de euros para construir otro. Esta asignación permitió la adquisición de 10.000 tarjetas gráficas A100 de última generación de Nvidia, fundamentales para las capacidades de inteligencia artificial.
Sin embargo, el panorama cambió drásticamente en 2022, cuando Washington intensificó las restricciones sobre la exportación de tecnología avanzada a China, prohibiendo a Nvidia la venta de sus chips más potentes. Esta decisión no sólo complicó las operaciones de fondos como High-Flyer, también subraya la creciente tensión entre las potencias, obligando a una reevaluación de las estrategias en un mercado cada vez más limitado.
La habilidad de Liang para detectar tendencias mediante IA le han permitido llevar a cabo proyectos ambiciosos sin la presión de inversores externos. Esta independencia le otorga la libertad de enfocarse en la investigación y el desarrollo a largo plazo, crucial en un contexto económico incierto.
"Cuando lo conocimos, era un tipo muy 'friki' con un peinado peculiar que hablaba de crear un clúster de 10.000 chips para entrenar sus propios modelos. No lo tomamos en serio", confesó un socio en una entrevista con el Financial Times. "Pensamos que eso solo era posible para gigantes como ByteDance y Alibaba". Sin embargo, su visión está comenzando a dar resultados, consolidándose como un actor relevante en este dinámico sector.
Listo para desafiar a las grandes corporaciones tecnológicas, ha reunido a una élite de jóvenes talentos de prestigiosas universidades chinas, brindando compensaciones competitivas. Su equipo, aunque novel, está preparado para crear soluciones disruptivas desde cero.
Transformando el panorama de la IA en tiempo récord
En noviembre de 2023, DeepSeek hizo su entrada en el mercado con el lanzamiento de su primer modelo de inteligencia artificial, Coder, un sistema de código abierto enfocado en tareas de programación. Este lanzamiento marcó el comienzo de una serie de innovaciones que rápidamente llamaron la atención de la industria. Un hito significativo fue el lanzamiento de un modelo de 67 mil millones de parámetros, que se posicionó como un competidor serio en el ámbito de los modelos lingüísticos. Sin embargo, fue la presentación de DeepSeek-V2 en mayo de 2024 la que realmente sacudió el mercado chino. Con un rendimiento excepcional y costos bajos, provocó una guerra de precios entre gigantes como ByteDance, Tencent, Baidu y Alibaba, quienes se vieron obligados a ajustar sus tarifas para mantenerse competitivos.
El punto culminante de esta expectación se alcanzó el pasado lunes, cuando se anunció que su chatbot, impulsado por el modelo de razonamiento R1, se convirtió en la aplicación gratuita más descargada en las tiendas de Apple, tanto en Estados Unidos como en el gigante asiático.
La euforia china perjudicó a varios gigantes tecnológicos estadounidenses, ya que los inversores se preguntaron si el avance de DeepSeek socavaba la justificación de su colosal gasto en infraestructuras de IA. Los valores tecnológicos y energéticos estadounidenses perdieron el lunes 1.000 millones de dólares de su valor de mercado, aunque recuperaron algo de terreno a finales de la semana.
A diferencia de otras startups chinas de IA, que han conseguido recaudar más de 20.000 millones de yuanes en 2024, ha optado por no buscar financiación externa a corto plazo. Esta decisión estratégica sugiere un enfoque deliberado en el desarrollo autónomo y la sostenibilidad, lo que podría permitirle navegar de manera más efectiva en un entorno regulatorio complejo.