NVIDIA acaba de lanzar sus nuevos sistemas GB300 NVL72. Pueden manejar 50 veces más trabajo por megavatio de electricidad en comparación con la antigua plataforma Hopper. Eso significa que los costos se reducen 35 veces por cada pieza de información procesada.
Signal65 realizó pruebas independientes en el GB200 NVL72 y descubrió que procesa más de 10 veces la información por vatio, reduciendo los costos a una décima parte de lo que eran.
Las mejoras continúan llegando. Solo las actualizaciones de la biblioteca TensorRT-LLM de NVIDIA le dieron al GB200 un impulso de rendimiento de cinco veces en solo cuatro meses para tareas que necesitan respuestas instantáneas. Los equipos que trabajan en las herramientas Dynamo, Mooncake y SGLang están impulsando la eficiencia aún más.
Estas herramientas de IA se descomponen si hay tiempo de retraso o no pueden recordar suficiente contexto. Las empresas necesitan que realmente funcionen en situaciones comerciales reales, no solo en demostraciones.
Las herramientas de inteligencia artificial que escriben código y funcionan como asistentes digitales ahora representan casi la mitad de todas las búsquedas relacionadas con IA, frente al 11% de hace un año.
Los números provienen del informe State of Inference de OpenRouter y muestran lo rápido que están cambiando las cosas en este espacio.
Este salto repentino tiene a las empresas luchando por construir hardware que pueda mantener el ritmo. Estos asistentes de IA necesitan responder de inmediato y recordar el contexto de proyectos de software completos, lo que pone serias demandas en la potencia de cómputo.
La explosión del mercado alimenta la batalla de los gigantes tecnológicos por el dominio
El dinero involucrado es enorme. El mercado de Agente de IA valía 4,92 mil millones de dólares en 2024. Las estimaciones lo sitúan en 6.016 mil millones de dólares para 2025, y luego se expandirá a 44,97 mil millones de dólares para 2035. Eso es un crecimiento del 22,28% cada año durante la próxima década. Los bancos, hospitales, tiendas y fábricas son los primeros en adoptarlo.
Las empresas están integrando estos agentes en sistemas de gestión de clientes, herramientas de planificación y configuraciones de seguridad para ahorrar dinero y hacer más. Lo que comenzó como tecnología opcional se está convirtiendo en infraestructura básica.
Según informó Cryptopolitan, Alibaba acaba de lanzar Qwen3.5 dirigido al mercado de China, afirmando costos de procesamiento un 60% más bajos que antes. El modelo puede mirar pantallas y realizar tareas en teléfonos y computadoras. Está compitiendo cara a cara con la aplicación Doubao de ByteDance, y también viene una actualización de DeepSeek.
OpenAI contrató a Peter Steinberger el día 15. Él construyó OpenClaw, un Agente de IA de código abierto. El CEO Sam Altman dijo que Steinberger liderará el trabajo en agentes personales de próxima generación y lo llamó un genio con grandes ideas sobre asistentes inteligentes que pueden hacer cosas útiles.
La crisis de talento que nadie puede resolver
El 94% de los líderes empresariales dicen que tienen escasez de habilidades de IA. Para 2028, el 44% espera tener todavía escaseces del 20 al 40%. Workera dice que estas brechas podrían costarle a la economía global 5,5 billones de dólares en 2026 por productos retrasados, problemas de calidad y ventas perdidas.
En este momento, la demanda de talento de IA supera a la oferta 3,2 a uno en todo el mundo. Los trabajos de IA pagan un 67% más que los puestos regulares de software. Sin embargo, el 85% de los trabajadores de oficina están aprendiendo sobre esto en su propio tiempo, y el 83% dice que se están enseñando a sí mismos principalmente en lugar de recibir capacitación formal.
Cuando las empresas compran herramientas de IA de proveedores especializados, tienen éxito el 67% de las veces. Las construcciones internas solo funcionan aproximadamente un tercio de las veces.
Salesforce vio un crecimiento del 119% en agentes a principios de 2025 y superó los 500 millones de dólares en ingresos recurrentes para estos productos. Agregaron 6.000 clientes empresariales en tres meses.
Las empresas probablemente comprarán soluciones en lugar de construirlas. Eso apunta a que el mercado se concentre alrededor de algunos grandes actores que puedan entregar lo que realmente funciona.
Fuente: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/

