NVIDIA ha appena lanciato i suoi nuovi sistemi GB300 NVL72. Possono gestire 50 volte più lavoro per megawatt di elettricità rispetto alla vecchia piattaforma Hopper. Ciò significa che i costi si riducono di 35 volte per ogni elemento di informazione elaborato.
Signal65 ha effettuato test separati sul GB200 NVL72 e ha scoperto che elabora più di 10 volte le informazioni per watt, riducendo i costi a un decimo di quello che erano.
I miglioramenti continuano ad arrivare. I soli aggiornamenti della libreria TensorRT-LLM di NVIDIA hanno dato al GB200 un incremento delle prestazioni di cinque volte in soli quattro mesi per attività che richiedono risposte istantanee. I team che lavorano sugli strumenti Dynamo, Mooncake e SGLang stanno spingendo l'efficienza ancora più in alto.
Questi strumenti basati su IA si guastano se c'è tempo di ritardo o non riescono a ricordare abbastanza contesto. Le aziende hanno bisogno che funzionino effettivamente in situazioni aziendali reali, non solo in demo.
Gli strumenti di intelligenza artificiale che scrivono codice e funzionano come assistenti digitali rappresentano ora quasi la metà di tutte le ricerche relative all'IA, rispetto all'11% di un anno fa.
I numeri provengono dal rapporto State of Inference di OpenRouter e mostrano quanto velocemente le cose stanno cambiando in questo settore.
Questo improvviso salto ha le aziende che si affrettano a costruire hardware in grado di tenere il passo. Questi assistenti basati su IA devono rispondere immediatamente e ricordare il contesto di interi progetti software, il che pone serie richieste alla potenza di calcolo.
L'esplosione del mercato alimenta la battaglia dei giganti tecnologici per il dominio
Il denaro coinvolto è enorme. Il mercato degli agenti IA valeva 4,92 miliardi di dollari nel 2024. Le stime lo collocano a 6,016 miliardi di dollari per il 2025, per poi gonfiarsi a 44,97 miliardi di dollari entro il 2035. Si tratta di una crescita del 22,28% ogni anno per il prossimo decennio. Banche, ospedali, negozi e fabbriche sono i primi ad adottarli.
Le aziende stanno inserendo questi agenti nei sistemi di gestione dei clienti, strumenti di pianificazione e configurazioni di sicurezza per risparmiare denaro e ottenere di più. Quella che è iniziata come tecnologia opzionale sta diventando infrastruttura di base.
Come riportato da Cryptopolitan, Alibaba ha appena lanciato Qwen3.5 rivolgendosi al mercato cinese, sostenendo costi di elaborazione inferiori del 60% rispetto a prima. Il modello può guardare gli schermi ed eseguire attività su telefoni e computer. Sta andando testa a testa con l'app Doubao di ByteDance, e c'è anche un aggiornamento DeepSeek in arrivo.
OpenAI ha assunto Peter Steinberger il 15. Ha costruito OpenClaw, un agente IA open-source. Il CEO Sam Altman ha detto che Steinberger guiderà il lavoro sugli agenti personali di prossima generazione e lo ha definito un genio con grandi idee su assistenti intelligenti che possono fare cose utili.
La crisi dei talenti che nessuno può risolvere
Il 94% dei leader aziendali afferma di essere a corto di competenze in IA. Entro il 2028, il 44% si aspetta di avere ancora carenze dal 20 al 40%. Workera afferma che queste lacune potrebbero costare all'economia globale 5,5 trilioni di dollari nel 2026 a causa di prodotti ritardati, problemi di qualità e vendite perse.
In questo momento la domanda di talenti IA supera l'offerta di 3,2 a uno in tutto il mondo. I lavori nell'IA pagano il 67% in più rispetto alle posizioni software regolari. Eppure l'85% dei lavoratori d'ufficio sta imparando queste cose nel proprio tempo libero, e l'83% afferma di essere per lo più autodidatta invece di ricevere formazione formale.
Quando le aziende acquistano strumenti di IA da fornitori specializzati, hanno successo il 67% delle volte. Le costruzioni interne funzionano solo circa un terzo delle volte.
Salesforce ha visto una crescita degli agenti del 119% all'inizio del 2025 e ha superato i 500 milioni di dollari di entrate ricorrenti per questi prodotti. Hanno aggiunto 6.000 clienti aziendali in tre mesi.
Le aziende probabilmente compreranno soluzioni invece di costruirle. Ciò indica che il mercato si sta concentrando attorno a pochi grandi attori che possono fornire ciò che effettivamente funziona.
Fonte: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


