Sfrutta il Potere dei Dati per la Tua Attività — I prodotti tecnologici più innovativi

Il percorso verso la redditività dell'IA guidato da semiconduttori intelligenti

Rapida evoluzione nel dominio dell'IA: Negli ultimi 12 mesi c'è stata una forte crescita della necessità di implementare modelli IA addestrati in applicazioni del mondo reale.

, and Administrator

2025 settembre 5 . 1:04 PM

2 minuti

Guadagno dell'IA Guidato da Ciotoli diComputer Intelligenti

Il percorso verso la redditività dell'IA guidato da semiconduttori intelligenti

In un importante passo verso la resa più accessibile e conveniente dell'intelligenza artificiale (AI), il CEO di Nvidia, Jensen Huang, ha sottolineato la necessità di produrre token AI a basso costo. Ha citato la sfida di scalabilità e distribuzione come un ostacolo maggiore nell'industria.

Il futuro della produzione di token AI è destinato a diventare redditizio per qualsiasi governo o attività, grazie a un approccio unificato di software intelligente e hardware innovativo. L'orchestrazione ad alte prestazioni, guidata dall'hardware, è fondamentale per liberare il potere degli acceleratori AI e ridurre il costo per token AI.

Una nuova classe di chip di inferenza specializzati e costruiti appositamente, noti come AI-CPU, sta emergendo. Questi chip sono progettati per ottimizzare l'inferenza AI per velocità ed efficienza, offrendo una promettente soluzione alle inefficienze del processo AI attuale.

L'approccio architetturale tradizionale x86 CPU e Controller di Interfaccia di Rete (NIC) sono considerati superati per raggiungere il rapporto token-costo necessario per l'adozione di massa dell'inferenza AI. Invece, un AI-CPU integra strettamente il processo con l'accesso di rete ad alta velocità, eliminando i colli di bottiglia dei dati e ottimizzando il sistema totale, massimizzando l'utilizzo del GPU e degli acceleratori AI.

Lo sviluppo di NIC AI specializzati è anche cruciale per misurare e migliorare le metriche come il tempo fino al primo token (TTFT) e superare i colli di bottiglia di rete. Baidu ha recentemente annunciato lo sviluppo di una nuova classe di chip di inferenza specializzati progettati per risolvere il problema centrale dell'elaborazione AI inefficiente.

I modelli AI sono ottimizzati per il flusso dei dati attraverso le tecniche di ottimizzazione del software come la potatura e la distillazione della conoscenza, rendendoli più intelligenti, leggeri e veloci. Tuttavia, il potere immenso degli acceleratori AI è frenato dai colli di bottiglia nell'orchestrazione AI guidata dall'hardware.

La dipendenza dall'architettura CPU x86 tradizionale sta ostacolando lo sviluppo di AI scalabile ed efficiente. Il vero costo marginale dei token AI generativi deve essere ridotto per smettere di sovvenzionare le operazioni costose e aumentare il valore aziendale. L'investimento profondo e una prevista crescita annuale composta (CAGR) del 19,2% entro il 2030 indicano la crescita dell'inferenza AI.

La domanda per il deployment dei modelli AI in tempo reale è aumentata negli ultimi 12 mesi. Un'architettura di inferenza AI rimodellata, alimentata da AI-CPU che integrano le capacità AI-NIC all'interno di un singolo chip, è necessaria per raggiungere un basso costo marginale per ogni token AI aggiuntivo. La coreografia intelligente di ogni compito e l'integrazione del sistema senza soluzione di continuità, incorporata direttamente nel silicio, è il tipo di progettazione costruita appositamente che un AI-CPU porta sul tavolo.

Mentre l'inferenza AI, il processo di utilizzo di un modello AI addestrato per fare previsioni o decisioni, è diventata un'area di crescita critica e complessa, l'emergere degli AI-CPU promette di rivoluzionare il campo, rendendo l'AI più accessibile ed efficiente per le attività e i governi.

Più recente

In questa immagine vedo una macchina da corsa sulla strada. In fondo c'è l'erba sul terreno. Su...

Il Mondo del Casino Online

Cosa significherebbero gli aumenti delle tasse sul gioco d'azzardo per il racing - e cosa è più probabile che accada?

Mentre il cancelliere dello Scacchiere Rachel Reeves segnala che le tasse sul gioco d'azzardo pagate dagli operatori aumenteranno nel bilancio del 26 novembre, esploriamo cosa... Leggi di più

, and Administrator

2025 dicembre 22

Come si può vedere nell'immagine, c'è erba, sondaggi attuali, un uomo che guida una motocicletta,...

Il Mondo del Casino Online

Cosa significherebbero gli aumenti delle tasse sul gioco d'azzardo per le corse - e cosa è più probabile che accada?

Mentre il cancelliere dello Scacchiere Rachel Reeves segnala che le tasse sul gioco d'azzardo pagate dagli operatori aumenteranno nel bilancio del 26 novembre, esploriamo cosa... Leggi di più

, and Administrator

2025 dicembre 22

In cima all'immagine vediamo una griglia di ferro, altoparlanti e spettatori. In basso all'immagine...

All about lotteries.

Nuovo Playbook per la copertura elettorale centrata sulla comunità

Il Playbook può essere scaricato gratuitamente qui e verrà presentato per la prima volta al b future festival di quest'anno, che si terrà dal 2 al 4 ottobre 2025 a Bonn. Il Playbook si basa sul modello dell'Agenda dei Cittadini degli Stati Uniti, che CORRECTIV ha testato per la prima volta nel...

, and Administrator

2025 dicembre 22

Al centro dell'immagine, possiamo vedere uno schermo. Sullo schermo, possiamo vedere app. E sullo...

All about casino games.

River Belle Casino: Svelato un approfondimento sul gioiello del gaming neozelandese

Scoprire il fascino di River Belle Casino: la destinazione di gaming online definitiva della Nuova Zelanda. Quando si tratta di gaming online in Nuova Zelanda, pochi nomi evocano come

, and Administrator

2025 dicembre 22

Il percorso verso la redditività dell'IA guidato da semiconduttori intelligenti

Il percorso verso la redditività dell'IA guidato da semiconduttori intelligenti

Leggi anche:

Imparentato

Più recente