AMD rivoluziona l’efficienza energetica nei data center

L’obiettivo 20x di AMD mira a rivoluzionare l’efficienza energetica nei data center, riducendo consumi, emissioni e spazi grazie a progettazioni di sistema.

data center

Samuel Naffziger, Senior Vice President and Corporate Fellow di AMD, illustra i piani e i progressi del marchio nel campo dell’efficienza energetica.

In AMD, l’efficienza energetica è da tempo un principio guida di progettazione, allineato alla roadmap e alla strategia di prodotto dell’azienda. Per oltre un decennio, il marchio ha fissato obiettivi pubblici e definiti nel tempo, per aumentare drasticamente l’efficienza energetica dei prodotti, obiettivi raggiunti e superati costantemente. AMD annuncia il raggiungimento di un nuovo traguardo e sta definendo la prossima visione quinquennale per la progettazione a basso consumo energetico.

Costruire su un decennio di leadership

Questo segna la terza pietra miliare importante in un impegno pluridecennale per migliorare l’efficienza in tutte le nostre piattaforme di elaborazione. Nel 2020, abbiamo superato il nostro obiettivo 25×20, migliorando di 25 volte l’efficienza energetica dei processori mobili AMD in soli sei anni. L’obiettivo 30×25 si basa su questo slancio, concentrandosi sui carichi di lavoro di intelligenza artificiale e HPC nei nodi accelerati. E ora, l’obiettivo di 20 volte entro il 2030 su scala rack riflette la prossima frontiera, non focalizzata solo sui chip, ma su sistemi più intelligenti ed efficienti, dal silicio alla completa integrazione in rack, per soddisfare i requisiti di alimentazione a livello di data center.

Superare il 30×25

Il nostro obiettivo 30×25 si basava su un benchmark chiaro: migliorare l’efficienza energetica dei nostri nodi di elaborazione accelerati di 30 volte rispetto all’anno base 2020. Questo obiettivo rappresentava un’accelerazione di oltre 2,5 volte rispetto ai trend del settore dei cinque anni precedenti (2015-2020). A metà del 2025, abbiamo superato questo obiettivo, ottenendo un guadagno di 38 volte rispetto al sistema base utilizzando un’attuale configurazione di quattro GPU AMD Instinct MI355X e una CPU AMD EPYC di quinta generazione. Ciò equivale a una riduzione del 97% del consumo energetico a parità di prestazioni rispetto ai sistemi di soli cinque anni fa.

Abbiamo raggiunto questo obiettivo attraverso profonde innovazioni architetturali, un’ottimizzazione aggressiva delle prestazioni per watt e continui miglioramenti ingegneristici nelle nostre linee di prodotti CPU e GPU.

Un nuovo obiettivo per l’era dell’AI

Con la crescita dei carichi di lavoro e la domanda in continua crescita, i miglioramenti in termini di efficienza a livello di nodo non riusciranno a tenere il passo. L’impatto più significativo in termini di efficienza può essere realizzato a livello di sistema, dove si concentra il nostro obiettivo per il 2030.

Riteniamo di poter raggiungere un aumento di 20 volte dell’efficienza energetica a livello di rack per l’addestramento e l’inferenza dell’AI dal 2024 al 2030, che AMD stima superi di quasi 3 volte il trend di miglioramento del settore dal 2018 al 2025. Ciò riflette i miglioramenti in termini di prestazioni per watt nell’intero rack, inclusi CPU, GPU, memoria, networking, storage e co-progettazione hardware-software, sulla base dei nostri ultimi progetti e delle proiezioni della roadmap. Questo passaggio dal nodo al rack è reso possibile dalla nostra strategia di intelligenza artificiale end-to-end in rapida evoluzione ed è fondamentale per scalare l’AI nei data center in modo più sostenibile.

Cosa significa in pratica

Un miglioramento dell’efficienza su scala rack di 20 volte, quasi 3 volte superiore al precedente tasso di settore, ha implicazioni importanti. Utilizzando l’addestramento per un tipico modello di intelligenza artificiale nel 2025 come parametro di riferimento, i miglioramenti potrebbero consentire:

  • Consolidamento dei rack da oltre 275 a <1 rack completamente utilizzato
  • Una riduzione di oltre il 95% del consumo di elettricità operativa
  • Riduzione delle emissioni di carbonio da circa 3.000 a 100 tCO2 per l’addestramento del modello

Queste proiezioni si basano sulla roadmap di progettazione di silicio e sistemi AMD e su una metodologia di misurazione convalidata dall’esperto di efficienza energetica Jonathan Koomey.

Jonathan Koomey
Basando l’obiettivo del 2030 su metriche a livello di sistema e su una metodologia trasparente, AMD sta alzando l’asticella per il settore. L’obiettivo di incremento di efficienza a livello di rack consentirà ad altri attori dell’ecosistema, dagli sviluppatori di modelli ai provider cloud, di scalare l’elaborazione dell’AI in modo più sostenibile ed economico.

Guardare oltre l’hardware

Il nostro obiettivo 20x riflette ciò che controlliamo direttamente: hardware e progettazione a livello di sistema. Sappiamo però che saranno possibili miglioramenti ancora maggiori nell’efficienza dei modelli di IA, fino a 5 volte nel periodo previsto, man mano che gli sviluppatori di software scopriranno algoritmi più intelligenti e continueranno a innovare con approcci a precisione inferiore ai ritmi attuali. Includendo questi fattori, l’efficienza energetica complessiva per l’addestramento di un tipico modello di AI potrebbe migliorare fino a 100 volte entro il 2030.

Sebbene AMD non rivendichi questo moltiplicatore completo nel proprio obiettivo, siamo orgogliosi di fornire la base hardware che lo consente e di supportare l’ecosistema aperto e la comunità di sviluppatori che lavorano per ottenere questi vantaggi. Che si tratti di standard aperti, del nostro approccio software aperto con ROCm o della nostra stretta collaborazione con i nostri partner, AMD rimane impegnata ad aiutare gli innovatori di tutto il mondo a scalare l’AI in modo più efficiente.

Cosa verrà dopo

Mentre chiudiamo un capitolo con il 30×25 e apriamo il successivo con questo nuovo obiettivo a livello di rack, rimaniamo impegnati a garantire trasparenza, responsabilità e progressi misurabili. Questo approccio distingue AMD ed è necessario per far progredire il modo in cui il settore affronta l’efficienza, in un contesto in cui la domanda e l’implementazione dell’intelligenza artificiale continuano a crescere. Siamo entusiasti di continuare a spingerci oltre i limiti, non solo in termini di prestazioni, ma anche di ciò che è possibile quando l’efficienza è all’avanguardia. Con il progredire dell’obiettivo, continueremo a condividere aggiornamenti sui nostri progressi e sugli effetti che questi progressi stanno generando nell’intero sistema.