Valgono quello che costano rispetto a RTX 30 e RTX 20?

Tralasciando le prestazioni, che sembrano spettacolari, non tanto per l’architettura stessa, ma per tutto ciò che la circonda di software e ottimizzazioni neurali, le RTX 4090 e le RTX 4080 valgono i soldi che NVIDIA chiede loro? Il prezzo è alto e ce ne occuperemo in un articolo successivo, perché ha briciole, ma dal punto di vista delle modifiche, dell’architettura e delle dimensioni, ha ragione la squadra verde a posizionare il NVIDIA AD102 così estremamente alto rispetto a GA102 e TU102? Vediamolo.

Grazie al leaker pazzo Abbiamo una ripartizione molto migliore dei dati e, soprattutto, del layout architettonico dell’AD102. Il confronto non offre dubbi, ma è vero che dobbiamo scomporre diversi aspetti fondamentali che possono dirci se, in effetti, NVIDIA sta chiedendo qualcosa di equo per ogni scheda oppure no.

NVIDIA RTX 4090 e AD102, quanto è stato migliorato chip per chip?

Partendo dal fatto che sono trapelate le dimensioni dell’area dell’AD102 e dei suoi trilioni di transistor, questo ci lascia un panorama molto interessante per vedere l’evoluzione di ogni chip NVIDIA top di gamma con il passare delle ultime generazioni.

L’immagine in basso lo rende molto chiaro, ma è vero che diverse cose devono essere chiarite in ogni salto. Ad esempio, Da GP102 a TU102 NVIDIA raddoppiato i VRF per SIMD e il Cache L2è passato da 16 nm a 12 nm, che era un salto più piccolo dato che erano praticamente fratelli, e questo è costato per passare da 471 mm2 a 754 mm2 abbassando la densità da 25,1 a 24.7. Sono stati introdotti Tensor Core e RT Core, quindi oltre al Mesh Shader, calcolo asincrono e altro, densità complessiva in calo del 2%non c’era modo di migliorare senza perdere.

Con il GA102 il bus e la cache attuali sono stati nuovamente mantenuti, l’area totale è stata ridotta a 628,4 mmla densità è passata da quelle 24,7 MT/mm2 a 45.1 e in generale, ha vinto a +83% in questi termini, un prodotto degli 8nm di Samsung che, pur essendo un balzo in avanti, in termini di densità sono molto indietro rispetto agli 7nm di TSMC e AMD.

Con il ritorno in Taiwan e in un nodo specifico per NVIDIA come 4N, il brand mantiene lo stesso bus, ma moltiplicare per 16 la dimensione della cache L2, che presuppone una spesa molto grande in zona. Questa (area) è 608.44nonostante sia stato rappresentato secondo l’immagine che ha mostrato NVIDIA con 618,33 mm2, ma questa differenza è solo artistica, non reale, la metrica corretta è ovviamente la prima.

Un aumento di densità mai visto in una GPU

Chip comparativi-NVIDIA-vs-AMD,-densità,-transistor,-area

Potremmo dire che generazione litografica dopo generazione litografica non ha mai visto un salto così grande, almeno per quello che un server ricorda. Con AD102 andiamo a 76,3 milioni di transistor che ci dà una densità di 125,4 MT/mm2o ciò che è lo stesso, rispetto al suo predecessore è a +178%, una vera follia. Logicamente, questo perché l’N8 di Samsung non era troppo denso, ma anche con l’N7 di TSMC l’ingrandimento sarebbe facilmente superiore al 100%.

Quest’ultimo può essere visto confrontando l’AMD MI250X con il TSMC N6, le sue dimensioni, i suoi transistor e la sua densità, che è inferiore al GA102 e nei transistor è leggermente superiore. Tornando a NVIDIA, come possiamo vedere, le aree tra GA102 e AD102 sono molto simili e questo ha una spiegazione molto interessante: entrambi i chip sono compatibili pin per pin sullo stesso PCB.

O in altre parole, un RTX 3090 Ti potrebbe avere un AD102 saldato, che non funzionerà perché c’è ristrutturazione di detti pin a causa dei cambiamenti nell’architettura, ma che salderebbero perfettamente e con precisione tra una RTX 3090 Ti e una RTX 4090, non importa dove vada l’una o l’altra se parliamo di saldatura.

Perché sta succedendo? Non è una coincidenza, tutt’altro. NVIDIA ha preparato gli AIB in modo che i PCB, i dissipatori di calore e in generale gli aspetti termici ed elettrici non avessero problemi nell’RTX 40. Pertanto, e come ipotizzato al lancio dell’RTX 3090 Ti, questa carta era una prova per tutti i designer e produttori che affrontano l’RTX 40, ora è confermato.

Importanti cambiamenti nell’architettura e nel design

NVIDIA-GA102-vs-AD102

Come già anticipato nell’articolo esclusivo di AD102 quando è trapelato il suo diagramma, questo chip avrà 12 GPC, ciascuno disposto con due file interne. Se confrontiamo con l’architettura Hopper, NVIDIA ha mantenuto la parola data e ha progettato tutto da zero come puoi vedere, dove il problema era chiaramente la cache L2 e l’HBM.

Pertanto, e salvando altri dettagli come la modifica del file CPC 3D di Hopper, quello che vediamo nell’AD102 è qualcosa di curioso. A cominciare dai controller di memoria a struttura non simmetrica, mentre la cache è accessibile da ogni GPC dividendo verticalmente la giunzione tra di loro con la Crossbar al centro del chip.

Diagramma NVIDIA-AD102-vs-GH100

Ciò è stato fatto a causa delle modifiche avvenute all’interno di ciascun GPC, poiché ora ospitano 3 CPC, con 6 TPC e 12 SM, senza contare i Motori 3D FF (motori Textures e RT Cores) che genera l’intero GPC. Il controllore PCIe con 16 corsie si trova nella parte inferiore del chip secondo l’immagine ed ecco un altro fatto curioso: non esiste alcun driver per NVLink.

Il commentato è qualcosa che già sapevamo, perché NVIDIA ne ha fatto a meno sulle schede e lo si vede ad occhio nudo, ma non è nemmeno sul chip, perché occupa un buon spazio all’interno del dado e strutturalmente parlando non è apprezzato nella diapositiva.

NVIDIA AD102: mantiene i motori polimorfici?

Diagramma della cache del chip grafico AD102

Una nuova fuga di notizie espone i numeri di cui abbiamo discusso sopra per GPC, TPC e SM, ma aggiunge altre due informazioni chiave:

  • 12 motori Texture (3 x 4 TEX)
  • 3 motori polimorfici (PES)

Questo è sorprendente perché il salto di Shaders e in particolare di FP32 è molto alto, quindi ci si aspettava di espandere il PES, ma no, rimangono come ad Ampere il che è un po’ sconcertante e lascia diverse porte aperte alla spiegazione di questo movimento.

Se le informazioni sono corrette, NVIDIA potrebbe prendere diverse strade come abbiamo detto, la più probabile è una nuova topologia di interconnessione tra SM e GPC. Questo significherebbe qualcosa di totalmente nuovo e si concentrerebbe sulla prossima architettura, che invece dovrebbe esserlo LCM. Inoltre, può implicare che, se non in Ada Lovelace, nel prossimo i piloti potrebbero segnare un punto fermo.

RTX-40-Ada-Lovelace-SM-AD102

Cioè, ci sarebbe un driver per l’RTX 40 e precedenti, e forse un nuovo driver per il presunto RTX 50 e successivi. Come mai? Ebbene, perché se quello che diciamo è vero e siamo sulla strada giusta, non basta programmare i GPC singolarmente e le loro unità, bisognerebbe programmare il driver in base a cluster o gruppo di essi (Thread Group Cluster) per indirizzare correttamente le prestazioni ai thread.

Ciò implicherebbe quasi certamente che il Programmatore di curvatura passerebbe a un numero maggiore di thread per ciclo e questo, in teoria, trascinerebbe il spedizione e i file di registro per essere più grandi o per poter eseguire più istruzioni per ciclo, modificando in parte il Front End di ogni SM.

Prezzi, rendimenti e innovazione, sono giusti?

Sub-Core-Ada-Lovelace-AD102

Ma a questo punto ci sono molte speculazioni, quindi è meglio attenersi a ciò che già sappiamo, dove ci sono ancora cose da spiegare in modo approfondito, perché non c’è un datasheet di architettura, ovviamente, ma serve come introduzione a questo e al cambiamenti che vedremo tra poco più di un mese. Infine, non resta che rispondere alla domanda iniziale: vale la pena a RTX 4090 il suo prezzo rispetto a RTX 3090Ti o uno RTX 2080Ti? Qui entrano in gioco più fattori al di fuori dell’architettura, come il prezzo dei wafer (sta salendo alle stelle) e il design, la ricerca e lo sviluppo e tutto ciò che si concentra sul software applicato all’hardware, come DLSS 3.0, tutti insieme in questi casi.

Visto nel suo insieme, non sta a noi dare un giudizio di valore, poiché ognuno avrà un’impressione diversa. In ogni caso, come anticipato, i prezzi sono più alti rispetto alla serie precedente, quindi sapendo che le prestazioni saranno tra il 70% e il 200% migliori con queste RTX 4090 e RTX 4080 (a seconda di cosa si confronta e come si confronta) che il costo dei materiali nel dissipatore di calore, PCB e altri non è un motivo, trasferiamo la domanda a te.

Il salto di prezzo è giustificato di fronte all’innovazione, ai costi e alla ricerca e sviluppo generale in questo NVIDIA AD102?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *