Volta (mikroarkitektur) - Volta (microarchitecture)
Utgivelsesdato | 7. desember 2017 |
---|---|
Kodenavn | Volta |
Fremstillingsprosess | TSMC 12 nm ( FinFET ) |
Kort | |
Entusiast | |
Historie | |
Forgjenger | Pascal |
Etterfølger |
Turing (forbruker) Ampere (forbruker, profesjonell) |
Volta er kodenavnet for en GPU -mikroarkitektur utviklet av Nvidia , etterfulgt av Pascal . Det ble først kunngjort på et veikart i mars 2013, selv om det første produktet ikke ble kunngjort før i mai 2017. Arkitekturen er oppkalt etter den italienske kjemikeren og fysikeren Alessandro Volta fra det 18. til 19. århundre . Det var NVIDIAs første brikke med Tensor Cores , spesialdesignede kjerner som har overlegen dyp læringsytelse i forhold til vanlige CUDA -kjerner. Arkitekturen er fremstilt med TSMC 's 12 nm FinFET prosess. The Ampere mikroarkitektur er etterfølgeren til Volta.
Det første grafikkortet som brukte det var datasenteret Tesla V100, f.eks. Som en del av Nvidia DGX-1- systemet. Det har også blitt brukt i Quadro GV100 og Titan V. Det var ingen vanlige GeForce -grafikkort basert på Volta.
Detaljer
Arkitektoniske forbedringer av Volta -arkitekturen inkluderer følgende:
-
CUDA Compute Capability 7.0
- samtidig utførelse av heltall og flytende punktoperasjoner
- TSMC 's 12 nm FinFET prosessen, slik at 21,1 milliarder transistorer .
- Minne med høy båndbredde 2 (HBM2),
- NVLink 2.0 : en buss med høy båndbredde mellom CPU og GPU, og mellom flere GPUer. Tillater mye høyere overføringshastigheter enn de som kan oppnås ved å bruke PCI Express ; anslått å gi 25 Gbit/s per kjørefelt. (Deaktivert for Titan V)
- Tensorkjerner: En tensorkjerne er en enhet som multipliserer to 4 × 4 FP16 -matriser, og deretter legger til en tredje FP16- eller FP32 -matrise til resultatet ved å bruke fusjonerte multipliseringsoperasjoner , og får et FP32 -resultat som eventuelt kan degraderes til en FP16 resultat. Tensorkjerner er ment å fremskynde opplæringen av nevrale nettverk. Voltas Tensor -kjerner er første generasjon mens Ampere har tredje generasjon Tensor -kjerner.
- PureVideo Feature Set I hardware video decoding
Produkter
Volta er kunngjort som GPU-mikroarkitekturen i Xavier- generasjonen av Tegra SoC med fokus på selvkjørende biler .
På Nvidias årlige keynote for GPU Technology Conference 10. mai 2017 kunngjorde Nvidia offisielt Volta -mikroarkitekturen sammen med Tesla V100. Volta GV100 GPU er bygget på en 12 nm prosessstørrelse ved hjelp av HBM2 -minne med 900 GB/s båndbredde.
Nvidia kunngjorde offisielt NVIDIA TITAN V 7. desember 2017.
Nvidia kunngjorde offisielt Quadro GV100 27. mars 2018.
Modell | Lansering | Kodenavn (er) | Fab ( nm ) |
Transistorer (milliarder) |
Dysestørrelse (mm 2 ) |
Bus Interface | Kjernekonfigurasjon | SM Count |
Graphics Processing Clusters |
L2 hurtigbufferstørrelse ( MiB ) |
Klokkehastigheter | Fyllhastighet | Hukommelse | Prosessorkraft ( GFLOPS ) |
TDP (watt) |
NVLink Support | Lanseringspris ( USD ) |
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CUDA kjerne |
Tensor kjerne |
Basekjerneklokke ( MHz ) |
Øk klokken ( MHz ) |
Minne ( MT/s ) |
Pixel ( GP /s) |
Tekstur ( GT /s) |
Størrelse ( GiB ) |
Båndbredde ( GB /s) |
buss Type |
Bussbredde ( bit ) |
Enkelt presisjon (boost) |
Dobbel presisjon (boost) |
Halv presisjon (boost) |
|||||||||||||
MSRP | ||||||||||||||||||||||||||
Nvidia Titan V | 7. desember 2017 | GV100-400-A1 | TSMC 12 nm | 21.1 | 815 | PCIe 3.0 × 16 | 5120: 320: 96 | 640 | 80 | 6 | 4.5 | 1200 | 1455 | 1700 | 139,7 | 465,6 | 12 | 652,8 | HBM2 | 3072 | 12288 (14899) | 6144 (7450) | 24576 (29798) | 250 | Nei | $ 2999 |
Nvidia Quadro GV100 | 27. mars 2018 | GV100 | 5120: 320: 128 | 6 | 1132 | 1628 | 1696 | 208.4 | 521 | 32 | 868,4 | 4096 | 11592 (16671) | 5796 (8335) | 23183 (33341) | Ja | 8 999 dollar | |||||||||
Nvidia Titan V CEO -utgave | 21. juni 2018 | 1200 | 1455 | 1700 | 186.2 | 465,6 | 870,4 | 12288 (14899) | 6144 (7450) | 24576 (29798) | Ikke tilgjengelig |
applikasjon
Det er også rapportert at Volta er inkludert i Summit og Sierra superdatamaskiner, brukt til GPGPU -beregning. Volta -GPU -ene vil koble seg til POWER9 -prosessorene via NVLink 2.0 , som forventes å støtte cache -sammenheng og derfor forbedre GPGPU -ytelsen.