Nvidia Ada RTX 40 analys av bärbar GPU: 175 W RTX 4090 GPU för bärbar dator överträffar 350 W RTX 3090 i prestanda och energieffektivitet
GPU:er för bärbara datorer hålls traditionellt tillbaka på grund av begränsningar i fråga om effekt och frekvens jämfört med sina motsvarigheter på skrivbordet.
Även om vi fortfarande inte har kommit så långt att fysiken kan åsidosättas, har dagens grafikprocessorer utvecklats så att de erbjuder mer prestanda per watt än någonsin tidigare.
Förra året tillkännagav Nvidia Ada Lovelace-arkitekturen för stationära datorer för konsumenter, vilket markerades av tillkomsten av GeForce RTX 40-serien. I våra tester har RTX 4090, RTX 4080, ochRTX 4070 Ti har gett betydande prestanda- och effektivitetsförbättringar jämfört med sina Turing-motsvarigheter.
I dag är det Adas mobila varianter som ska upprepa bedriften.
Bärbara datorer med flaggskeppsadapters mobila GPU:er, som t.ex RTX 4090 och RTX 4080 GPU:er för bärbara datorer är nu tillgängliga över hela världen. Enheter med Ada-kort i mellanklassen kommer att lanseras senare denna månad.
Ada mobilarkitektur: RTX 40 mobile i jämförelse med andra Nvidia GPU:er
Det är inte möjligt att få in en fullfjädrad AD102-die i ett chassi för en bärbar dator utan att göra allvarliga kompromisser när det gäller batteritid och värmehantering. Därför börjar RTX 40-mobilserien med AD103 GPU:n, som tillverkas de novo för vanliga GPU:er som RTX 4080 och lägre, och som alltså inte är en nedskuren AD102-del.
Därför är RTX 4090 GPU för bärbara datorer i princip samma som RTX 4080 för stationära datorer med missvisande nomenklatur. Det är dock där likheterna mellan dessa kort slutar.
Topp 10...
» Topp 10: Bästa bärbara allround/multimediadatorerna
» Topp 10: Bästa bärbara speldatorerna
» Topp 10: Bärbara budget/kontorsdatorer
» Topp 10: Bästa bärbara kontors/premiumdatorerna
» Topp 10: Bärbara arbetsstationer
» Topp 10: De bästa små/kompakta bärbara datorerna
» Topp 10: Bästa ultrabooks
» Topp 10: Bästa hybriddatorerna
» Topp 10: Bästa surfplattorna
» Topp 10: Marknadens bästa smartphones
RTX 4090 Laptop GPU:n kan konfigureras med en TDP på mellan 80 W och 150 W, vilket resulterar i boostklockor på mellan 1 455 MHz och 2 040 MHz.
Lärande från Ampere-fiaskotanger OEM-företag nu proaktivt GPU-wattningen i specifikationerna, vilket bör ge köparna ett bättre perspektiv på prestandan i förhållande till den bärbara datorns konfiguration och chassi.
Observera dock att det inte är alla OEM:er som publicerar Dynamic Boost-värden.
RTX 4090 Laptop GPU använder samma 256-bitars minnesbuss som RTX 4080, men lider av en ~20 % minskning av minnesbandbredden, även om den är något snabbare än RTX 4080 RTX 3080 Ti GPU för bärbar dator.
GDDR6X:s energikrävande karaktär innebär att det inte kan användas i en bärbar dator. Nvidia sade att GDDR6 VRAM i Ada mobile är utformad för att vara mycket effektiv med förbättrad klockstyrning, låg spänning och tillagda minnestillstånd med lägre energiförbrukning.
RTX 4080 Laptop GPU använder den stationära RTX 4070 Ti's AD104-die med en liten minskning av CUDA-kärnantalet som stämmer överens med vad vi tidigare sett i RTX 3080 Ti Laptop GPU.
Även om RTX 3080 Ti Laptop GPU verkar bättre på pappret, åtminstone när det gäller VRAM-egenskaper, kompenserar RTX 4080 mobile för denna brist med arkitektoniska förbättringar i Ada.
Specifikation | RTX 4090 FE | RTX 4080 FE | RTX 4070 Ti | RTX 4090 Laptop GPU | RTX 4080 Laptop GPU | RTX 3090 Ti FE | RTX 3090 FE | RTX 3080 Ti FE | RTX 3080 FE | RTX 3080 Ti Laptop GPU |
Chip | AD102 | AD103 | AD104 | AD103 | AD104 | GA102 | GA102 | GA102 | GA102 | GA103 |
FinFET-process | Custom 4N | Custom 4N | Custom 4N | Custom 4N | Custom 4N | 8 nm | 8 nm | 8 nm | 8 nm | 8 nm |
CUDA-kärnor | 16 384 | 9 728 | 7 680 | 9728 | 7424 | 10 752 | 10 496 | 10 240 | 8 704 | 7 424 |
Texturenheter | 512 | 304 | 240 | 304 | 232 | 336 | 328 | 320 | 272 | 232 |
Tensor Cores | 512 4th Gen. | 304 4th Gen. | 240 4th Gen. | 304 4th Gen. | 232 4th Gen. | 336 3rd Gen. | 328 3rd Gen. | 320 3rd Gen. | 272 3rd Gen. | 232 3rd Gen. 232 3rd Gen. |
RT Cores | 128 3rd Gen. | 76 3rd Gen. | 60 3rd Gen. | 76 3rd Gen. | 58 3rd Gen. | 84 2nd Gen. | 82 2nd Gen. | 80 2nd Gen. | 68 2nd Gen. | 58 2nd Gen. |
GPU Base Clock | 2 235 MHz | 2 205 MHz | 2 310 MHz | 1590 MHz | 1530 MHz | 1 560 MHz | 1 395 MHz | 1 365 MHz | 1 440 MHz | 1 230 MHz |
GPU Boost Clock | 2 520 MHz | 2 505 MHz | 2 760 MHz | 2040 MHz | 1995 MHz | 1 860 MHz | 1 695 MHz | 1 665 MHz | 1 710 MHz | 1 590 MHz |
Minnesbuss | 384-bitars | 256-bitars | 192-bitars | 256-bitars | 192-bitars | 384-bitars | 384-bitars | 384-bitars | 320-bitars | 256-bitars |
Minnesbandbredd | 1 008 GB/s | 716,8 GB/s | 504 GB/s | 576 GB/s | 432GB/s | 1 008 GB/s | 936 GB/s | 912 GB/s | 760 GB/s | 512 GB/s |
Videominne | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 16 GB GDDR6 | 12 GB GDDR6 | 24 GB GDDR6X | 24 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X | 16 GB GDDR6X |
Strömförbrukning | 450 W | 320 W | 285 W | 150 W (+25 W DB) | 150 W (+25 W DB) | 450 W | 350 W | 350 W | 320 W | 150 W (+25 W DB) |
Ada-generationen medför också några anmärkningsvärda förändringar av Nvidias Max-Q-implementering. När Max-Q först debuterade med Turing var fokus mer på TDP-värdet. Själva korten var tydligt märkta som Max-Q, vilket gjorde urvalet enklare.
Från Ampere valde dock Nvidia att sätta både pressen och slutanvändarna i en knipa genom att ta bort Max-Q-märkningen och istället använda den som en paraplyterm för tekniker som Whisper Mode, Resizeable BAR, Dynamic Boost, Advanced Optimus och liknande.
OEM-företag kan nu välja att använda vilken delmängd av Max-Q-teknik som de anser lämplig, och även få plats med en stor GPU i ett tunt chassi för att skryta, samtidigt som de faktiskt konfigurerar dess TDP nära basvärdena.
Med Ada introducerar Nvidia vad man kallar 5th gen Max-Q där DLSS 3 och energisnålt GDDR6-minne spelar en viktig roll.
Nya DLSS 3- och ray tracing-pipelines
Vi har kortfattat berört DLSS 3 och de nya ray tracing-funktionerna i Ada i vår recension av RTX 4090 Founders Edition. I huvudsak använder DLSS 3 Ada's nya fristående Optical Flow Accelerator (OFA) för att infoga ramar i farten. Bildgenereringen sker på GPU:n och inte i spelet.
Mer exakt är DLSS 3 en kombination av befintliga DLSS 2 Super Resolution och ramgenerering. Enligt Nvidia rekonstruerar DLSS 3 7/8 av bilden - 3/4 av den första ramen rekonstrueras med DLSS 2 Super Resolution medan hela den andra ramen skapas med ramgenerering.
Eftersom bildgenerering sker på GPU:n kan DLSS 3 hjälpa till att öka bildrutorna i CPU-bundna eller fysiktunga titlar som Microsoft Flight Simulator 2020.
Observera att DLSS 3 kräver en RTX 40 GPU, en titel som stöds och aktivering av hårdvaruaccelererad GPU-schemaläggning och Nvidia Reflex.
Ada har tredje generationens strålspårningskärnor (RT) med två nya funktioner - opacitetsmikromapmotorn och den förskjutna mikromaskmotorn. Detta är ett tillägg till den motor för boxskärning och den motor för triangelskärning som redan finns i Ampere.
Det finns också en ny Shader Execution Reordering (SER) pipeline, som fungerar som en effektiv schemaläggare för sekundära stråltrådar. SER kan potentiellt påskynda intensiva RT-beräkningar som path tracing, men kräver stöd från spelutvecklaren.
Enligt Nvidia ska det vara ganska enkelt att implementera SER. Utvecklare kommer att kunna få feedback om SER:s prestanda via Nvidia NSight. Företaget sade att det samarbetar med Microsoft och andra för att lägga till SER-stöd i grafiska API:er som DirectX.
Testanordningar: Gräddfilen av grödan
Vi har följande testutrustning i våra laboratorier:
- MSI Titan GT77 HX 13V (Core i9-13950HX + RTX 4090 Laptop GPU)
- Schenker XMG Neo 16 (Core i9-13900HX + RTX 4090 GPU för bärbar dator)
- Razer Blade 16 i början av 2023 (Core i9-13950HX + RTX 4080 GPU för bärbar dator)
Alla testade enheter kördes i sina maximala prestandalägen med MUX-omkoppling till dGPU:n. Detta gjorde det möjligt för RTX 4090 och RTX 4090 att utnyttja hela 175 W TGP inklusive Dynamic Boost.
Observera: Vi är de första att få en tidig variant av Schenker XMG Neo 16. Eftersom detta är en förproduktionsmodell kan det hända att betygen inte återspeglar enhetens faktiska prestanda i vår officiella granskning med ett butiksexemplar.
Syntetisk prestanda: RTX 4090 mobilt i hälarna på RTX 4070 Ti för stationärt bruk
I den ackumulerade 3DMark-prestandan är RTX 4090 Laptop GPU:n i både Titan GT77 HX och XMG Neo 16 lika bra, vilket tyder på att det inte finns några potentiella flaskhalsar någon annanstans i pipelinen.
Razer Blade 16:s RTX 4080 Laptop GPU släpar efter med 19 % jämfört med RTX 4090 Laptop, vilket liknar den procentuella skillnaden mellan skrivbordsvarianterna av dessa GPU:er.
Med detta sagt är RTX 4090 Laptop GPU:n upp till 35 % långsammare än RTX 4090 Founders Edition-kortet för stationära datorer, samtidigt som den släpar efter med upp till 26 % jämfört med Radeon RX 7900 XTX. Prestandan är dock jämförbar med den för det stationära RTX 4070 Ti-kortet.
Trots att det har ett liknande antal CUDA-kärnor innebär TDP-begränsningar att 320 W RTX 4080 Founders Edition är 20 % snabbare jämfört med en 175 W RTX 4090 Laptop GPU i 3DMark-prestanda totalt sett.
Jämfört med tidigare generationers mobila GPU:er verkar Ada-generationen erbjuda betydande prestandaökningar. RTX 4090 Laptop GPU är hela 76 % snabbare i alla 3DMark-tester sammantaget än den genomsnittliga RTX 3080 Ti Laptop GPU.
Goda 43 % vinster ses också med RTX 4080 Laptop GPU jämfört med den genomsnittliga RTX 3080 Ti-mobilvarianten.
Spelprestanda: RTX 4090 Laptop GPU på samma nivå som RTX 4070 Ti i 4K
En liknande trend ses även inom spel, där RTX 4090 Laptop GPU i XMG Neo 16 är inom räckhåll för RTX 4070 Ti desktop i kumulativ spelprestanda.
Vi ser att RTX 4080 Laptop GPU släpar efter den mobila varianten av RTX 4090 med upp till 17 %, vilket liknar de deltas vi ser mellan skrivbordsversionerna av RTX 4090 och RTX 4080.
Arkitekturförbättringar verkar ge RTX 4080 Laptop en 33-procentig fördel jämfört med RTX 3080 Ti Laptop GPU när det gäller övergripande spelprestanda, men RTX 4090 erbjuder en enorm ökning på 61 procent jämfört med Ampere's mobila flaggskepp.
Precis som sina motsvarigheter på skrivbordet verkar RTX 40-mobilgrafikkretsar också lätt bli CPU-bottlenecked vid lägre upplösningar. I Metro Exodus (icke-förbättrat), till exempel, ligger RTX 4090 GPU:n för bärbar dator efter RTX 4070 Ti för stationära datorer med upp till 19 % vid 1080p Ultra. Vid 4K Ultra presterar dock flaggskeppet Ada mobile GPU i nivå med RTX 4070 Ti.
Vi ser också större skillnader mellan RTX 4090 Laptop GPU och RTX 4090 desktop-kortet vid 4K Ultra jämfört med 1080p eller QHD Ultra av denna anledning - Ada älskar helt enkelt att bli beskattad vid 4K.
Intressant nog ökar gapet mellan RTX 4080 Laptop GPU och RTX 4090 Laptop GPU också vid 4K.
Extremt CPU-bundna spel som Mafia : Definitive Edition visar märkbara skillnader mellan RTX 4070 Ti och RTX 4090 Laptop GPU endast vid 1080p. När upplösningen ökar kan RTX 4090 Laptop GPU minska gapet eller till och med slå RTX 4070 Ti med en hårsmån i det här spelet.
Prestanda för strålspårning
Trots att RTX 4080 har samma antal RT-kärnor som RTX 4080 desktop kan RTX 4090 Laptop GPU vara upp till 25 % långsammare i den totala ray tracing-prestandan. Vi ser dock utmärkta vinster på upp till 58 % jämfört med RTX 3080 Ti Laptop GPU.
Även om vi ser mycket bra fps-siffror vid native 1080p, är 4K native ray tracing vid spelbara bildfrekvenser fortfarande inte inom räckhåll, vilket vi ser i resultaten från Cyberpunk 2077. Nvidia driver DLSS 3 som det enda gångbara sättet att spela i högre upplösningar med RT aktiverat.
DLSS 3 prestanda
Följande tabell visar fördelarna med DLSS 3 i spel som stöds med RTX 4090 Laptop GPU i MSI Titan GT77 HX 13V.
Jämfört med 4K native visar DLSS 3 i balanserat läge fenomenala prestandafördelar vid 4K Ultra-inställningar. Cyberpunk 2077 har varit Nvidias affischnamn för ray tracing och DLSS-prestanda under en tid nu, och följaktligen ser vi en fantastisk ökning på 331 % i genomsnittlig fps efter att ha aktiverat DLSS 3 jämfört med native 4K vid Ultra-inställningar.
Spel | Inställning | DLSS off | DLSS on (Balanced) | Skillnad |
---|---|---|---|---|
Spider-Man Miles Morales | 4K Ultra | 83 FPS | 132 FPS | +59 % |
The Witcher 3 4.00 | 4K RT Ultra | 27 FPS | 50 FPS | +85 % |
Cyberpunk 2077 1.5 | 4K RT Ultra | 22 FPS | 95 FPS | +331 % |
God of War | 4K Ultra | 80 FPS | 111 FPS | +38 % |
Horizon Zero Dawn | 4K Ultra | 95 FPS | 143 FPS | +51 % |
MSI Titan GT77 HX 13VI
låg | med. | hög | ultra | QHD | 4K DLSS | 4K | |
---|---|---|---|---|---|---|---|
GTA V (2015) | 184.1 | 182.6 | 140.9 | 138.5 | 175.7 | ||
The Witcher 3 (2015) | 619 | 546 | 422 | 198.9 | 160 | ||
Dota 2 Reborn (2015) | 225 | 206 | 194.1 | 185.9 | 178.9 | ||
Final Fantasy XV Benchmark (2018) | 230 | 221 | 187.4 | 162.9 | 94.7 | ||
X-Plane 11.11 (2018) | 203 | 177.5 | 134.1 | 114.3 | |||
Far Cry 5 (2018) | 186 | 173 | 160 | 159 | 113 | ||
Strange Brigade (2018) | 490 | 396 | 391 | 373 | 309 | 159.3 | |
Shadow of the Tomb Raider (2018) | 245 | 227 | 219 | 214 | 187 | 103 | |
Metro Exodus (2019) | 204 | 183 | 153 | 132 | 116 | 81 | |
Control (2019) | 240 | 232 | 187 | 122 | 63 | ||
Borderlands 3 (2019) | 201 | 176 | 162 | 151 | 130 | 76 | |
Horizon Zero Dawn (2020) | 209 | 189 | 174 | 163 | 154 | 131 | 95 |
Mafia Definitive Edition (2020) | 219 | 189 | 179 | 161 | 93 | ||
Watch Dogs Legion (2020) | 152 | 144 | 131 | 120 | 109 | 69 | |
F1 2021 (2021) | 501 | 449 | 417 | 209 | 192.4 | 114.4 | |
Far Cry 6 (2021) | 167 | 147 | 144 | 135 | 89 | ||
Forza Horizon 5 (2021) | 220 | 181 | 174 | 124 | 113 | 95 | |
God of War (2022) | 201 | 200 | 180 | 133 | 115 | 80 | |
Rainbow Six Extraction (2022) | 378 | 347 | 346 | 314 | 219 | 112 | |
Dying Light 2 (2022) | 240 | 206 | 174 | 121 | 62 | ||
GRID Legends (2022) | 254 | 230 | 210 | 199 | 190 | 132 | |
Cyberpunk 2077 1.6 (2022) | 156 | 144 | 138 | 135 | 98 | 56 | |
Ghostwire Tokyo (2022) | 237 | 236 | 234 | 231 | 206 | 100 | |
Tiny Tina's Wonderlands (2022) | 339 | 289 | 224 | 182 | 131 | 70 | |
F1 22 (2022) | 316 | 294 | 283 | 138.2 | 90.1 | 44.9 | |
Call of Duty Modern Warfare 2 2022 (2022) | 230 | 215 | 183 | 176 | 135 | 126 | 85 |
Spider-Man Miles Morales (2022) | 134 | 131 | 118 | 116 | 113 | 83 | |
The Callisto Protocol (2022) | 195 | 181 | 145 | 144 | 114 | 68 | |
The Witcher 3 v4.00 (2023) | 240 | 189 | 173 | 150 | 104 | 50 | |
Dead Space Remake (2023) | 147 | 141 | 130 | 129 | 100 | 53 |
Razer Blade 16 Early 2023
låg | med. | hög | ultra | QHD DLSS | QHD FSR | QHD | 4K DLSS | 4K FSR | 4K | |
---|---|---|---|---|---|---|---|---|---|---|
GTA V (2015) | 186.6 | 185.2 | 183.4 | 140.7 | 125.2 | 143.7 | ||||
The Witcher 3 (2015) | 609.6 | 462.7 | 353.5 | 176.8 | 120.6 | |||||
Dota 2 Reborn (2015) | 218 | 204 | 196 | 194.7 | 176.7 | |||||
Final Fantasy XV Benchmark (2018) | 195.8 | 184.1 | 157.8 | 120.1 | 74.1 | |||||
X-Plane 11.11 (2018) | 201 | 177.7 | 137 | 117.5 | ||||||
Strange Brigade (2018) | 438 | 365 | 351 | 323 | 237 | 122.3 | ||||
Shadow of the Tomb Raider (2018) | 228 | 201 | 196 | 176 | 154 | 84 | ||||
Metro Exodus (2019) | 197 | 170.4 | 145 | 121.7 | 102 | 67 | ||||
Control (2019) | 239.1 | 204.7 | 157 | 102 | 50.1 | |||||
Borderlands 3 (2019) | 207.7 | 176.6 | 158.1 | 133.5 | 108.7 | 59.8 | ||||
Valorant (2020) | 336 | |||||||||
Horizon Zero Dawn (2020) | 128 | 112 | ||||||||
Mafia Definitive Edition (2020) | 280.3 | 184 | 171.3 | 121.6 | 70.4 | |||||
Watch Dogs Legion (2020) | 140 | 129 | 121 | 110 | 93 | 56 | ||||
Far Cry 6 (2021) | 181 | 149 | 134 | 125 | 115 | 71 | ||||
Dying Light 2 (2022) | 184.1 | 160.4 | 140.9 | 97.8 | 48.6 | |||||
Cyberpunk 2077 1.6 (2022) | 121.1 | 118.1 | 113.8 | 106.2 | 81.2 | 40 | ||||
Ghostwire Tokyo (2022) | 198.7 | 159.6 | 154 | 145 | 135.9 | 73.1 | ||||
The Callisto Protocol (2022) | 177.8 | 159.8 | 119.9 | 120.4 | 93.1 | 55.3 | ||||
Cyberpunk 2077 2.1 Phantom Liberty (2023) | 83 | |||||||||
Skull & Bones (2024) | 50 | |||||||||
Horizon Forbidden West (2024) | 56.1 | 54.8 | 39.5 | |||||||
F1 24 (2024) | 226 | 236 | 210 | 85.3 | 59.1 | |||||
Black Myth: Wukong (2024) | 110 | 89 | 71 | 42 | 47 | 31 | 33 | 18 | ||
Star Wars Outlaws (2024) | 84.3 | 81.5 | 74.1 | 64.4 | 59.1 | 47.7 | 35.8 | 20.5 | ||
Stalker 2 (2024) | 63.1 | 50.3 | 30.9 |
Schenker XMG Neo 16
låg | med. | hög | ultra | QHD | 4K | |
---|---|---|---|---|---|---|
GTA V (2015) | 137.5 | 137.7 | 88.9 | |||
The Witcher 3 (2015) | 216.4 | 137.1 | ||||
Dota 2 Reborn (2015) | 227 | 202 | 191.2 | 177.3 | 179.4 | |
Final Fantasy XV Benchmark (2018) | 180.7 | 158 | 91.5 | |||
X-Plane 11.11 (2018) | 204 | 179.7 | 135.5 | 124.2 | ||
Strange Brigade (2018) | 482 | 396 | 372 | 350 | 311 | 160.3 |
Shadow of the Tomb Raider (2018) | 207 | 168 | 103 | |||
Metro Exodus (2019) | 131.51 | 117.44 | 83.98 | |||
Control (2019) | 183.7 | 121.9 | 63.5 | |||
Borderlands 3 (2019) | 176 | 132.34 | 70.5 | |||
Mafia Definitive Edition (2020) | 187.9 | 168.1 | 91.8 | |||
Watch Dogs Legion (2020) | 127 | 113 | 71 | |||
Assassin´s Creed Valhalla (2020) | 161 | 130 | 78 | |||
Far Cry 6 (2021) | 139 | 134 | 92 | |||
Dying Light 2 (2022) | 171.8 | 118.4 | 61.7 | |||
Cyberpunk 2077 1.6 (2022) | 122.8 | 94.26 | 49.15 | |||
Ghostwire Tokyo (2022) | 230.1 | 196.8 | 97.7 | |||
Tiny Tina's Wonderlands (2022) | 189.4 | 135.8 | 73.7 | |||
F1 22 (2022) | 137.4 | 90.5 | 45.3 | |||
Call of Duty Modern Warfare 2 2022 (2022) | 181 | 137 | 86 | |||
Spider-Man Miles Morales (2022) | 121.4 | 115.7 | 84.2 | |||
The Callisto Protocol (2022) | 143.5 | 116.5 | 69.8 | |||
The Witcher 3 v4.00 (2023) | 141.8 | 102.9 | 52.8 |
Stresstest
De testade bärbara datorerna uppvisade inte några betydande inkonsekvenser på grund av termisk strypning när de belastades med The Witcher 3 vid 1080p Ultra.
Titan GT77 HX 13V:s RTX 4090 tycktes ha vissa problem med att upprätthålla den initiala bildfrekvensen, men lyckades återhämta sig efter en tid. XMG Neo 16:s RTX 4090-implementering klarar sig något bättre i detta avseende.
Razer Blade 16:s RTX 4080 klarar sig däremot bra i detta stresstest.