AMD Ryzen overklokken - Workshop voor Ryzen 3000 en 5000 (2024)

Anno 2021 bestaat een ruime meerderheid van de los verkochte processors uit exemplaren van AMD. Wie nu een systeem samenstelt met een Ryzen-cpu, betreedt in veel gevallen een nieuwe wereld. Ruim een decennium lag de keuze voor een Intel-processor voor de hand. Ook het overklokken van een moderne AMD-processor werkt significant anders. Voor ieder die het maximale uit zijn Ryzen-chip wil halen, laten we in dit artikel alle mogelijkheden zien om zo'n processor te overklokken.

Daarvoor gebruiken we een systeem van PC Specialist dat we onlangs bespraken in een test van game-pc's. Dit systeem is voorzien van een watergekoelde 12-core-AMD Ryzen 9 5900X-processor in een ASUS ROG Crosshair VIII Hero-moederbord, een van de meest luxe socket AM4-moederborden van dit merk. Kortom, een uitstekende basis om het overklokken van een Ryzen-cpu mee te illustreren. Wees je er wel van bewust dat je garantie hierdoor vervalt, tenzij je een vooraf overgeklokte pc aanschaft.

Deze workshop is behalve voor Ryzen 5000-cpu's ook geschikt voor Ryzen 3000-processors; enkele verschillen daartussen merken we waar van toepassing op. Ook als je een oudere Ryzen hebt, kan dit artikel van pas komen, maar dan kunnen bepaalde mogelijkheden ontbreken of net even anders werken.

Overklokbasics bij AMD Ryzen

Voordat we ons kunnen verdiepen in het overklokken van Ryzen-processors, moeten we helder hebben welke klokfrequenties er allemaal zijn. Van oudsher wordt de kloksnelheid van de processorkernen bepaald door de baseclock (bclk), die standaard is ingesteld op 100MHz, en de multiplier ofwel cpu-ratio. Die multiplier kan in stappen van 0,25 worden ingesteld. Voor zijn standaardkloksnelheid van 3,7GHz gebruikt een Ryzen 9 5900X-processor bijvoorbeeld een multiplier van 37,0. Verwarrend genoeg wordt die standaardkloksnelheid tegenwoordig soms ook base clock genoemd, tegenover de boost clock in de turbomodus, maar daar heeft de bclk niets mee van doen.

Baseclock

De baseclock kan niet of amper worden overgeklokt. Goedkope moederborden bieden die mogelijkheid vaak in het geheel niet, maar ook op moederborden met de vereiste klokgenerator is een overklok van meer dan enkele procenten niet haalbaar. De baseclock dient namelijk als basis voor veel meer klokfrequenties dan alleen die van de processorcores. Als gevolg daarvan modificeer je met een baseclock-overklok niet alleen de cpu-snelheid, maar ook de snelheid waarop onder meer het geheugen, het infinity fabric en de PCI Express-controller werken. Vooral die laatste wordt al snel instabiel bij een lichte overklok, wat kan leiden tot problemen met het herkennen van de videokaart en NVMe-ssd's.

Multipliers of ratio's

De multiplier is daarentegen vrij in te stellen. In tegenstelling tot bij Intel heb je daar geen speciale processorvariant voor nodig; elke Ryzen-chip voor desktops is overklokbaar. De enige beperking is de chipset van je moederbord; de A-serie chipsets voor de goedkoopste socket AM4-moederborden ondersteunt dat niet.

Andere instelbare multipliers zijn verantwoordelijk voor onder meer de kloksnelheden van het geheugen, de geheugencontroller en de Infinity Fabric-bus. Op de ins en outs daarvan komen we verderop in dit artikel terug; eerst kijken we naar hoe AMD's boostalgoritme zelf probeert het aanwezige overklokpotentieel te benutten.

Disclaimer

Bij het overklokken van een processor overschrijd je de standaardspecificaties van het product. Hierdoor vervalt je garantie. Toepassing van de in dit artikel uiteengezette technieken is geheel op eigen risico; Tweakers aanvaardt geen enkele aansprakelijkheid in het geval van schade.

AMD's turbo: Precision Boost

Boostalgoritmes als Intels Turbo Boost en AMD's Precision Boost proberen het overklokpotentieel van een processor voor een deel al standaard te benutten. Beide technieken maken het mogelijk om de vooraf ingestelde limieten voor de kloksnelheid en het stroomverbruik van de processor te overschrijden, mits alle andere factoren dat toelaten.

Intel bracht dit principe voor het eerst op de markt met de eerste Core i7-processors in 2008, met codenaam Nehalem. De werking was toen doodsimpel. Als niet alle cores volledig werden gebruikt, kon de kloksnelheid van de overgebleven rekenkernen worden opgevoerd in stappen van 100MHz, lees: via de multiplier, tot een bepaald maximum. Als de limieten op het vlak van stroomtoevoer of temperatuur werden bereikt, werd de klokfrequentie stapsgewijs verlaagd totdat dat wel weer het geval was.

Bij Turbo Boost 2.0 (Sandy Bridge, 2011) maakte Intel het mogelijk om voor een korte periode de tdp van de processor te overschrijden. Fabrikanten van retailmoederborden stelden de tijdslimiet daarvoor in de praktijk op oneindig in. Vandaar dat een moderne Intel-chip in een zelfbouwsysteem continu tot boven zijn tdp boost. Vanaf Skylake-X (2017) rust Intel zijn processors uit met Turbo Boost 3.0, waarbij de twee 'beste' cores van een processor nog 100 tot 200MHz hoger kunnen klokken.

AMD's tegenhanger was jarenlang Turbo Core, dat we in de Phenom II X6- en FX-processors tegenkwamen. In vergelijking met de techniek van Intel was deze functie relatief basaal. De kloksnelheid werd uitsluitend behaald op basis van de ruimte die overbleef binnen de tdp. Voor de Ryzen-processors ontwikkelde AMD dan ook een compleet nieuw boostprincipe, dat naar de naam Precision Boost luistert.

AMD Precision Boost

Precision Boost is een stuk intelligenter dan oudere turbomethoden. Om te beginnen gebruikt het de input van honderden sensors die continu allerlei aspecten van de processor monitoren. Daarbij moet je onder meer denken aan de temperaturen, de spanning en het verbruik van zo'n beetje elk chiponderdeel. Op basis van al die data wordt elke milliseconde bepaald hoe hoog elke processorkern kan boosten.

Cruciaal zijn verder dat de kloksnelheid op basis van kwart-multipliers kan worden bijgesteld, dus in stappen van 25MHz, en dat de klokfrequentie (sinds Ryzen 2000) lineair schaalt met het aantal cores dat wordt belast. Dat klinkt logisch, maar is bij Intel nog altijd niet het geval; een Core i9 10900K kan fors turbo'en als een of twee cores worden belast, maar werkt altijd op 4,8GHz zodra er tussen de drie en tien cores aan het werk zijn.

In theorie benut AMD dus een groter deel van het potentieel van een processor dan Intel met zijn grovere Turbo Boost doet. Daar werd AMD voor een deel toe gedwongen, omdat de eerste generaties Ryzen-processors over het algemeen niet erg hoog klokten en de beoogde singlecore-turbosnelheid uitsluitend voor de 'best gelukte' cores haalbaar was.

AMD neemt de volgende factoren mee in zijn Precision Boost-algoritme:

  • temperatuur
  • type workload
  • aantal actieve cores
  • stroomverbruik van de complete processor (in watt)
  • stroomverbruik van de cpu-stroomvoorziening (in A)
  • firmware en software (biosversie en chipsetdriver)
  • OS-instellingen
  • boostsnelheidslimiet volgens de productspecificaties

Een aantal van die zaken spreekt redelijk voor zich. Om te voorkomen dat een van de factoren werkt als bottleneck voor het boostmechanisme, is het zaak om een goede cpu-koeler en een moederbord met een afdoende stroomvoorziening te hebben. Ook is het van belang dat je de nieuwste versies van alle software gebruikt.

Omdat het type workload eveneens een factor is, boost de processor doorgaans hoger bij lichtere taken. Dat klinkt misschien een beetje contra-intuïtief, maar een lichte taak verbruikt minder stroom en geeft het boostmechanisme zo meer ruimte. Een voorbeeld van een zware taak is een programma dat gebruikmaakt van langere AVX-instructies, die een relatief groot deel van de rekeneenheden binnen een processor aan het werk zetten.

Precision Boost Overdrive (2)

Je kunt het standaard Precision Boost-mechanisme al zien als automatisch overklokken, maar een belangrijk feit is dat de processor het geheel automatisch doet. Deze vorm van overklokken valt dus binnen de garantie. Precision Boost houdt zich aan de stroomlimieten die AMD voor zijn Ryzen-processors hanteert en zal de opgegeven kloksnelheden nooit overschrijden.

Er zijn drie belangrijke stroomlimieten van toepassing op elke socket AM4-processor:

  • package power tracking, het verbruik van de complete processor (in W);
  • thermal design current, de stroomtoevoer (in A) vanuit de vrm's op het moederbord bij een langdurige workload;
  • electrical design current, de stroomtoevoer (in A) vanuit de vrm's op het moederbord bij een korte piek.

De standaardinstellingen zijn afhankelijk van de tdp van een processor. Voor Ryzen-chips met een tdp van 105W, zoals de meeste Ryzen 7- en 9-modellen, geldt standaard een ppt van 142W, een tdc van 95A en een edc van 140A. Voor 65W-chips, zoals veel Ryzen 5's, is dat respectievelijk 88W, 60A en 90A.

Precision Boost Overdrive en Auto OC

Met deze kennis op zak kunnen we begrijpen wat Precision Boost Overdrive inhoudt. Deze instelling verruimt de drie stroomlimieten naar ofwel wat een moederbordfabrikant als maximum heeft opgegeven voor dat specifieke bord, ofwel waardes die je zelf instelt. Ervan uitgaande dat de kloksnelheid werd gelimiteerd door de stroomlimieten en niet door slechte koeling, kan de processor nu dus hoger boosten. In de praktijk profiteren vooral workloads die veel cores belasten hiervan, want zolang er een beperkt aantal cores wordt belast, kom je toch al niet snel in de buurt van deze limieten.

Daarmee is het tijd voor de eerste praktijktest van deze workshop. We hebben de single- en multithreaded tests van Cinebench 23 gedraaid op ons testsysteem met een AMD Ryzen 9 5900X-processor.

Zoals je om de hierboven beschreven redenen al zou verwachten, biedt PBO voornamelijk meerwaarde in de multithreaded test. Het inschakelen van PBO levert ons bijna achthonderd extra Cinebench-punten op. Daarvoor is wel een hogere spanning vereist, waardoor het stroomverbruik met 55W toeneemt. De singlethreaded resultaten zijn praktisch identiek aan de stockresultaten.

Ryzen 9 5900XCinebench 23 MTCinebench 23 ST
Stock (32GB)PBOStock (32GB)PBO
Score220132279116131611
Kloksnelheid4,35GHz4,53GHz4,89GHz4,88GHz
Spanning (Vcore)1,23V1,41V1,45V1,45V
Stroomverbruik110,4W165,9W27,4W26,6W

Op dit punt vormen de officiële kloksnelheden van de processor nog altijd een beperking. Samen met PBO kun je ook een Auto OC-optie activeren, al is die officieel geen onderdeel van PBO. In stappen van 25MHz kies je hier een offset van maximaal 200MHz, die boven op de officiële maximale boostsnelheid van de processor komt. Hiermee geef je PBO niet alleen op het gebied van stroomtoevoer, maar ook wat de kloksnelheden betreft meer speelruimte. In de praktijk zien we echter amper verschil met de resultaten zonder Auto OC.

Ryzen 9 5900XCinebench 23 MTCinebench 23 ST
Stock (32GB)PBO + Auto OCStock (32GB)PBO + Auto OC
Score220132282516131612
Kloksnelheid4,35GHz4,52GHz4,89GHz4,88GHz
Spanning (Vcore)1,23V1,41V1,45V1,46V
Stroomverbruik110,4W167,0W27,4W26,2W

PBO2 en undervolten

Het oprekken van de stroomlimieten maakt weliswaar hogere klokfrequenties mogelijk, maar leidt ook tot een toename van het stroomverbruik. Een populaire methode om dat tegen te gaan, is het verlagen van de spanning waarop de processor werkt, oftewel undervolten. Vaak zit er namelijk de nodige rek tussen wat AMD in de fabriek instelt, en wat een processor daadwerkelijk nodig heeft om een bepaalde kloksnelheid te halen.

Tot en met de Ryzen 3000-serie heb je de keuze om een vaste offset in te stellen. Stel je hiervoor bijvoorbeeld -25mV (-0,025V) in, dan zal de processor voor elke mogelijke klokfrequentie een 25mV lagere spanning kiezen dan wat hij standaard zou doen. Bij de Ryzen 5000-serie is deze optie echter ingeruild voor Precision Boost Overdrive 2, dat in november 2020 door AMD werd toegevoegd aan het bios van 400- en 500-seriemoederborden.

Eerder noemden we al dat de ene taak 'zwaarder' is voor een processor dan de andere, en dan ook in verschillende boostsnelheden kan resulteren. Ook bij het undervolten merk je dit; bij de zwaarste taken kan de spanning minder ver omlaag voordat het systeem instabiel wordt. Een traditionele undervolt is bij elke workload gelijk, maar omdat je een systeem wilt dat onder alle omstandigheden stabiel is, wordt die beperkt door de maximaal mogelijke undervolt in een worstcasescenario.

PBO2 tracht dit op te lossen door de lijn tussen spanning en kloksnelheid, de v/f-curve, niet op elk punt evenveel te bewerken. Hiervoor stel je een aantal 'counts' in, waarbij elke count staat voor ongeveer 3mV bij zware taken en 5mV bij lichte taken. Bij tien counts zal de processor dus 30mV undervolten als hij zwaar wordt belast, terwijl dat kan oplopen tot 50mV bij een relatief lichte belasting. Stel dat dit voorbeeld het maximaal haalbare van de processor is, dan benut je dus 20mV undervolt in lichte scenario's die je met een reguliere, lineaire undervolt niet had kunnen benutten.

De maximale undervolt waarop onze Ryzen 9 5900X wilde werken, was twintig counts, oftewel 60mV bij zware workloads en 100mV bij lichte workloads. In de multithreaded test leverde dat een kloksnelheid van 4,64GHz op, goed voor een bijna 6 procent hogere score. In tegenstelling tot bij de reguliere versie van PBO gaat ook de singlethreaded score erop vooruit, bij een kloksnelheid van 4,96GHz.

Hoewel deze instelling stabiel genoeg was om Cinebench-runs te draaien, kwamen we bij langdurig stresstesten toch af en toe een vastloper tegen. Met vijftien counts (45-75mV) was het systeem wel volledig stabiel, ook de scores met die instelling vind je in de onderstaande tabel. De kloksnelheden zijn dan iets lager; in feite wordt de vrijgekomen speelruimte door de undervolt direct aangegrepen voor hogere klokfrequenties.

Ryzen 9 5900XCinebench 23 MTCinebench 23 ST
Stock (32GB)PBO2 -15PBO2 -20Stock (32GB)PBO2 -15PBO2 -20
Score220132321123312161316231631
Kloksnelheid4,35GHz4,61GHz4,64GHz4,89GHz4,94GHz4,96GHz
Spanning (Vcore)1,23V1,41V1,41V1,45V1,47V1,46V
Stroomverbruik110,4W166,6W170,7W27,4W29,6W30,2W

Ryzen Master en handmatige overklok

Voor overklokken duik je traditioneel liefst het bios in, maar AMD heeft vrijwel elke overklokfunctie ook beschikbaar gesteld via zijn Ryzen Master-software. Misschien nog wel belangrijker dan het kunnen instellen daarvan, is de hoeveelheid nuttige informatie over je processor die dit programma toont. AMD heeft zelf een uitgebreide handleiding (pdf) voor Ryzen Master online staan.

In het hoofdscherm van de 'advanced view' zie je in een oogopslag wat de interne configuratie van je processor is. In het geval van onze Ryzen 9 5900X zijn dat twee ccd's met elk zes actieve cores. Je ziet ook welke van de cores in een ccd het best presteren. De 'best gelukte' core wordt aangeduid met een geel sterretje; de op een na beste core herken je aan een grijs bolletje.

Verder geeft Ryzen Master je informatie over de actuele temperaturen, de kloksnelheden en de drie stroomlimieten die we eerder bespraken. Zo kun je eenvoudig achterhalen wat op dit moment de beperking vormt voor nog hogere boostsnelheden.

Default, PBO, auto-OC en manual

Wil je instellingen aanpassen, dan klik je links op een van beide profielen. Vervolgens kun je kiezen uit vier modi: default, PBO, auto-OC en manual. Default is vanzelfsprekend de standaardmodus, terwijl PBO je toestaat om de stroomlimieten van het moederbord in plaats van die van de processor te hanteren. De derde optie voegt aan het gebruik van PBO nog eens een offset van maximaal 200MHz toe, zoals besproken op de vorige pagina.

De vierde optie is een handmatige overklok. Kort gezegd is dat een traditionele overklok, waarbij uitsluitend de multiplier wordt verhoogd. Via de 'included'-knop kun je kiezen van welke core(s) je de instellingen wil veranderen; vaak wordt er simpelweg één (hogere) multiplier voor alle cores ingesteld. Bovendien beveelt AMD aan om de cpu-spanning vast in te stellen bij een handmatige overklok, want als je die automatisch laat vaststellen, wordt met het oog op de stabiliteit al gauw een te hoge spanning gekozen.

Load line calibration

Bij het handmatig instellen van de cpu-spanning (Vcore) treedt een verschijnsel op dat Vdroop heet. Ondanks het vastzetten zakt de spanning in op het moment dat de processor veel stroom verbruikt, wat tot instabiliteit kan leiden en in de praktijk betekent dat je in idle onnodig veel spanning zou moeten geven om de afname onder belasting vooraf te compenseren. Om dit te compenseren, vind je in het bios een llc-optie.

Llc kun je zien als ‘overvolten’ op basis van de belasting, met als doel de uiteindelijke spanning gelijk te houden. Op de automatische stand zou llc dit al voldoende moeten doen, maar dat valt soms tegen. Het kiezen van een hogere/vlakkere stand kan dit euvel wel verhelpen. Enigszins verwarrend is dat ‘level 1’ bij sommige fabrikanten de meeste en bij andere juiste de minste correctie betekent, maar in de meeste moderne bios'en staat gelukkig een grafiekje dat duidelijk aangeeft welk niveau tot welk gedrag leidt.

De resultaten met PBO en Auto OC hebben we op de vorige pagina al besproken. Met een handmatige overklok en een vaste spanning van 1,40V kwamen we tot een stabiele kloksnelheid van 4,75GHz. Dat levert een mooie boost van de multithreaded score op, maar die 2000 punten extra kosten je wel 60W aan stroomgebruik. Doordat de singlethreaded boost bij een handmatige overklok niet meer werkt, valt de singlethreaded score juist lager uit dan met de standaardinstellingen.

Ryzen 9 5900XCinebench 23 MTCinebench 23 ST
Stock (32GB)Manual OCStock (32GB)Manual OC
Score220132406316131569
Kloksnelheid4,35GHz4,75GHz4,89GHz4,75GHz
Spanning (Vcore)1,23V1,40V1,45V1,40V
Stroomverbruik110,4W170,7W27,4W24,8W

Je kunt de wijzigingen in het door jou gemaakte profiel opslaan met de apply-knop onderin. Met 'apply & test' kun je direct een ingebouwde stresstest draaien, die kort controleert of de toegepaste instellingen stabiel zijn. Wil je zeker weten of je uiteindelijke overklok volledig stabiel is, dan kun je beter een langdurige test of een scala aan verschillende loads gebruiken.

Verder biedt Ryzen Master uitgebreide opties om het geheugen en de Infinity Fabric-bus van de processor te overklokken. Daarover lees je meer op de volgende pagina.

Geheugen overklokken

Het overklokken van het werkgeheugen is een veelbesproken onderwerp in relatie tot Ryzen-processors. Dat komt niet in de laatste plaats doordat Precision Boost standaard al een groot deel van het reguliere overklokpotentieel benut, waardoor de ruimte voor winst met het handmatig tweaken van de processorsnelheid beperkt is. Daarnaast hebben de Ryzen-processors relatief veel rekenkracht, wat de nood aan geheugenbandbreedte vergroot, en vormt de geheugensnelheid een belangrijke pijler van de complete interne communicatie binnen de processor.

Koppeling Infinity Fabric aan intern geheugen

Met die interne communicatie doelen we op de koppeling van drie belangrijke klokfrequenties in een Ryzen-processor: de kloksnelheid van de Infinity Fabric-bus (fclk), de kloksnelheid van de geheugencontroller (uclk) en de kloksnelheid van het geheugen zelf (memclk). Die laatste klokfrequentie is door de werking van DDR-geheugen de helft van de geheugensnelheid; een DDR4-3200 module werkt dus op 1600MHz.

Vanaf de Ryzen 3000-serie kun je de fclk volledig vrij instellen en voor de uclk kiezen tussen een ratio van 1:1 en 1:2. Bij oudere Ryzens waren deze drie klokfrequenties per definitie gelijk aan elkaar. Nog altijd leidt een perfecte synchronisatie van deze kloksnelheden echter tot een prestatiebonus. AMD noemt zelf bijvoorbeeld DDR4-3600 met een fclk, uclk en memclk van 1800MHz als ideale optie. In de praktijk gaat de fclk van veel Ryzen 5000-chips tot ongeveer 1900MHz, terwijl met sommige goed gelukte cpu's 2000MHz mogelijk is. Daaruit volgt dat je voor geheugen met een snelheid van DDR4-4000 en hoger niet langer een 1:1-ratio tussen memclk en de overige klokfrequenties kunt aanhouden. Ook bij bijzonder langzaam geheugen kan het handmatig instellen van de fclk een gunstig effect hebben. Gebruik je bijvoorbeeld DDR4-2666 (1333MHz), dan kan een overklok van de fclk naar bijvoorbeeld 1800MHz meer opleveren dan je verliest aan het 'out of sync' laten lopen.

Geheugentimings

De kloksnelheid van het geheugen is echter maar één zijde van de medaille. De andere zijde bestaat uit de latencies, oftewel de reactietijd van de geheugenmodule op lees- en schrijfopdrachten. Waar voor de kloksnelheid geldt dat hoger beter is, wil je de latencies juist het liefst zo laag mogelijk houden. De latencies worden bij geheugen ook wel timings genoemd, waarvan de cas latency de bekendste is. Bij geheugen voor overklokkers is het gebruikelijk om de vier primaire timings te specificeren: 14-14-14-36 betekent bijvoorbeeld een CL, tRCD en tRP van 14 kloktikken en een tRAS van 36 kloktikken. Inclusief de secundaire en tertiaire zijn er echter tientallen timings, die stuk voor stuk definiëren hoe lang een specifieke actie binnen de matrixstructuur in een geheugenchip duurt. De precieze betekenis van al deze subtimings voert te ver voor deze workshop, maar we verwijzen je graag naar dit artikel als je daar meer over wil weten.

True latency als vuistregel voor de latencyparadox

Bovenstaande levert al snel de vraag op wat nu sneller is: DDR4-3200 met CL14 of DDR4-3600 met CL16 bijvoorbeeld? Hoewel de ene applicatie gevoeliger is voor de doorvoersnelheid en de andere juist voor latency, bestaat er wel een vuistregel: true latency. De formule hiervoor is cas-latency / werkelijke snelheid * 1000 = true latency in nanoseconden. Voor de twee genoemde voorbeelden levert deze formule respectievelijk 8,75ns en 8,89ns op; DDR4-3200 CL14 is dus ietsje sneller. In de Pricewatch tonen we deze true latency pontificaal. Helaas zien we ook dat fabrikanten hierop proberen in te spelen door geheugenkits op de markt te brengen met een zo strak mogelijke cas-latency, wat ten koste gaat van alle overige latencies. Bijvoorbeeld deze DDR4-3600-kit met CL16-19-19-39, die beduidend langzamer is dan zijn duurdere broertje met CL16-16-16-36, maar waar je in de berekende true latency niets van terugziet.

Ryzen DRAM Calculator

Vanwege de koppeling van de geheugensnelheid aan de andere interne klokfrequenties bij Ryzen, en daaruit volgend het feit dat je praktisch beperkt bent tot ongeveer 1800MHz (DDR4-3600), ligt de focus bij het overklokken van geheugen vooral op de timings. Het handmatig tunen van de tientallen subtimings zou een tijdrovend karwei zijn, maar gelukkig kun je gebruikmaken van het programma Ryzen DRAM Calculator. Dit tooltje is ontwikkeld door een enthousiaste Ryzen-gebruiker die bekend is onder de nickname '1usmus', en spuwt met één druk op de knop aanbevolen timings voor jouw geheugenkit uit.

Eerst zul je moeten achterhalen welk type geheugenchips er exact in de door jou gekochte geheugenmodules zitten. Daarvoor gebruik je de gratis versie van het programma Thaiphoon Burner, waarin je een rapportage van alle geheugenspecificaties in nanoseconden kunt genereren. Vooral geheugenmodules met Samsung B-die- of Micron E-die-chips zijn vermaard vanwege het overklokpotentieel. Helaas garandeert geen enkele geheugenfabrikant het gebruik van een bepaald type chip. De beste garantie op B-die is een kit kopen met specificaties die in de praktijk alleen met B-die haalbaar zijn. De tool B-die finder kan daarbij van pas komen. Micron E-die wordt vooral gebruikt in de luxere kits van Micron-dochtermerk Crucial.

Het rapport afkomstig uit Thaiphoon Burner importeer je vervolgens in Ryzen DRAM Calculator. De calculator geeft je twee presets: 'safe' en 'fast'. Het idee is dat de safe-timings altijd goed werken, terwijl de fast-timings meer het randje opzoeken. De aanbevolen timings voer je stuk voor stuk in, naar wens in de Ryzen Master-software of direct in het bios. Het programma kan ook hogere spanningen voor het geheugen en diverse soc-onderdelen aanbevelen.

Ryzen DRAM Calculator in de praktijk

De Corsair Vengeance LPX-kit van 32GB (4x 8GB) die in de PC Specialist-pc zat, bleek al aardig op zijn tenen te lopen. Volgens Thaiphoon Burner zat er een oudere variant Micron-geheugen in, waarvoor Ryzen DRAM Calculator geen ondersteuning bood. De standaardtimings waren met CL18-22-22-42 weinig hoopgevend, dus hebben we het geheugen tijdelijk verwisseld voor een setje G.Skill Flare X DDR4-3200 CL14-14-14-34 met de befaamde Samsung B-die-chips.

We hebben het geheugen op twee manieren geprobeerd over te klokken: eerst door de strakst mogelijke timings te vinden bij een hogere kloksnelheid van DDR4-3600, daarna door de timings bij de standaardsnelheid van DDR4-3200 te optimaliseren. Voor dat eerste adviseerde Ryzen DRAM Calculator ons timings van CL14-15-15-30, maar daarmee bleef het systeem onverbiddelijk hangen tijdens het post-proces. Het gebruikte ASUS-moederbord heeft hiervoor een speciale 'safe mode'-knop, die je automatisch het bios in hoort te booten met veilige settings, maar zonder dat je alle ingevulde waardes kwijt bent, zoals bij een volledige cmos-reset. Om ons onduidelijke redenen functioneerde deze functie echter niet. In de praktijk moesten we na elke iets te enthousiaste overklokpoging dus het bios resetten. Gelukkig blijven opgeslagen profielen daarbij wel bewaard, dus we zouden aanraden om alle settings waar je op dat moment niet aan sleutelt, op te slaan in een bios-profiel, zodat je snel verder kunt als je een keer een stapje te ver bent gegaan.

Uiteindelijk bleken twee subtimings van de door Ryzen DRAM Calculator geadviseerde preset wat te optimistisch: de tCL (15 in plaats van 14) en de tRDWR (10 in plaats van 8). Dat kan simpelweg een kwestie van pech zijn, maar mogelijkerwijs speelt ook een rol dat de Ryzen DRAM Calculator officieel tot en met de Ryzen 3000-serie ondersteunt. De geheugencontroller in de Ryzen 5000-serie is goeddeels identiek, maar wellicht leiden kleinigheden toch tot afwijkingen op detailniveau.

Zoals gezegd lieten we Ryzen DRAM Calculator ook de timings optimaliseren met de standaardsnelheid van DDR4-3200. Naast een versoepeling van de tCL naar 13 behelsde dat voornamelijk kleine veranderingen in de subtimings.

Onder de streep leverden de DDR4-3600 CL15-settings ons nipt hogere scores in Cinebench op dan DDR4-3200 met CL13-14. Vermoedelijk speelt de hogere fclk bij die eerste preset minstens zo'n grote rol als de geheugensnelheid zelf. Overigens profiteren vooral geheugenintensieve programma's van sneller geheugen. In bijvoorbeeld een cpu-bottlenecked game zul je hier meer resultaat van zien dan onderstaande Cinebench-scores doen lijken.

Ryzen 9 5900XStock (DDR4-3200 CL14)DDR4-3200 CL13-14DDR4-3600 CL15
Cinebench 23 MT219702211322199

Clock Tuner for Ryzen 2.0

Op de pagina over PBO2 stipten we al de mogelijkheden van undervolten aan. Afhankelijk van de kwaliteit van je processor kunnen de cores toe met minder spanning dan er volgens de standaard v/f-curve wordt toegepast. Die is immers bedacht op de minimale kwaliteit die een processor moet hebben om als een bepaald model op de markt te worden gebracht. Met een beetje geluk kan je processor dus met minder spanning toe, wat rechtstreeks resulteert in een lager stroomverbruik en minder warmte.

Net als het stuk voor stuk tunen van de geheugentimings zou ook het handmatig optimaliseren van elke core monnikenwerk worden. 1usmus, de ontwikkelaar van Ryzen DRAM Calculator, heeft ook voor dit doel een programma geschreven dat optimalisatie per ccx grotendeels automatiseert. Op 3 februari heeft hij versie 2.0 van Clock Tuner for Ryzen uitgebracht, een grote update waarbij ondersteuning voor de Ryzen 5000-processors wordt toegevoegd. Verder biedt CTR 2.0 ondersteuning voor een groot deel van de op Zen 2-gebaseerde processors, inclusief de Ryzen Pro-apu's in de 4000-serie.

Je kunt CTR 2.0 downloaden via de Groningse vrienden van Guru3D, waar je ook een uitgebreid Engelstalig artikel van de maker van CTR vindt.

Voorbereidingen

Voordat je CTR 2.0 kunt gebruiken, moet je het bios volledig overklokvrij instellen; er mag geen handmatige overklok, PBO of vergelijkbare functie geactiveerd zijn. Daarnaast kun je je werkgeheugen het best conservatief instellen, want je uitgangspunt moet een volledig stabiel systeem zijn. Als stresstest maakt CTR gebruik van Cinebench 20. Voordat je van start kunt gaan, moet je dus die versie van Cinebench downloaden, de executable in de CB20-map van CTR plakken en die eenmalig los openen om de gebruiksvoorwaarden van Cinebench te accepteren.

Diagnose en tuning

De eerste fase van het optimalisatieproces is de diagnose. Je start de diagnose door op de knop Diagnostic te klikken op het Tuner-tabblad. Vervolgens test het programma diverse instellingen, waarbij in principe geldt dat deze fase langer duurt als je een betere processor hebt. Mocht een instelling leiden tot een vastloper, dan herkent CTR dat en wordt het optimaliseren negentig seconden na de reboot automatisch hervat.

Na de diagnose geeft CTR je processor een classificatie (in ons geval Silver) en adviseert het drie sets instellingen: twee overklokprofielen (een beperkte en zware overklok) en één profiel voor een maximale undervolt. Standaard neemt CTR het eerste overklokprofiel over, waarmee je direct kunt doorgaan naar de volgende stap door op de Tune-knop te klikken. Voor eventueel later gebruik kun je natuurlijk altijd even de complete resultaten vastleggen.

Nu begint een nieuwe cyclus van tests, die eindigt met de mogelijkheid om het gemaakte profiel op te slaan als 'profiel 1'. Klik hiervoor op fill, save en apply. De toegepaste spanning is uiteindelijk voor elk ccx gelijk, maar de daaraan gekoppelde kloksnelheid verschilt wel. In ons geval heeft CTR een spanning van 1,188V gekozen, waarbij ccx1 op 4475MHz loopt en ccx2 op 4500MHz. Bij Zen 2-processors met één ccx per vier in plaats van acht cores en bij Threadrippers kan de variatie, en daarmee de potentiële winst, nog een stuk groter zijn.

Hybrid OC

Je kunt ook een tweede profiel aanmaken, bijvoorbeeld op basis van een hogere spanning en klokfrequentie. CTR wisselt met de optie Hybrid OC tussen beide profielen aan de hand van de actuele belasting. Bij een cpu-gebruik boven de 70 procent wordt standaard het eerste profiel gebruikt; bij een lagere belasting is het agressievere tweede profiel actief. Heb je maar één profiel, dan wordt in dat tweede geval de standaard Precision Boost gebruikt. Dit alles is uiteraard volledig naar eigen wens in te stellen.

Resultaten

Voor onze test zijn we uitgegaan van het aanbevolen eerste overklokprofiel. In de multithreaded test zien we een mooi resultaat: niet alleen valt de Cinebench-score bijna 4 procent hoger uit, maar het stroomverbruik is ook nog eens bijna 9W lager. De efficiëntie is dus flink verbeterd. Helaas heeft dit zijn keerzijde in de singlethreaded test, want je verliest 8 procent aan prestaties. Daar staat dan wel een veel lager verbruik tegenover.

Ryzen 9 5900XCinebench 23 MTCinebench 23 ST
Stock (32GB)CTR 2.0Stock (32GB)CTR 2.0
Score220132283916131485
Kloksnelheid4,35GHz4,475/4,5GHz4,89GHz4,475GHz
Spanning (Vcore)1,23V1,19V1,45V1,19V
Stroomverbruik110,4W101,7W27,4W12,5W

Inmiddels heeft 1usmus te kennen gegeven dat hij alweer aan een volgende release van CTR werkt. In CTR 2.1 moet de functionaliteit van PBO gecombineerd kunnen worden met de undervolt die CTR toepast. Ook ondersteuning voor de curve optimizer van PBO2 staat op de roadmap. Voor de laatste updates raden we je aan om de ontwikkelaar op Twitter in de gaten te houden.

Vergelijking resultaten

Op de voorgaande pagina's hebben we de Ryzen 9 5900X-processor in ons testsysteem op diverse manier overgeklokt. De effecten daarvan blijken aardig uiteen te lopen. Zo leidt de handmatige overklok tot de hoogste multithreaded prestaties, maar is de singlethreaded score daarbij juist lager dan stock. De hoogste singlethreaded score behaalden we met PBO2, waarbij het boostmechanisme van de processor intact blijft. De hoogste scores hebben we in onderstaande tabel schuingedrukt.

Ryzen 9 5900XStock (32GB)PBOPBO + Auto OCPBO2 -15PBO2 -20Manual OCCTR 2.0
Cinebench 23 MT22013227912282523211233122406322839
Cinebench 23 ST1613161116121623163115691485

Ten slotte hebben we de methoden die de beste single- en multithreaded scores opleverden, gecombineerd met de snelste geheugenoverklok. Ook hier zijn de snelste scores cursief. De snelste multithreaded score blijft de handmatige overklok naar 4,75GHz, die een 10 procent hogere score dan stock oplevert. Singlethreaded blijft de stabiele PBO2-setting het best presteren, al is de prestatiewinst hier met ruim 2 procent veel bescheidener.

In principe is geen van deze twee opties duidelijk de betere. Dat hangt eerder af van wat je belangrijk vindt voor jouw gebruiksscenario. Als je maximale prestaties wil bij taken die alle cores belasten, zoals rendering of compileren, dan ligt een handmatige all-core overklok het meest voor de hand. Bij gaming en licht gebruik kan het juist een voordeel zijn om het fijnmazige boostalgoritme te behouden en dus de PBO2-methode te prefereren.

Ryzen 9 5900XCinebench 23 MTCinebench 23 ST
Stock (16GB)Manual OC + MemPBO2 -15 + MemStock (16GB)Manual OC + MemPBO2 -15 + Mem
Score219702417223516160915741644
Kloksnelheid4,35GHz4,75GHz4,61GHz4,89GHz4,75GHz4,94GHz
Spanning (Vcore)1,23V1,40V1,41V1,45V1,40V1,47V
Stroomverbruik110,4W170,7W166,6W27,4W24,8W29,6W

Conclusie

Wie in het afgelopen decennium vooral Intel-processors heeft overgeklokt, zal gewend zijn geraakt aan overklokken via de multiplier. Dat is bij een AMD Ryzen-cpu nog altijd een optie, maar levert niet altijd de beste resultaten op.

Een trend die we bij zowel AMD als Intel zien, is dat de processors steeds dichter op de limiet van wat technisch mogelijk is, worden geklokt. Het is niet mogelijk om simpelweg de singlecore-turbosnelheid op alle cores toe te passen, want die klokfrequentie is doorgaans alleen op de 'beste' cores haalbaar. Een handmatige all-core overklok betekent dus bijna per definitie dat de multithreaded prestaties verbeteren, maar in singlethreaded taken juist lager uitvallen.

In plaats daarvan kun je ook het standaard Precision Boost-algoritme gebruiken om de prestaties te verbeteren. Met PBO rek je de stroomlimieten waarbinnen de automatische boost werkt op, terwijl PBO2 je toestaat om dat te combineren met een dynamische undervolt. De multithreaded prestaties blijven zo nog altijd iets achter op een handmatige overklok, maar ook lightly threaded workloads profiteren nu. PBO2 is alleen beschikbaar voor de Ryzen 5000-serie; met een oudere processor kun je wel een statische undervolt instellen.

Ook het overklokken van het geheugen kan prestatiewinst geven. Gelukkig is DDR4-3200 al zo'n beetje de standaard, waarmee je het grootste deel van de winst al te pakken hebt. Doordat een Ryzen-processor optimaal werkt als de geheugenklok synchroon loopt met andere interne klokfrequenties, hebben snelheden ver boven DDR4-3600 weinig zin. Wel kun je de (sub)timings optimaliseren, bijvoorbeeld met behulp van Ryzen DRAM Calculator. Hoeveel rek daarin zit, is een combinatie van welk type geheugenchip er in je modules zit en hoeveel geluk of pech je hebt.

Een andere insteek is niet zozeer op zoek gaan naar maximale prestaties, maar naar een zo hoog mogelijke efficiëntie. Je kunt de PBO-limieten bijvoorbeeld bewust niet op het maximum instellen, liefst in combinatie met een undervolt. Clock Tuner for Ryzen 2.0 tracht het vinden van de optimale undervolt te automatiseren. Bij ons leidde dat tot hógere prestaties bij een láger stroomverbruik dan stock, maar doordat Precision Boost hierbij wordt uitgeschakeld, kost het wel singlethreaded prestaties.

De tijd waarin je met een paar klikken een kwart extra prestaties ontsloot, ligt helaas achter ons. Toch is het met enige moeite nog altijd mogelijk om meer uit je processor te halen dan standaard gebeurt, en dan heb je toch maar mooi de 'honderden slimme sensors' die Precision Boost gebruikt verslagen. Enige kennis van de interne werking van de Ryzen-processors is daarvoor wel vereist. Ben je zelf geïnspireerd geraakt en wil je je resultaten delen, doe dat dan in de comments hieronder of in de overkloktopics op GoT voor Zen3 en Zen2.

Inhoudsopgave

  • 1. Inleiding
  • 2. AMD's turbo: Precision Boost
  • 3. Precision Boost Overdrive (2)
  • 4. Ryzen Master en handmatige overklok
  • 5. Geheugen overklokken
  • 6. Clock Tuner for Ryzen 2.0
  • 7. Vergelijking resultaten
  • 8. Conclusie
  • 198Reacties

Multipage-opmaak

AMD Ryzen overklokken - Workshop voor Ryzen 3000 en 5000 (2024)
Top Articles
Latest Posts
Article information

Author: Lidia Grady

Last Updated:

Views: 6124

Rating: 4.4 / 5 (65 voted)

Reviews: 88% of readers found this page helpful

Author information

Name: Lidia Grady

Birthday: 1992-01-22

Address: Suite 493 356 Dale Fall, New Wanda, RI 52485

Phone: +29914464387516

Job: Customer Engineer

Hobby: Cryptography, Writing, Dowsing, Stand-up comedy, Calligraphy, Web surfing, Ghost hunting

Introduction: My name is Lidia Grady, I am a thankful, fine, glamorous, lucky, lively, pleasant, shiny person who loves writing and wants to share my knowledge and understanding with you.