Naar inhoud springen

FLOPS

Uit Wikipedia, de vrije encyclopedie
De prestaties van de computer
Naam FLOPS
megaFLOPS 106
gigaFLOPS 109
teraFLOPS 1012
petaFLOPS 1015
exaFLOPS 1018
zettaFLOPS 1021
yottaFLOPS 1024

FLOPS is een afkorting die staat voor floating point operations per second (zwevendekommabewerkingen per seconde).

FLOPS is een eenheid die wordt gebruikt om de rekenkracht van CPU's aan te duiden. Deze aanduiding is een aanvulling op de MIPS-eenheid, een andere snelheidsmeting van CPU's die voornamelijk de snelheid van instructieverwerking aangeeft.

FLOPS worden vaak gebruikt met de SI-voorvoegsels mega-, giga-, tera-, peta- en recent ook exa-.

Over het algemeen zijn GPU's krachtiger dan CPU's. Dit komt gedeeltelijk door een andere architectuur die GPU's op grafische kaarten gebruiken en doordat de CPU meer rekening moet houden met de snelheid van de randapparatuur.

FLOPS van de grootste supercomputer over de tijd

Over het algemeen halen huidige CPU's tussen de 20 en 100 Gflops, huidige GPU's halen op enkele-precisie-berekeningen meer dan 800 Gflops, maar vallen terug naar een kwart van deze snelheid bij dubbele-precisie-berekeningen.

Enkele voorbeelden van grafische kaarten met bijbehorende prestaties zijn:

  • De GTX 690 van NVIDIA met 5.621 Gflops
  • De AMD Radeon HD 7990 van AMD met 6.963 Gflops
  • De GTX 295 van NVIDIA met 1.788 Gflops
  • De Titan V van NVIDIA met 12,3 Tflops

Bovenstaande beschrijvingen zijn echter theoretische gevallen die alleen onder de meest ideale omstandigheden worden gehaald, berekend met SGEMM-benchmark of LINPACK.

Bij mainframes en supercomputers ligt het aantal FLOPS aanzienlijk hoger; de Cray XT5 Jaguar haalt 1,759 petaflops, de Japanse 'K Computer' 10,51 petaflops (november 2011) en de Sequoia[1] (juni 2012), met 16,32 petaflops. Als er een cluster gebouwd zou worden met per server een Intel Core i7 en 2 ATI Radeon HD4870 X2-kaarten, zouden er minimaal 361 servers nodig zijn om de snelheid van de Jaguar te behalen (theoretisch, in een perfecte omgeving). Dat is een stuk minder dan de duizenden die nodig zijn als er alleen CPU's gebruikt worden, maar dan alleen in enkele precisie.

Sinds juni 2018 voert de Amerikaanse supercomputer Summit[2] de lijst aan met 122,3 petaflops.

Sinds juni 2020 staat de Japanse supercomputer Fugaku[3] bovenaan de TOP500.

In oktober 2020 werd de Europese LUMI supercomputer aangekondigd.[4] Met meer dan 550 peak petaflops zal LUMI bovenaan de lijst van snelste supercomputers terecht komen. Opmerkelijk is ook dat LUMI op 100% hernieuwbare energie zal werken en uiteindelijk zelfs koolstofnegatief zal zijn.

Voorbeeld van Gflops-scores van enkele bekende CPU's:[5]

LINPACK-score 1kx1k (DP) Cores Threads Piek gigaFLOPS Werkelijke gigaFLOPS Efficiëntie (in %)
Cell (processor), 1 SPU, 3,2 GHz - - 1,83 1,45 79,23
Cell (processor), 8 SPU's, 3,2 GHz - - 14,63 9,46 64,66
Pentium 4, 3,2 GHz 1 1 6,4 3,1 48,44
Pentium 4 + SSE3, 3,6 GHz 1 1 14,4 7,2 50,00
Itanium, 1,6 GHz 1 1 6,4 5,95 92,97
Core i7, 3,2 GHz 4 8 70 - -