Prime95/MPrime

Prime95 bei der Probedivision
Basisdaten
Entwickler George Woltman
Aktuelle Version 30.8 build 17
(9. August 2022)
Betriebssystem Windows (Prime95), macOS (Prime95), Linux (MPrime), FreeBSD
Programmiersprache C, ASM86
Kategorie Primzahltester, besonders für Mersenne-Primzahlen; Benchmark
Lizenz Freeware, aber Kopplung an PrimeNet falls Suche nach Mersenne-Primzahlen
deutschsprachig nein
http://www.mersenne.org/

Prime95 (prime95.exe) ist ein Programm für Windows und macOS zum Testen der Primalität einer Mersenne-Zahl mithilfe des sogenannten Lucas-Lehmer-Tests. Es wird von GIMPS angeboten und von George Woltman als Software für Volunteer-Computing entwickelt. Die Softwareversionen für GNU/Linux und FreeBSD werden MPrime genannt und besitzen im Gegensatz zu Prime95 keine grafische Benutzeroberfläche.

Das Programm verfügt über eine der schnellsten bekannten Implementierungen für Multiplikationen, in dem es hochoptimierten Prozessor-Code zur Durchführung von schnellen Fourier-Transformationen verwendet. Die zugehörigen Routinen stehen als gwnum-Bibliothek in der Programmiersprache C zur Verfügung und werden von einigen anderen Programmen eingesetzt. Die gwnum ist frei nutzbar, jedoch müssen bei der Suche nach Mersenne-Primzahlen die Projektbedingungen (Software End User License Agreements „EULA) eingehalten werden.

Der Code für die Generierung von Prüfsummen ist aus Sicherheitsgründen nicht öffentlich vorhanden.

Einsatzzwecke

Verteiltes Rechnen

Das Programm kann als Software-Client für das PrimeNet, einer von GIMPS betriebenen zentralen Datenbank für Mersenne-Primzahlen, betrieben werden. Es verbindet sich dann in regelmäßigen Abständen mit dem PrimeNet-Server, um neue Arbeit anzufordern und fertige Ergebnisse abzuliefern. Die Berechnung erfolgt auf der CPU, während diese ungenutzt ist. Eine offizielle Unterstützung für GPUs existiert noch nicht. Mit CUDALucas (Lucas-Lehmer-Test) und mfaktc (Probedivision) existieren allerdings zwei CUDA-fähige Programme, deren Ergebnisse vom Server ebenfalls akzeptiert werden. Das PrimeNet verfügt Mitte 2011 über rund 62 Teraflops Rechenleistung.

Belastungstest

Prime95/Mprime kann unabhängig von der Teilnahme an PrimeNet und ohne Netzwerkverbindung als Belastungstest für Prozessoren verwendet werden, da interne Plausibilitätsprüfungen eventuell auftretende Rechenfehler oder Stabilitätsprobleme sichtbar machen. Die Intention der Programmverwendung ist dabei nicht die Suche nach Primzahlen, sondern eine möglichst intensive Auslastung der Prozessoren, welche zu einer hohen thermischen Belastung führt und so beispielsweise unzureichend montierte Kühlkörper am Prozessor nachweist. Neben der einfachen Prüfung von Standardhardware auf korrekte Funktion unter Belastung wird diese Funktion auch bei dem Übertakten und Betrieb von Prozessoren außerhalb der Herstellerspezifikation als Stabilitätstest eingesetzt.

Rechenleistung

Das Programm kann als Benchmark verwendet werden. Die Ergebnisse können der Öffentlichkeit automatisch durch den PrimeNet-Server zum Vergleich dargestellt werden.

Vergleich der CPU-Rechenleistung mit Hilfe des Prime95 und MPrime v26.6 Benchmarks
Plattform/CPU-Modell Takt-
Frequenz
(MHz)
Kerne FFT
Länge: 2048k
(ms)
FFT
Länge: 4096k
(ms)
Probedivision
Faktorenlänge: 65 bit
(ms)
TDP
(W)
rel. Durchsatz pro Kern und Tag
1) pro GHz Takt 2) pro Watt 3)
Intel Atom D510 1664 2 585,91 1954,40 25,65 13 0,23 0,14 0,0215
AMD Fusion E-350 1596 2 222,03 491,02 15,18 18 0,40 0,25 0,0278
Intel Pentium III 1151 1 438,10 922,58 50,59 30 0,31 0,27 0,0090
AMD Athlon 1054 1 457,40 774,49 56,08 60 0,36 0,34 0,0057
AMD Athlon XP 2000+ 1640 1 201,21 448,28 32,80 70 0,41 0,25 0,0036
Intel Pentium 4 3078 1 72,40 162,02 14,91 82 1,50 0,49 0,0060
AMD Phenom II X4 3414 4 34,86 76,27 4,59 125 4,32 1,27 0,0406
Intel Core2 Duo E8600 3334 2 34,15 73,07 4,89 65 4,17 1,25 0,0385
Sandy Bridge Pentium G620T 2159 2 41,09 72,53 4,99 35 3,54 1,64 0,0937
AMD Phenom II X6 1100T 3310 6 32,68 69,54 3,85 125 4,03 1,22 0,0586
Intel Core i5-2500K 3330 4 23,94 53,24 3,49 95 5,90 1,77 0,0745
Intel Core i7-2600K 3463 4 21,75 45,35 3,67 95 6,17 1,78 0,0749

1) Durchsatz pro Zeitspanne, welche Zeitspanne das ist, ist irrelevant.
2) Durchsatz geteilt durch die Taktfrequenz in GHz, keine Messungen bei 1 GHz Taktfrequenz (ergibt andere Werte)
3) Durchsatz geteilt durch die Taktfrequenz in GHz und die TDP in Watt, multipliziert mit der Kernanzahl. Dieser Wert ist Unsinn, da höhere Taktfrequenzen zweimal "weggerechnet" werden, einmal durch Division durch den Takt, ein zweites Mal durch Division der TDP bei diesem Takt. TDP ist weiterhin nicht die Leistungsaufnahme bei Prime95.

Faktorisierungsmethoden und Primzahltest

Prime95 kann zur Faktorisierung von Zahlen der Form benutzt werden. Im Normalfall sucht es jedoch nur nach Mersenne-Primzahlen, für die a = 1, b = 2, c = Primzahl und d = −1 gilt.

Das Programm unterstützt die Faktorisierungsmethoden:

  1. Probedivision
  2. Pollard-p − 1-Methode – P-1-Test
  3. Lucas-Lehmer-Test – LL-Test
  4. Elliptic Curve Method – ECM-Test
Probedivision
Exponent
bis zu
Obergrenze
CPUGPU
3.960.000260
5.160.000261
6.515.000262
8.250.000263
13.380.000264
23.390.000265
29.690.000266
38.300.000267
48.800.000268273
60.940.000269274
77.910.000270275
96.830.000271276
120.000.000272277
153.400.000273278
199.500.000274279
253.500.000275280
322.100.000276281
408.400.000277282
516.800.000278

Probedivision

Bezüglich der Menge aller zu testenden Zahlen, wird die Faktorisierungsmethode Probedivision dem eigentlichen Lucas-Lehmer-Primzahltest vorgeschaltet, um vergleichsweise schnell kleine Faktoren q in einzelnen Zahlen zu finden. Die Faktorisierungsmethode Probedivision zeigt Zahlen auf, die zusammengesetzt sind und deshalb keine Mersenne-Primzahlen sind. Diese Zahlen werden mit Hilfe des PrimeNet-Servers administriert. Auf sie kann der ECM-Test angewendet werden, der mögliche weitere Faktoren mit einer Länge bis etwa 60 Dezimalstellen effektiv findet. Hiernach wird mit jenen Zahlen, welche diesen ECM-Test durchlaufen, bei Bedarf zum Zahlkörpersieb übergegangen, das vom BOINC-Projekt NFS@Home angeboten wird.

Probedivision mit Grafikkarten

Seit den Anfängen der programmierbaren Grafikprozessoren im Jahr 2000 besteht die Möglichkeit, die Rechenleistung von Grafikkarten zur Berechnung von parallelisierbaren Rechenoperationen zu nutzen (GPGPU). In Zusammenarbeit der Firmen AMD, IBM, Intel und Nvidia wurde der erste Entwurf für OpenCL, eine Programmierschnittstelle u. a. für Grafikprozessoren, ausgearbeitet und schließlich bei der Khronos Group eingereicht.

Durch den derzeitigen Überschuss an GIMPS-Rechenkapazität im Bereich Probedivision durch GPGPU-Unterstützung leistungsfähiger Grafikkarten mittels der mfaktc Software und OpenCL, werden seit August 2011 höhere Obergrenzen verwendet. Da der Aufwand der Probedivision bei mfaktc proportional zur Faktorgröße ist, d. h. nur von der Größe des Faktors abhängt, wird diese Software für größere Faktoren zunehmend ungeeignet. Es wird im Vergleich zu den beiden anderen Faktorisierungsmethoden Probedivision und P1 Test jedoch kaum Arbeitsspeicher benötigt, d. h. geeignete Grafikkarten mit vergleichsweise geringem Grafikarbeitsspeicher reichen aus.

P-1-Test

Bezüglich der Menge aller zu testenden Zahlen, wird der P-1-Test dem eigentlichen Lucas-Lehmer-Primzahltest vorgeschaltet, um effektiv mittelgroße Faktoren q in einzelnen Zahlen zu finden. Er erfolgt im Anschluss an die Probedivision und findet Faktoren, die stark zusammengesetzt sind. Man weiß, dass mögliche Faktoren q von den Aufbau haben müssen. Der Teil k ist hierbei meist selbst zusammengesetzt. Das Verfahren findet den Faktor q, solange alle Faktoren von k kleiner als die sogenannte B1-Grenze sind (Stufe 1) oder alle bis auf einen kleiner als B1 und der verbleibende letzte Teilfaktor von k kleiner als die sogenannte B2-Grenze ist (Stufe 2, mit B2 ≈ 30*B1). In seltenen Fällen können durch die sogenannte Brent-Suyama-Erweiterung aber auch Faktoren gefunden werden, die das B2-Kriterium eigentlich nicht erfüllen. Der Berechnungsaufwand ist abhängig von der Größe des Exponenten sowie der Wahl von B1 und B2. Stufe B2 benötigt viel Arbeitsspeicher.

LL-Test

Der rechenaufwändige Lucas-Lehmer-Primzahltest wird dann nur noch auf die Untermenge alle Zahlen angewendet, für die obige Faktorisierungsmethode ergebnislos blieben. Im Normalfall erfolgt die Zuweisung von zu testenden Zahlen automatisch durch PrimeNet. Die Grenze, bis zu der Faktoren im Rahmen der Probedivision gesucht werden, ist abhängig von der zu testenden Zahl und steigt mit ihrer Größe an. Die aufwandsoptimalen Obergrenzen sind in der Tabelle Probedivision genannt. Sie werden empirisch ermittelt.

ECM-Test

Die „Elliptic Curve Method“ (ECM) wird auf Zahlen angewendet, die vom PrimeNet-Server zugewiesen werden. Der ECM-Test findet große Faktoren q mit einer Länge bis etwa 60 Dezimalstellen effektiv. Die Exponenten aus der automatischen ECM-Zuweisung des PrimeNet-Servers sind derzeit siebenstellig. Eine Zuweisung erfolgt nur nach entsprechender Einstellung in Prime95 oder manueller Anforderung über die Projekt-Webseite. Es verfügt ebenfalls über eine B1- und B2-Grenze (B2 = 100*B1). Auch hier benötigt Stufe B2 viel Arbeitsspeicher.

Programmoptionen

Arbeitstypen unter Worker Windows
AbkürzungBedeutung
GIMPSwas sinnvoll ist (Serverwahl, Standardeinstellung)
TFProbedivision
TF-LMHProbediv. LMH(Lone Mersenne Hunters), kleine Faktoren
PM1-LFaktorisierung P-1, große Expon. (vor Lucas-Lehmer)
PM1-SFaktorisierung P-1, kleine Exponenten (zukünftig)
LLLL-Ersttest
LL-WRLL-Test, Weltrekordgröße
LL-10MLL-Test, mehr als 10 Millionen Stellen
LL-100MLL-Test, mehr als 100 Millionen Stellen
LL-NFLL-Test ohne vorherige Faktorisierung
DLL-Zweittest
ECMFaktorisierung per ECM, kleine Exponenten
ECM-FFaktorisierung per ECM von Fermatzahlen
Ergebnistypen
AbkürzungBedeutung
Ffaktorisiert durch Probedivision
F-PM1faktorisiert durch P-1
F-ECMfaktorisiert durch ECM
NFkein Faktor durch Probedivision
NF-PM1kein Faktor durch P-1
NF-ECMkein Faktor durch ECM
CLL-Test zusammengesetzt
PLL-Test prim

Auf der Projekt-Webseite kann in den Worker Windows (Prime95) bzw. Workers (MPrime) festgelegt werden, welche Art von Arbeit man erhalten möchte, zum Beispiel ein Faktorisierungsverfahren oder den Lucas-Lehmer-Test. Dies kann auch im Programm selbst vorgenommen werden. Unter Status sieht man die Arbeiten, die man erhalten hat, sowie die erwarteten Vervollständigungsdaten. Die Arbeiten werden in der Datei worktodo.txt gespeichert. Bei Unreserve Exponent kann man einen Exponenten freigeben. Die Prozentzahl einer erledigten Arbeit wird automatisch an GIMPS weitergeleitet, man kann sie jedoch auch im Programm bei Manual PrimeNet Communication (Advanced → Manual Communication…) manuell zur Website schicken, indem man ein Häkchen bei Send new expected completion dates to server setzt. Dabei werden die neuen Vervollständigungsdaten zum Server geschickt.

Man kann mit dem Programm anonym oder mit einem GIMPS-Nutzerkonto arbeiten. Das Nutzerkonto sowie der Computername müssen im Fenster Configure PrimeNet (Test → PrimeNet…) eingegeben werden. Will man anonym arbeiten, muss man die Felder leer lassen. Die Ergebnisse sind in der Datei results.txt ersichtlich, die Erneuerungen in Versionen in der Datei whatsnew.txt.

Versionen

Ausgewählte Haupt-Versionen:

  • Version 28, letzte Version 28.9, 29. März 2016 (Beschleunigung für Multi-Thread-Fälle im Vergleich zu Version 27, erreicht durch Nutzung von Opcodes der Intel Haswell CPUs im FFT-Bereich und durch Reduzierung der Speichertransfers)
  • Version 27, letzte Version 27.9, 12. Dezember 2012, mit AVX-Unterstützung (~30 % Beschleunigung ab Intel-Sandy-Bridge-Mikroarchitektur (Core 2xxx / Core 3xxx) im Vergleich zu Version 26)
  • Version 26, letzte Version 26.6, 4. April 2011 (~20 % Beschleunigung für Core-i-Generation im Vergleich zu Version 25)
  • Version 25, letzte Version 25.11, 13. Juli 2009 (PrimeNet 5.0 Protokoll)
  • Version 24, letzte Version 24.14, Februar 2006 (PrimeNet 4.0 Protokoll)

Einzelnachweise

  1. www.mersenne.org.
  2. GIMPS: Software End User License Agreement ("EULA")
  3. mersenneforum.org - View Single Post - Error risk after doublecheck. Abgerufen am 15. November 2020.
  4. GIMPS: PrimeNet Activity Summary PrimeNet Aggregate Computing Power 06-2011
  5. Christof Windeck: Hitzewelle, c’t 15/2010 vom 5. Juli 2010, Seite 174ff
  6. 1 2 Prime95 Benchmarks
  7. 1 2 MPrime CPU Benchmarks und Durchsatz (Memento des Originals vom 21. August 2011 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
  8. FFT throughput, FFTsize 1024K, Avg Exp M20,950,000, siehe (Memento des Originals vom 16. März 2011 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis..
  9. Gemessen in GHz-days per day per W, siehe GIMPS CPU Throughput calculator (Memento des Originals vom 16. März 2011 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.; leichte Abweichungen bei anderen FFT-Faktorlängen, abweichende Leistungsbilder bei MPrime-Probedivision.
  10. Intel Atom D510 - AU80610004392AA. Abgerufen am 15. November 2020.
  11. AMD E-Series E-350 - EME350GBB22GT. Abgerufen am 15. November 2020.
  12. geschätzt
  13. Intel Pentium III 1200 - RK80530PZ009256 (BX80530C1200256). Abgerufen am 15. November 2020.
  14. AMD Athlon 1100 - A1100AMS3B. Abgerufen am 15. November 2020.
  15. AMD Athlon XP 2000+ - AX2000DMT3C. Abgerufen am 15. November 2020.
  16. Intel Pentium 4 3.06 GHz - RK80532PE083512 / BX80532PE3066D. Abgerufen am 15. November 2020.
  17. AMD Phenom II X4 965 Black Edition - HDZ965FBK4DGM / HDZ965FBGMBOX. Abgerufen am 15. November 2020.
  18. Intel Core 2 Duo E8600 - AT80570PJ0936M / BX80570E8600 / BXC80570E8600. Abgerufen am 15. November 2020.
  19. SR05T (Intel Pentium G620T). Abgerufen am 15. November 2020.
  20. AMD Phenom II X6 1100T Black Edition - HDE00ZFBK6DGR / HDE00ZFBGRBOX. Abgerufen am 15. November 2020.
  21. Intel Core i5-2500K - CM8062300833803 / BX80623I52500K / BXC80623I52500K. Abgerufen am 15. November 2020.
  22. Intel Core i7-2600K - CM8062300833908 / BX80623I72600K / BXC80623I72600K. Abgerufen am 15. November 2020.
  23. MersenneForum.org: New breakeven points for Version 26
  24. MersenneForum.org: Economic curves cross as far as TFing vs. LLing and DCing by James http://www.mersenneforum.org/attachment.php?attachmentid=9126&d=1358182815
  25. Khronos OpenCL API Registry (englisch) – Spezifikation und Headerdateien
  26. „[…] verkündete die Khronos Group am 9. Dezember 2008 die Veröffentlichung der OpenCL 1.0-Spezifikation […] Unmittelbar nach der Freigabe der OpenCL 1.0-Spezifikation kündigte AMD die beabsichtigte schnelle Übernahme des OpenCL 1.0-Programmierstandards sowie die Integration eines kompatiblen Compilers und einer kompatiblen Laufzeitumgebung in sein kostenloses ATI Stream SDK an […] Durch die enge Kooperation mit OpenCL-Content- und Softwareentwicklern konnte AMD eine Entwicklerversion des ATI Stream SDKs mit OpenCL 1.0-Unterstützung erstellen. Das offiziell freigegebene ATI Stream SDK v2.0 mit OpenCL 1.0-Unterstützung ist seit der zweiten Jahreshälfte 2009 verfügbar.“ AMD – Die Geschichte des GPGPU-Computings in aller Kürze (Memento des Originals vom 27. Mai 2013 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.; Webzugriff am 2. Mai 2012
  27. MersenneForum.org: Factoring bit depth?
  28. GIMPS: The Math
  29. mersenneforum.org - View Single Post - fond of a factor? Turn yourself in to become inane. Abgerufen am 15. November 2020.
  30. http://www.mersenne.org/download/whatsnew.txt
  31. Prime95 version 27 released! Faster on Intel’s newer CPUs! Mersenne Research, Inc., abgerufen am 6. Juli 2012.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.