PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Super-Pi auf anderen Plattformen


Gast
2004-10-26, 22:00:17
Hi,

Mich würde es interessieren, wie schnell Super-Pi auf anderen Plattformen ist, z.B. Itanium, AIX, MacOS X, SGI, Sun.
Vor allem die hohen Pi-Werte (32M) wären gut, die Systeme plattformunabhängig zu vergleichen.

Hier die Homepage vom berühmten Super-Pi: http://pi2.cc.u-tokyo.ac.jp/

FTP-Server von Super-Pi: ftp://pi.super-computing.org/

Programme von Super-Pi für andere Plattformen: ftp://pi.super-computing.org/pub/

Würde einer dies mal testen? BITTE! :D

Wunsch:
PPC4/5 auf MacOS X
Linux ( Vergleich Windows<->Linux)
Itanium 2

PS: Ein Nachteil hat dies. Super-Pi unter Windows stammt von 1995 und ist ohne die aktuellen Compiler-Optimierungen, die z.B. ein Itanium erhalten hat.

Aqualon
2004-10-26, 23:54:17
------ Started super_pi run : Di Okt 26 23:52:00 MST 2004
Start of PI calculation up to 1048576 decimal digits
End of initialization. Time= 1.407 Sec.
I= 1 L= 0 Time= 3.863 Sec.
I= 2 L= 0 Time= 4.403 Sec.
I= 3 L= 1 Time= 4.408 Sec.
I= 4 L= 2 Time= 4.406 Sec.
I= 5 L= 5 Time= 4.404 Sec.
I= 6 L= 10 Time= 4.393 Sec.
I= 7 L= 21 Time= 4.396 Sec.
I= 8 L= 43 Time= 4.401 Sec.
I= 9 L= 87 Time= 4.388 Sec.
I=10 L= 174 Time= 4.394 Sec.
I=11 L= 349 Time= 4.390 Sec.
I=12 L= 698 Time= 4.375 Sec.
I=13 L= 1396 Time= 4.386 Sec.
I=14 L= 2794 Time= 4.373 Sec.
I=15 L= 5588 Time= 4.367 Sec.
I=16 L= 11176 Time= 4.335 Sec.
I=17 L= 22353 Time= 4.276 Sec.
I=18 L= 44707 Time= 4.135 Sec.
I=19 L= 89415 Time= 3.846 Sec.
End of main loop
End of calculation. Time= 86.634 Sec.
End of data output. Time= 0.263 Sec.
Total calculation(I/O) time= 86.897( 16.637) Sec.

Super-Pi mit M=20

System:

Intel Celeron 2GHz
Asus P4P8T mit Intel i865G
512MB DDR-RAM
Gentoo mit Kernel 2.6.7

M=25 würde zu lange dauern auf der Kiste, da ist er schon fast 5 min nur mit Initialisieren beschäftigt. Schade, dass es den Quellcode nicht gibt, sonst könnte ich es auch mit den standard CFLAGs testen.

Aqua

BlackBirdSR
2004-10-27, 10:18:52
Hi,

Mich würde es interessieren, wie schnell Super-Pi auf anderen Plattformen ist, z.B. Itanium, AIX, MacOS X, SGI, Sun.
Vor allem die hohen Pi-Werte (32M) wären gut, die Systeme plattformunabhängig zu vergleichen.



SuperPi setzt auf Integer?

dann würe ich sagen: PM und K8 liegen weit vor allen anderen Systemen.

(del676)
2004-10-27, 11:38:34
hätts ja gern auf einer sun getestet, aber noch deps zusätzlich installen is mir jetzt zu aufwendig

(del676)
2004-10-27, 11:43:28
Version 2.0 of the super_pi for Linux OS
Fortran source program was translated into C program with version 19981204 of
f2c, then generated C source program was optimized manually.
pgcc 3.2-3 with compile option of "-fast -tp px -Mbuiltin -Minline=size:1000 -Mnoframe -Mnobounds -Mcache_align -Mdalign -Mnoreentrant" was used for the
compilation.
------ Started super_pi run : Wed Oct 27 11:41:50 CEST 2004
Start of PI calculation up to 1048576 decimal digits
End of initialization. Time= 0.590 Sec.
I= 1 L= 0 Time= 1.800 Sec.
I= 2 L= 0 Time= 2.060 Sec.
I= 3 L= 1 Time= 2.050 Sec.
I= 4 L= 2 Time= 2.060 Sec.
I= 5 L= 5 Time= 2.060 Sec.
I= 6 L= 10 Time= 2.050 Sec.
I= 7 L= 21 Time= 2.050 Sec.
I= 8 L= 43 Time= 2.070 Sec.
I= 9 L= 87 Time= 2.050 Sec.
I=10 L= 174 Time= 2.060 Sec.
I=11 L= 349 Time= 2.060 Sec.
I=12 L= 698 Time= 2.050 Sec.
I=13 L= 1396 Time= 2.050 Sec.
I=14 L= 2794 Time= 2.060 Sec.
I=15 L= 5588 Time= 2.040 Sec.
I=16 L= 11176 Time= 2.040 Sec.
I=17 L= 22353 Time= 2.010 Sec.
I=18 L= 44707 Time= 1.960 Sec.
I=19 L= 89415 Time= 1.810 Sec.
End of main loop
End of calculation. Time= 40.610 Sec.
End of data output. Time= 0.190 Sec.
Total calculation(I/O) time= 40.800( 1.020) Sec.
------ Ended super_pi run : Wed Oct 27 11:42:31 CEST 2004


Dual XEON 2.8 mit HT enabled
4 Gig Ram
Suse Linux Enterprise Server 8
gestartet mit M20

klutob
2004-10-27, 13:33:59
nice -n -18 ./super_pi 20
Version 2.0 of the super_pi for Linux OS
Fortran source program was translated into C program with version 19981204 of
f2c, then generated C source program was optimized manually.
pgcc 3.2-3 with compile option of "-fast -tp px -Mbuiltin -Minline=size:1000 -Mnoframe -Mnobounds -Mcache_align -Mdalign -Mnoreentrant" was used for the
compilation.
------ Started super_pi run : Wed Oct 27 13:33:38 CEST 2004
Start of PI calculation up to 1048576 decimal digits
End of initialization. Time= 0.667 Sec.
I= 1 L= 0 Time= 2.082 Sec.
I= 2 L= 0 Time= 2.400 Sec.
I= 3 L= 1 Time= 2.398 Sec.
I= 4 L= 2 Time= 2.404 Sec.
I= 5 L= 5 Time= 2.400 Sec.
I= 6 L= 10 Time= 2.395 Sec.
I= 7 L= 21 Time= 2.397 Sec.
I= 8 L= 43 Time= 2.398 Sec.
I= 9 L= 87 Time= 2.402 Sec.
I=10 L= 174 Time= 2.394 Sec.
I=11 L= 349 Time= 2.394 Sec.
I=12 L= 698 Time= 2.395 Sec.
I=13 L= 1396 Time= 2.399 Sec.
I=14 L= 2794 Time= 2.390 Sec.
I=15 L= 5588 Time= 2.390 Sec.
I=16 L= 11176 Time= 2.380 Sec.
I=17 L= 22353 Time= 2.357 Sec.
I=18 L= 44707 Time= 2.304 Sec.
I=19 L= 89415 Time= 2.156 Sec.
End of main loop
End of calculation. Time= 47.400 Sec.
End of data output. Time= 0.167 Sec.
Total calculation(I/O) time= 47.567( 4.312) Sec.
------ Ended super_pi run : Wed Oct 27 13:34:26 CEST 2004



cat /proc/cpuinfo
processor : 0
vendor_id : AuthenticAMD
cpu family : 6
model : 10
model name : AMD Athlon(tm) XP
stepping : 0
cpu MHz : 2231.299
cache size : 512 KB
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 1
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 mmx fxsr sse syscall mmxext 3dnowext 3dnow
bogomips : 4440.06

Athlon XP2600 @195 FSB
Linux 2.6.9-mm1 / glibc-2.3.4

Gohan
2004-10-27, 13:42:28
Jan-Zureks-Computer:~ jan$ /Users/jan/Desktop/super_pi/pi
Version 2.0 of the super_pi for Mac OS/X
Fortran source program was translated into C program with version 19981204 of
f2c, then generated C source program was optimized manually.
gcc-3.2.2 with compile option of "-O3 -ffast-math -finline-limit=1000" was used
for the compilation.
------ Started super_pi run : Wed Oct 27 13:42:09 CEST 2004
Parameter(%i) to super_pi is missing. Parameter value ?

Welches value?

Super Grobi
2004-10-27, 13:45:54
Hi,
gibts Super Pi auch für Linux? Dann müsste es doch möglich sein eine Playstation2 und eine XBox zu benchen, oder?

SG

Aqualon
2004-10-27, 13:56:50
Welches value? Wir haben 20 genommen (also 2^20 Stellen).

@Super Grobi: eine Linux-Version gibt es natuerlich, schau doch einfach auf die Seite, die der Gast verlinkt hat.

Aqua

klutob
2004-10-27, 13:59:34
@ Gohan
value ist 20 also:
./super_pi 20
btw. -O3 -ffast-math, diese Flags hätt ich auch gern :frown:

Super Grobi
2004-10-27, 14:01:31
Wir haben 20 genommen (also 2^20 Stellen).

@Super Grobi: eine Linux-Version gibt es natuerlich, schau doch einfach auf die Seite, die der Gast verlinkt hat.

Aqua

Hab ich mir schon fast gedach ;-) . Aber ich habe weder Linux für Xbox noch für PS2. Ich wollte damit ja nur *geil* machen.

SG

p.s.
Dreamcast müsste ja dann auch gehen

Gohan
2004-10-27, 15:36:49
Version 2.0 of the super_pi for Mac OS/X
Fortran source program was translated into C program with version 19981204 of
f2c, then generated C source program was optimized manually.
gcc-3.2.2 with compile option of "-O3 -ffast-math -finline-limit=1000" was used
for the compilation.
------ Started super_pi run : Wed Oct 27 13:42:09 CEST 2004
Parameter(%i) to super_pi is missing. Parameter value ? 20
Start of PI calculation up to 1048576 decimal digits
End of initialization. Time= 0.870 Sec.
I= 1 L= 0 Time= 2.850 Sec.
I= 2 L= 0 Time= 3.280 Sec.
I= 3 L= 1 Time= 3.280 Sec.
I= 4 L= 2 Time= 3.240 Sec.
I= 5 L= 5 Time= 3.260 Sec.
I= 6 L= 10 Time= 3.240 Sec.
I= 7 L= 21 Time= 3.250 Sec.
I= 8 L= 43 Time= 3.250 Sec.
I= 9 L= 87 Time= 3.230 Sec.
I=10 L= 174 Time= 3.260 Sec.
I=11 L= 349 Time= 3.240 Sec.
I=12 L= 698 Time= 3.250 Sec.
I=13 L= 1396 Time= 3.260 Sec.
I=14 L= 2794 Time= 3.240 Sec.
I=15 L= 5588 Time= 3.210 Sec.
I=16 L= 11176 Time= 3.370 Sec.
I=17 L= 22353 Time= 3.220 Sec.
I=18 L= 44707 Time= 3.110 Sec.
I=19 L= 89415 Time= 2.900 Sec.
End of main loop
End of calculation. Time= 64.370 Sec.
End of data output. Time= 0.330 Sec.
Total calculation(I/O) time= 64.700( 3.860) Sec.
------ Ended super_pi run : Wed Oct 27 15:33:42 CEST 2004

System:

Dual G4 1.25 Ghz mit 256 KB L2 Cache und 2 MB L3 Cahce pro CPU.
1.5 Gb PC333 Ram. Und das Prog scheint nur eine CPU zu benutzen, schade :(

Aqualon
2004-10-27, 20:22:44
Und das Prog scheint nur eine CPU zu benutzen, schade :(Du kannst ja 2 Instanzen des Programms starten, wenn sich die Werte dadurch nicht ändern, nutzt es wirklich nur eine CPU.

Trotzdem ist die IPC deines G4 doppelt so hoch wie bei meinem Celeron, also nicht schlecht

Aqua

BlackBirdSR
2004-10-27, 20:35:26
Mich würde echt brennend gerne interessieren, wie SuperPI die Werte berechnet.
Wurde der Test auf dem G4 mit Altivec kompelliert?

Gohan
2004-10-27, 21:48:29
Bei zwei Instanzen sehen beide ungefähr so aus:
Version 2.0 of the super_pi for Mac OS/X
Fortran source program was translated into C program with version 19981204 of
f2c, then generated C source program was optimized manually.
gcc-3.2.2 with compile option of "-O3 -ffast-math -finline-limit=1000" was used
for the compilation.
------ Started super_pi run : Wed Oct 27 21:44:56 CEST 2004
Start of PI calculation up to 1048576 decimal digits
End of initialization. Time= 0.890 Sec.
I= 1 L= 0 Time= 3.050 Sec.
I= 2 L= 0 Time= 3.690 Sec.
I= 3 L= 1 Time= 3.540 Sec.
I= 4 L= 2 Time= 3.710 Sec.
I= 5 L= 5 Time= 3.720 Sec.
I= 6 L= 10 Time= 3.580 Sec.
I= 7 L= 21 Time= 3.580 Sec.
I= 8 L= 43 Time= 3.510 Sec.
I= 9 L= 87 Time= 3.630 Sec.
I=10 L= 174 Time= 3.610 Sec.
I=11 L= 349 Time= 3.590 Sec.
I=12 L= 698 Time= 3.540 Sec.
I=13 L= 1396 Time= 3.610 Sec.
I=14 L= 2794 Time= 3.570 Sec.
I=15 L= 5588 Time= 3.570 Sec.
I=16 L= 11176 Time= 3.520 Sec.
I=17 L= 22353 Time= 3.520 Sec.
I=18 L= 44707 Time= 3.420 Sec.
I=19 L= 89415 Time= 3.230 Sec.
End of main loop
End of calculation. Time= 70.890 Sec.
End of data output. Time= 0.300 Sec.
Total calculation(I/O) time= 71.190( 4.070) Sec.
------ Ended super_pi run : Wed Oct 27 21:46:09 CEST 2004

Also nur 4 Sek. mehr, weil sich die zweite CPU jetzt nicht mehr voll und ganz um die Systemprozesse kümmenr kann.

@BlackBirdSR:
Keine Ahnung obs mit oder ohne Altivec erstellt wurde, tippe aber mal mit, sonst wären das echt utopische Ergebnisse für einen G4.

Aqualon
2004-10-28, 02:52:41
Was ich noch seltsam finde ist, dass die MacOS X Version und die Version für Linux mit unterschiedlichen Compilerflags compiliert worden sind. So wirklich vergleichbar sind die Werte also sowieso nicht.

Aqua

klutob
2004-10-28, 16:24:35
Wie wäre es denn mit einem viel effizienteren Pi-Berechnungsprogramm mit Sourcecode?

http://www.myownlittleworld.com/pi/files/pi_css5_src.tgz

Einfach für die jeweiligen Plattform compilieren/optimieren.

Linux z.B.
gcc -O3 -funroll-loops -ftracer -fprefetch-loop-arrays -march=athlon-xp -pipe -fomit-frame-pointer pi_fftcs.c fftsg_h.c -lm -o pi_css5
Sun:
cc -fast pi_fftcs.c fftsg_h.c -lm -o pi_css5
HP:
aCC -fast pi_fftcs.c fftsg_h.c -lm -o pi_css5
Windows:
cl -O2 pi_fftcs.c fftsg_h.c -o pi_css5

und die Binary starten.
Hier meine Werte unter Linux mit o.g. CFlags und 1M Stellen (entspr. superpi 20).


nice -n -19 ./pi_css5
Calculation of PI using FFT and AGM, ver. LG1.1.2-MP1.5.2a.memsave Number of digits of pi to calculate?
1000000
initializing...
nfft= 262144
radix= 10000
error_margin= 0.0037835
calculating 1048576 digits of PI...
AGM iteration
precision= 48: 0.79 sec
precision= 80: 0.79 sec
precision= 176: 0.79 sec
precision= 352: 0.79 sec
precision= 688: 0.79 sec
precision= 1392: 0.79 sec
precision= 2784: 0.80 sec
precision= 5584: 0.78 sec
precision= 11168: 0.79 sec
precision= 22336: 0.79 sec
precision= 44688: 0.79 sec
precision= 89408: 0.79 sec
precision= 178816: 0.79 sec
precision= 357648: 0.80 sec
precision= 715312: 0.79 sec
precision= 1430640: 0.79 sec
writing pi1048576.txt...
14.79 sec. (real time)

XP2600@184 FSB/Linux 2.6.9-mm1

Gast
2004-10-28, 18:28:15
@klutob
Es geht nicht nur um die Effizienz, sondern eine Plattform-übergreifenden Vergleich mit dem gleichen Programm.

Dieses Programm wäre eine bessere Möglichkeit, da man dann das Programm auf die jeweilige Plattform (Singel-,Dual-CPU) optimiert compiliert und dann besser vergleicht.
Da dieses Programm schneller abläuft sollte man mit 2 unterschiedlichen Werten laufen lassen: einen niedrigen um den/die Prozessor/en/Cache zu belasten und einen deutlich höheren um Prozessor/Ram zu testen.

-> Neuer Thread-Start!

Aqualon
2004-10-29, 00:22:40
-> Neuer Thread-Start! Bitte die Ergebnisse der selbst kompilierten Versionen in folgenden Thread:

http://www.forum-3dcenter.org/vbulletin/showthread.php?p=2389166

Aqua

Gohan
2004-10-29, 13:22:48
Super, dürfen jetzt nur noch die Leute mitmachen die Wissen wie man selber kompiliert? :(

Aqualon
2004-10-29, 15:21:39
Super, dürfen jetzt nur noch die Leute mitmachen die Wissen wie man selber kompiliert? :(
So schwer ist das nicht, wenn du GCC installiert hast.

Folgende Zeile sollte die schnellsten Builds auf dem G4 erzeugen:

gcc -fast -mcpu=7450 pi_fftcs.c fftsg_h.c -lm -o pi_css5

pi_css5 ist der Name des erstellten Programms. Ohne das -mcpu=7450 wird der Code auf den G5 optimiert und ist auf dem G4 nicht lauffähig. Für mehr Optionen kannst du die man-Page von gcc anschauen.

Aqua