PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Intel "Core" und SSE/2/3/4


Gast
2006-03-08, 14:20:29
Bei heise im Artikel finden sich auch noch ein paar Schlagwörter:

Intel Advanced Digital Media Boost:
SSE-Einheiten arbeiten mit 128-Bit-Busbreite und die SSE-Befehle werden daher in einem Takt abgearbeitet. Die Vorgänger und die Konkurrenz verwenden 64 Bit Busbreite, muss den Zugriff also auf zwei Takte ausweiten. Hinzu kommen neue SSE-Befehle (SSE4).

http://www.heise.de/newsticker/meldung/70488

Also das müsste doch eindeutig einen Performancevorteil zur Folge haben, oder?
Immerhin gibt es schon einige Anwendungen und Games, die SSE nutzen, seit AMD diese ebenfalls unterstützt.

Coda
2006-03-08, 14:24:12
Das bringt nur wirklich einen Performancevorteil wenn die Applikation heftig SSE-limitiert ist. Das ist sehr sehr selten der Fall.

Aber der Schritt war natürlich vorherzusehen, da man bei Die-Fläche für Logik eigentlich kaum mehr was sparen muss.

Übrigens ist 1 Cycle der max. Durchsatz und nicht die Latenz natürlich. Das muss man auch noch beachten.

Undertaker
2006-03-08, 14:25:37
ab sse2 hat es eigentlich keine wirklichen vorteile mehr gegeben, wie man am beispiel winchester -> venice oder clawhammer -> san diego sieht...

Coda
2006-03-08, 14:27:39
Das kommt auf die Anwendung an! Natürlich kann SSE einen Vorteil bringen, sogar bis zum 4x Durchsatz (nur beim Conroe) wenn sich alles vektorisieren lässt.

Undertaker
2006-03-08, 14:29:28
ich habe mich rein auf praktische anwendungen bezogen, und dort kenne ich keine einzige welche aus sse3 deutlich profitiert...

Gandharva
2006-03-08, 14:32:20
Bei sehr komplexer Arithmetik hat SSE3 erhebliche Vorteile gegenüber SSE2. Vor allem im wissenschaftlichen Bereich ist das sehr interessant.

Undertaker
2006-03-08, 14:34:42
für den bereich gibts dann auch noch ganz andere cpu's/systeme ;)

nein, kennt einer von euch eine ganz "normale" anwendung? ein game, einen en/decoder, ein sonstiges programm?

Gast
2006-03-08, 14:37:14
Wieso redet ihr denn immer nur von SSE3 ...

Es gibt auch noch SSE2 und SSE1 und das wird schon von einigen Anwendungen genutzt oder sogar als zwingend erforderlich angesehen (im Spieleforum gabs mal einen Thread dazu).

Von Audio/Videoanwendungen gar nicht zu reden, da werden diese Befehlssätze eigentlich sehr oft unterstützt (z.B. VirtualDub).

Gandharva
2006-03-08, 14:38:00
für den bereich gibts dann auch noch ganz andere cpu's/systeme ;)Erzähl das mal z.B. einem Ingenieur der für seine Arbeit nicht mal eben täglich zig Stunden ein Rechenzentrum zur Verfügung hat... Nicht jeder verwendet einen Desktop PC nur zum Spielen.

@Gast

Exakt. Auch verstehe ich nicht warum eine solche SSE-Makrofunktion nur in SSE limitierten Situationen Vorteile bringen sollte. Sobald SSE Befehle verwendet werden können diese dadurch schneller abgearbeitet werden und die CPU hat mehr Zeit für andere Dinge.

Undertaker
2006-03-08, 14:46:57
Erzähl das mal z.B. einem Ingenieur der für seine Arbeit nicht mal eben täglich zig Stunden ein Rechenzentrum zur Verfügung hat... Nicht jeder verwendet einen Desktop PC nur zum Spielen.

ich arbeite in einem großen deutschen forschungsinstitut mit vielen ingenieuren zusammen und weiß durchaus wovon ich rede ;)

wir haben hier viele simulationsprogramme, meist auf pc's von p3 1ghz - a64 3500+, keines davon profitiert großartig von sse sonder braucht nur pure rechenleistung ;)

für größere aufgaben gibt es eine opteron-rechenfarm, auch die hat kein sse3 ;)

BlackBirdSR
2006-03-08, 14:50:48
Exakt. Auch verstehe ich nicht warum eine solche SSE-Makrofunktion nur in SSE limitierten Situationen Vorteile bringen sollte. Sobald SSE Befehle verwendet werden können diese dadurch schneller abgearbeitet werden und die CPU hat mehr Zeit für andere Dinge.

Der Durchsatz der SSE Befehle beträgt nun 1 Takt.
D.h es kann jeden Takt ein neuer Befehl begonnen werden, und nach X Takten ist jeden Takt auch ein Befehl fertig.
An der Latenz von einigen takten ändert das wohl nicht viel.

Wir haben also einen großen Durchsatz, wenn viele SIMD Operationen nötig sind, und immernoch eine relativ lange Wartezeit, wenn nur wenige SIMD Operationen von Nöten sind.

Dazu kommt dann, dass in wenigen Fällen ausschließlich SIMD Operationen losgeschickt werden können, und wohl auch nicht ständig im gleichen Mischungsverhältnis.

Kurzum: mehr Power in bisher SIMD limitierten Szenarios wo der absolute Durchsatz zählt.
Weniger Gewinn für Standardsituationen in denen SIMD eher ein Gimmick ist.
Dazu zähle ich einmal Spiele. BF2 nutzt z.B gar kein SSE.

BlackBirdSR
2006-03-08, 14:51:45
ich arbeite in einem großen deutschen forschungsinstitut mit vielen ingenieuren zusammen und weiß durchaus wovon ich rede ;)

wir haben hier viele simulationsprogramme, meist auf pc's von p3 1ghz - a64 3500+, keines davon profitiert großartig von sse sonder braucht nur pure rechenleistung ;)

für größere aufgaben gibt es eine opteron-rechenfarm, auch die hat kein sse3 ;)

Von SSE würde ich hier sowieso Abstand nehmen. Ich bin mir nicht sicher, dass für eure Simulationen Single Precision ausreichen würde.
Wenn dann schon SSE2.

Gandharva
2006-03-08, 15:03:14
ich arbeite in einem großen deutschen forschungsinstitut mit vielen ingenieuren zusammen und weiß durchaus wovon ich redeDas kommt natürlich auch immer auf die Komplexität und Art der Arithmetik an. Gerade im Bereich Bioinformatik in dem hochkomplexe Algorithmen unabdingbar sind. FFT z.B. lässt sich damit erheblich beschleunigen. Life Science wird sowieso das Ding der nächten Jahrzehnte. Aber ich schweife ab. :)

@BlackBirdSR

Danke für die Erklärung.

Gast
2006-03-08, 15:08:53
Mal ganz davon ab: Wenn ihr JETZT eine CPU kaufen wollt, würdet ihr dann wegen dem Übergang bis zum Conroe eher zu einer billigen SingleCore CPU greifen? :)

Undertaker
2006-03-08, 15:09:26
das mag wohl sein; für mich und 99,9% aller nutzer dieses forums wird sse4 aber keinen vorteil bringen; dass es stört sag ich ja nicht ;)

Gandharva
2006-03-08, 15:11:50
das mag wohl sein; für mich und 99,9% aller nutzer dieses forums wird sse4 aber keinen vorteil bringen; dass es stört sag ich ja nicht ;)Das hat ja mit SSE4 nix zu tun. SSE4 wird denke ich eher etwas für echte 64bit Operationen bringen.

Undertaker
2006-03-08, 15:15:09
Das hat ja mit SSE4 nix zu tun. SSE4 wird denke ich eher etwas für echte 64bit Operationen bringen.

wer kann mir mal erklären warum sse4 unter 64bit mehr bringen soll :confused:

RLZ
2006-03-08, 15:23:44
SSE4 wird denke ich eher etwas für echte 64bit Operationen bringen.
*klick* (http://www.heise.de/ct/04/20/022/)
psignw, psignd, psignb
pshufb
pmulhrsw, pmaddubsw
phsubw, phsubsw, phsubd
phaddw, phaddsw, phaddd
palignr
pabsw,pabsd,pabsb

Der Nutzen wird wie immer stark von den Algorithmen abhängen...

BlackBirdSR
2006-03-08, 15:27:41
Das hat ja mit SSE4 nix zu tun. SSE4 wird denke ich eher etwas für echte 64bit Operationen bringen.

Echte 64Bit Operationen sind ja eigentlich nur die 64Bit Integeroperationen der ALUs.
Die Arbeiten allerdings ohne SIMD, immer schön einen 64Bit Wert nach dem Anderen.

Für SIMD nutzt man FPUs, die dann Vektoren mit 2x64Bit oder 4x32Bit Happen arbeiten. Von daher glaube ich nicht, dass SSE4 viel mit den 64Bit ALUs zu tun hat.

Gandharva
2006-03-08, 15:33:43
War auch nur eine Vermutung meinerseits, da SSE4 zeitgleich mit dem Komplettumstieg auf 64Bit bei Intel kommt. Prinzipell ging es mir darum das Untertaker wohl SSE4 mit der kommenden SSE-Makrofunktion verwechselt hatte.

@RLZ

Das kenne ich. Nur (fast) keiner weiß genau was die wirklich machen.

Coda
2006-03-08, 15:46:36
Exakt. Auch verstehe ich nicht warum eine solche SSE-Makrofunktion nur in SSE limitierten Situationen Vorteile bringen sollte. Sobald SSE Befehle verwendet werden können diese dadurch schneller abgearbeitet werden und die CPU hat mehr Zeit für andere Dinge.Weil 99% der Zeit in 1% des Codes draufgeht (Innerloops).

*klick* (http://www.heise.de/ct/04/20/022/)
psignw, psignd, psignb
pshufb
pmulhrsw, pmaddubsw
phsubw, phsubsw, phsubd
phaddw, phaddsw, phaddd
palignr
pabsw,pabsd,pabsb

Der Nutzen wird wie immer stark von den Algorithmen abhängen...Ich hab schonmal gesagt, dass diese Info evtl. falsch ist weil das sich noch auf einen P4-Nachfolger und nicht auf Conroe beziehen könnte.

RLZ
2006-03-08, 15:47:50
@RLZ

Das kenne ich. Nur (fast) keiner weiß genau was die wirklich machen.
Das kann man doch bei den meisten direkt aus den Namen ablesen. :confused:

edit: mhh horiziontales add und sub sind ja eigentlich schon in SSE3 drin. Seltsam...
Vielleicht isses doch nicht so einfach X-D
edit2: steht d hier vielleicht für doubleword statt double?
dann wären es reine Integeropertionen...

Ich hab schonmal gesagt, dass diese Info evtl. falsch ist weil das sich noch auf einen P4-Nachfolger und nicht auf Conroe beziehen könnte.
Halte ich für unwahrscheinlich.
Die Befehlsätze werden ja so erweitert, dass sie am häufigsten benötigten Operationen beschleunigen.
Warum sollte man sich auf einmal komplett andere Instruktionen suchen?