Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : Verständnisfrage zur HTT


aths
2003-08-24, 13:41:47
Wie ist das, wenn darauf eine Einzelanwendung läuft, bekommt diese dann nur die halbe Rechenzeit?

Byteschlumpf
2003-08-24, 14:15:43
Meine Erfahrungen mit HT:
- das System ist mit HT spürbar agiler, als ohne
- trotz geringerer CPU-Auslastung ist die Performance deutlich besser
- mit Multi-Prozessor/HT optimierter Software (MPEG1/2-Encoder), steigt die Leistung um bis zu 17% an (was einem P4 3280Mhz ohne HT, gemessen an meinem P4c 2800, entspricht)
- Frameraten in Spielen sind ebenfalls höher mit HT (UT2003 Bench, C4 DemoBench)
- Multitasking bereitet mit HT erst so richtig Freude

Fazit: HT erweist sich für mich als DAS Feature des P4s überhaupt!

LOCHFRASS
2003-08-24, 15:04:14
Bei SETI ist der Unterschied extrem, mit SMT haut so ein P4 gerne mal 20 WUs pro Tag raus, an einen Dual Xeon DP @ FSB 250 will ich da erst gar nicht denken... :D

dildo4u
2003-08-24, 15:11:21
ne bei mir funzt auch bei einzel anwendungen alles ok z.b beim Encoden
mit Tmpeg komm ich so auf 80% Cpulast anders z.b bei alten proggs z.B cpu burn das muss ich jetzt 2mal ausführen da mit ich 100% CPUlast bekomme wennn ich nur 1 ausführe hab ich halt immer nur 50% die 2virtuelle cpu hat nix zu tun aber ich denke mal das jede halbwegs aktuelle software z.B zum rendern und so HT ausnutzt

Byteschlumpf
2003-08-24, 15:34:11
Bei Verwendung von HT muß keinesfalls immer eine 100%ige CPU-Last stattfinden, um schneller als ohne HT encoden zu können!

Teste mit und ohne HT! ;)

GloomY
2003-08-24, 16:18:51
Original geschrieben von aths
Wie ist das, wenn darauf eine Einzelanwendung läuft, bekommt diese dann nur die halbe Rechenzeit? Nein, ein einzelner Thread läuft genau so schnell wie auf einer CPU ohne HTT.
Original geschrieben von Byteschlumpf
Meine Erfahrungen mit HT:
- das System ist mit HT spürbar agiler, als ohne
- trotz geringerer CPU-Auslastung ist die Performance deutlich besser
- mit Multi-Prozessor/HT optimierter Software (MPEG1/2-Encoder), steigt die Leistung um bis zu 17% an (was einem P4 3280Mhz ohne HT, gemessen an meinem P4c 2800, entspricht)
- Frameraten in Spielen sind ebenfalls höher mit HT (UT2003 Bench, C4 DemoBench)
- Multitasking bereitet mit HT erst so richtig Freude

Fazit: HT erweist sich für mich als DAS Feature des P4s überhaupt! Das war doch gar nicht gefragt. :bonk:

edit: Wenn wir gerade beim Verständnis sind: Ein Grundlagenartikel zu Multithreading (http://www.slcentral.com/articles/01/6/multithreading/) kann vielleicht so manche Sache klären, auch wenn er schon etwas älter ist.

aths
2003-08-24, 16:30:30
Ist schon abzusehen, wann HTT mit 4 virtuellen CPUs den (Deskop-) Markt erreicht?

Gast
2003-08-24, 16:38:38
Original geschrieben von aths
Ist schon abzusehen, wann HTT mit 4 virtuellen CPUs den (Deskop-) Markt erreicht? Wenn überhaupt, dann frühestens mit dem Tejas. Ich sehe aber keinen rechten Sinn darin. Der zusätzliche Aufwand ist enorm und der Mehrwert ggü. 2-fach SMT ist eher klein. Wenn die CPU-internen Einheiten schon gut ausgelastet sind kann 4-fach SMT auch nichts weiteres mehr herausholen.

Das Zauberwort heisst eher "Scheduleroptimierung" auf SMT. Und dann können ja auch erst einmal die Prescott new instructions ausgeschöpft werden. Mit diesen Softwareinstrumenten allein erreicht man schon ein sehr hohes Niveau von Einheitenauslastung. Und das ganz ohne teuren Hardware-Overkill.

Byteschlumpf
2003-08-24, 16:45:31
Original geschrieben von GloomY
Nein, ein einzelner Thread läuft genau so schnell wie auf einer CPU ohne HTT.
Das war doch gar nicht gefragt. :bonk:

edit: Wenn wir gerade beim Verständnis sind: Ein Grundlagenartikel zu Multithreading (http://www.slcentral.com/articles/01/6/multithreading/) kann vielleicht so manche Sache klären, auch wenn er schon etwas älter ist.
Bitte vergib mir meine Unwissenheit und Fehlinterpretation der Fragestellung!:banghead:

aths
2003-08-24, 17:45:30
Original geschrieben von Gast
Wenn überhaupt, dann frühestens mit dem Tejas. Ich sehe aber keinen rechten Sinn darin. Der zusätzliche Aufwand ist enorm und der Mehrwert ggü. 2-fach SMT ist eher klein. Der Zusatz-Nutzen gegenüber 2x SMT ist ziemlich klein, ja. Aber der Mehraufwand sollte doch so hoch nicht sein? Ich denke, pro virtueller CPU muss man nur ca. 5% des Cores duplizieren?

Muh-sagt-die-Kuh
2003-08-24, 17:54:09
Original geschrieben von aths
Der Zusatz-Nutzen gegenüber 2x SMT ist ziemlich klein, ja. Aber der Mehraufwand sollte doch so hoch nicht sein? Ich denke, pro virtueller CPU muss man nur ca. 5% des Cores duplizieren? Noch mehr Cache Aliasing Probleme und der sehr geringe zusätzliche Nutzen sprechen klare Sprache gegen 4-fach SMT.

aths
2003-08-24, 18:12:36
Original geschrieben von Muh-sagt-die-Kuh
Noch mehr Cache Aliasing Probleme und der sehr geringe zusätzliche Nutzen sprechen klare Sprache gegen 4-fach SMT. Warum wird es offenbar trotzdem von Intel entwickelt?

GloomY
2003-08-24, 18:36:11
Original geschrieben von Byteschlumpf
Bitte vergib mir meine Unwissenheit und Fehlinterpretation der Fragestellung!:banghead: Passt schon :) Es ist mir nur aufgefallen, dass der Bezug zur Thread-Frage gefehlt hat.
Original geschrieben von aths
Der Zusatz-Nutzen gegenüber 2x SMT ist ziemlich klein, ja. Aber der Mehraufwand sollte doch so hoch nicht sein? Ich denke, pro virtueller CPU muss man nur ca. 5% des Cores duplizieren? Naja, die 5% mehr sind das, was Intel angibt. Ich halte das für eine recht geringe Zahl.
Original geschrieben von aths
Warum wird es offenbar trotzdem von Intel entwickelt? Bei der jetzigen Größe und Organisation (Assotiativität, Line Size) ist es nicht umbedingt nützlich. Mit größeren Caches (L1 D-Cache wird ja 16 kB beim Prescott erhalten) und/oder anderer Organisation kann 4 fach SMT schon noch etwas bringen. Allerdings ist hier der P4 auf Grund der recht "schmalen" Architektur (d.h. realtiv wenige Funktionseineiten) bei der Parallelität eher eingeschränkt. Einem Athlon/Hammer oder einer 8-way EV8 würde das 4-fach SMT wahrscheinlich mehr bringen.

Endorphine
2003-08-24, 19:02:10
Original geschrieben von aths
Warum wird es offenbar trotzdem von Intel entwickelt? Bis jetzt sind das lediglich Spekulationen. Anfangs nahm man sogar an, dass der Prescott 4-fach SMT bieten würde. Mitnichten, das 2-fach SMT wird lediglich verfeinert.

Ich sehe technisch und wirtschaftlich derzeit auch überhaupt keinen Anlass für 4-fach SMT. Zumal ja die Möglichkeiten von 2-fach SMT noch nicht einmal ansatzweise ausgenutzt werden. Und wieder: wenn der Kern bereits mit 2-fach SMT voll ausgelastet ist, was soll dann 4-fach SMT ausser zusätzlichen Kosten/Verkomplizierung und Overhead auf OS-Ebene bringen?

Und das wichtigste Prinzip gilt auch bei SMT: der abnehmende Grenznutzen. Aus der Sicht von weiterhin produzierten SMP-Systemen halte ich es auch für wenig sinnvoll, 4-fach SMT umzusetzen. Es ist softwaretechnisch schon schwer genug, ausserhalb von massivem Multitasking mehr als 4 CPUs gleichzeitig zu beschäftigen.

aths
2003-08-24, 19:14:18
Original geschrieben von Endorphine
Bis jetzt sind das lediglich Spekulationen. Anfangs nahm man sogar an, dass der Prescott 4-fach SMT bieten würde. Mitnichten, das 2-fach SMT wird lediglich verfeinert.

Ich sehe technisch und wirtschaftlich derzeit auch überhaupt keinen Anlass für 4-fach SMT. Zumal ja die Möglichkeiten von 2-fach SMT noch nicht einmal ansatzweise ausgenutzt werden. Und wieder: wenn der Kern bereits mit 2-fach SMT voll ausgelastet ist, was soll dann 4-fach SMT ausser zusätzlichen Kosten/Verkomplizierung und Overhead auf OS-Ebene bringen?Mehr Geschwindigkeit durch Verstecken von Latenzen :naughty: Wenn ich das richtig sehe, hat der P4 "zu viel" Integer-Power. Durch die Integration einer 2. FPU/SSE2-Einheit könnte man vielleicht im Zusammenspiel mit 4x SMT noch ordentlich was gewinnen.

Der Gewinn (also Zusatznutzen) durch 2x alleine mag durchaus so groß sein, dass selbst mit 256x diese Steigerung nicht nochmal erreichbar ist. Dennoch, mit 4x kann man dem Idealfall (komplette Auslastung) sicherlich eher näher kommen, als mit 2x SMT.

Meine nächste CPU hat auf alle Fälle aktiviertes HTT, egal ob 4x oder 2x SMT :) (Kann es sein, dass XP Home ohnehin nur 2x unterstützt?)

Endorphine
2003-08-24, 19:22:30
Original geschrieben von aths
(Kann es sein, dass XP Home ohnehin nur 2x unterstützt?) Ein Henne-Ei Problem. Solange Intel keinen 4-fach SMT Prozessor für den Desktopmarkt baut wird es auch kein Home-Windows mit entsprechender Unterstützung geben. Bis dahin bleibt die Limitierung auf 2-fach SMT und ein physikalisches Uniprozessorsystem bestehen. Original geschrieben von aths
Meine nächste CPU hat auf alle Fälle aktiviertes HTT, egal ob 4x oder 2x SMT :) Verwende doch gleich durchgängig den Begriff "SMT" :-) Das entzaubert das Prinzip so schön und die IMHO vorhandene Verwechselungsgefahr mit Hypertransport entfällt.