PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Intel-Dokumente zeigen auf "Arctic Sound" Xe-Grafiklösungen mit ...


Leonidas
2020-02-11, 18:56:22
Link zur News:
https://www.3dcenter.org/news/intel-dokumente-zeigen-auf-arctic-sound-xe-grafikloesungen-mit-bis-zu-512-eu-samt-hbm2e-und-pci

Gast
2020-02-11, 21:33:18
den Sprung hin zu MultiChip-Designs (Chiplet-Designs) im Grafikchip-Bereich. Natürlich müsste Intel auch erst noch beweisen, das man dies dann auch für gewöhnliche 3D-Grafik hinbekommt,

Für Rastergrafik dürfte sich der Aufwand vermutlich nicht mehr lohnen.
Aber mit Raytracing dürfte das einfacher zu realisieren sein:
https://www.youtube.com/watch?v=Zw3vwCBOjQ0

Lehdro
2020-02-11, 22:16:07
Bringe ich etwas durcheinander oder hat Intel nicht selber verlauten lassen das Xe mit Ponte Vecchio in 7nm kommt? Das sollte doch schon die 2021 exascale HPC Auskopplung von Xe sein, wieso nun wieder der "Rückschritt" auf 10nm für den Rest? Gerade wenn es Chiplets sein sollten, ergeben doch die dann schon "antiken" 10nm keinerlei Sinn mehr, ausser für die allerkleinsten Auskopplungen im LP Bereich. Spätestens HPC sollte schon vom Start an 7nm sein, denn vor 2021 passiert da eh nix mehr (und für das Jahr ist 7nm Xe confirmed). Was aber auch die absurden Stromverbräuche erklären würde, die Prügeln die Chips bestimmt ans Limit um ihre Performanceziele auch mit suboptimaler Fertigung zu erreichen. Oh man Intel...

Leonidas
2020-02-12, 05:01:15
Ponte Vecchio ist ein Jahresendprojekt 2021 in 7nm, da wird die allerbeste Technik genommen, weil es für die HPC-Anwendung keine Rolle spielt, wieviel das kostet.

DG2 bzw. Arctic Sound ist hingegen das normale Geschäft - und da muß man auch auf die Kosten schauen. Außerdem dürfte das eher Mitte 2021 zu verorten sein, wohl noch zu früh für 7nm bei Intel.

Gast
2020-02-12, 07:14:54
Ponte Vecchio ist ein Jahresendprojekt 2021 in 7nm, da wird die allerbeste Technik genommen, weil es für die HPC-Anwendung keine Rolle spielt, wieviel das kostet.

DG2 bzw. Arctic Sound ist hingegen das normale Geschäft - und da muß man auch auf die Kosten schauen. Außerdem dürfte das eher Mitte 2021 zu verorten sein, wohl noch zu früh für 7nm bei Intel.
Dann macht die Theorie mit den Chiplets aber keinen Sinn. Wenn die Chiplets sich in der Fertigung unterscheiden, dann hat man den Vorteil der Wiederverwendbarkeit verloren und könnte so gleich auf Monolithen setzen. Außer, Ponte Vecchio ist eine Nachfolgegeneration von Arctic Sound und ersetzt diese später in allen Bereichen.

Complicated
2020-02-12, 07:45:19
Die letzten Gerüchte haben 7nm TSMC gelautet, für Intels Xe.

Leonidas
2020-02-12, 09:16:44
Dann macht die Theorie mit den Chiplets aber keinen Sinn. Wenn die Chiplets sich in der Fertigung unterscheiden, dann hat man den Vorteil der Wiederverwendbarkeit verloren und könnte so gleich auf Monolithen setzen. Außer, Ponte Vecchio ist eine Nachfolgegeneration von Arctic Sound und ersetzt diese später in allen Bereichen.


Naja, Ponte Veccio ist sowieso etwas komplett anderes. Man nennt es auch "Xe HPC" - eine Abwandlung rein für HPC. Vermutlich sind hier Architektur-Änderungen zugunsten von HPC und gegen Gaming eingeflossen. Damit wäre es sowieso nie möglich, etwaige Chiplets untereinander auszutauschen.

davidzo
2020-02-12, 11:10:00
Ich verstehe gar nicht wo da das verständnisproblem ist?

Da steht doch exakt wieviele Karten in ein "enablement"-Chassis passen. Das ist eine Tabelle über die Fähigkeiten der Chassis, nicht über die Karten. Die TDP bezieht sich also auf das Chassis.

"number of cards 3, 4". Damit ist doch klar dass sich die TDP auf vollbestückung mit diesen karten bezieht.

Also wenn man einen sawtooth-pass server hat, dann kann man dementsprechend 3x Karten verbauen wobei das Chassis mit einer TDP von 75,150W oder 300W noch umgehen kann, da Chassiskühlung und PSU ausreichend dimensioniert sind.

Für 4x 4-tile Karten bräuchte man im Chassis 400/500 Watt an Zusatzpower und Kühlleistung, was diese bisherigen Plattformen nicht bieten, nicht aus Netzteilgründen sondern aus Thermal Gründen.


Dementsprechend würden die TDPs so aussehen:
- 1 Tile 25Watt bis 50Watt (TDPup) = 3 Karten in 75 bis 150Watt
- 2 Tile 100Watt = 3 karten in 300Watt
- 4 Tile 133Watt bis 166 Watt (TDPup) = 3 karten in 400 bis 500Watt

bei letzterer braucht man eine zusätzliche 48V stromversorgung, da das originale server-chassis nicht genügend power bereitstellen kann.
Die weiter unten genannten Software Development Vehicle karten gehen dabei etwas effizienter zu werke als die Custom PCI Reverence Validation Platform Karten.


Das deckt sich doch recht genau mit dem was wir bisher von XE und DG1 gehört haben. DG1 ist ein 96EU Testvehikel und DG2 setzt den chiplet-Approach mit 128EUs und einem HBM2E Stack pro chip um. Das klingt nach einer plausiblen Architekturerweiterung.


Eine Verdoppelung der shader pro CU ist ins blaue geraten, dafür gibt es keine anderen leaks die das supporten. Außerdem müsste es eher eine verdreifachung oder vervierfachung sein.

Denn TDP-mäßig passt das immer noch nicht ins Bild. Das würde immer noch beinahe einer Halbierung der Effizienz pro Shaderalu im vergleich zu DG1 sein.

DG1: 96 EU / 768SP = 5-20W
DG2: 128 EU / 2048EU = 75-150Watt - da kann doch was nicht stimmen, da tippe ich eher auf eine vervierfachung der Shaderalus pro EU als dass die Effizienz mit neuer Architektur und verbesserter Fertigung um fast die Hälfte sinkt.

Leonidas
2020-02-12, 14:20:50
DG1: 96 EU / 768SP = 5-20W
DG2: 128 EU / 2048EU = 75-150Watt - da kann doch was nicht stimmen, da tippe ich eher auf eine vervierfachung der Shaderalus pro EU als dass die Effizienz mit neuer Architektur und verbesserter Fertigung um fast die Hälfte sinkt.


DG1 wäre 5-25W Mobile. Desktop geschätzt 40-50W. Dann kommt das plötzlich hin. DG2-128 mit +166% mehr SE ergibt umgerechnet 107-133W. Passt ganz vernünftig zu den angegebenen 150W. Eine Vervierfachung der SE/EU wird da schwer.

Aber ja: Es ist nur eine These, durch nichts belegt.

davidzo
2020-02-12, 20:47:04
Intel Purley sawtooth pass platform:

Number of Cards # 3

3x PCIe x16 mit je einem slot dazwischen.:rolleyes:


https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=69230&stc=1&d=1581536609

Damit kann man 3x 25-50W Karten oder 3x 100W Karten direkt betreiben.

Für 3x 166Watt benötigt man eine zusätzliche Stromversorgung, was bei dieser Plattform auch wenig verwunderlich ist.

Gast
2020-02-13, 01:26:52
aber für normale Grafikkarten mit der Zielsetzung einer Grafik- und Videoausgabe ist die hiermit einhergehende Problematik der effektiven Zusammenarbeit von einzelnen Chiplets (außerhalb von reinen GPGPU-Aufgaben) immer noch nicht zufriedenstellend gelöst.

Die Zusammenarbeit mehrerer Chiplets wäre jetzt kein so großes Problem. Dabei handelt es sich selbstverständlich nicht um SLI, Crossfire oder ähnliches.

Das Problem ist vielmehr, dass damit die Energieeffizienz sinkt, und die maximal erreichbare Leistung im Wesentlichen von der Energieeffizienz abhängt.

Aber mit 500W sollte man mit Chiplets durchaus eine vergleichbare Performance zu 300W Monolithen hinbekommen.

Gast Ritis
2020-02-18, 10:12:12
Es ist genau so wie DAVIDZO geschrieben hat.

Nur was überhaupt nicht klar belegt ist sind die Anzahl von EUs und Shader-Einheiten sowie deren Takt bei vorgegebenen Verbrauchsgrenzen.

Da kann noch alles komplett ins Postitive oder Negative im Rohdatenvergleich schwenken. Aber am Ende hängt es am Softwarestack.

Das sind mit Shaderzahl, Takt und Softwarestack dann immer noch 3 unbekannte Faktoren in der Gleichung.

Die ganze Spekulatius lohnt noch lange nicht, an Weihnachten lohnt sich das vielleicht wieder zu probieren. ;D