PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: News des 22. November 2011


Leonidas
2011-11-22, 16:13:30
Link zur News:
http://www.3dcenter.org/news/2011-11-22

AnarchX
2011-11-22, 17:25:15
GPU-Performance ähnlich wie Radeon HD 5570 GDDR5

Imo wäre da wohl eher eine HD 6670 DDR3 oder HD 6750 DDR3 passender, so eine GDDR5-Karte hat fast die doppelte Bandbreite wie die ganze Trinity APU.

Spasstiger
2011-11-22, 19:52:39
Die GFlops-Zahlen in der Grafik stehen wahrscheinlich nicht für die GPU alleine, sondern für die Addition von SP-Rechenleistung der GPU und der CPU. Dafür spricht die relativ hohe GFlops-Angabe beim Llano A4, die von der GPU alleine nicht geleistet werden kann, und der Begriff "CTP" (Composite Theoretical Performance) in der Überschrift. Die CTP wird normalerweise in MTOPs angegeben und ist im Rahmen amerikanischer Ausfuhrgesetze relevant (geht darum, die Exporte von Hochleistungsprozessoren an gewisse Länder wie Nordkorea einzuschränken). In die CTP sind alle "computing elements" eines Rechensystems integriert, im Fall eines Fusion-Prozessors also CPU + IGP. Eventuell wurde in der Grafik der CTP-Begriff missbraucht, um diesen Sachverhalt auszudrücken, auch wenn man sich auf die Floating-Point-Rechenleistung beschränkt, während die eigentliche CTP noch andere Größen beinhaltet: http://www.mosis.com/forms/mosis_forms/ECCN_CTP_Computation.pdf.

Angenommen, diese GFlops-Zahlen gelten für GPU und CPU kombiniert, dann kann man zumindest eine untere Grenze für die Anzahl an Streamprozessoren der Trinity-GPU ermitteln. Trinity A8 wird mit 715 GFlops angegeben, die Taktraten sollten dabei beim schnellsten Modell gerüchteweise 700 MHz für die GPU und 3800 MHz für die CPU betragen. Da ein Trinity A8 auf zwei Bulldozer-Modulen aufbauen wird, kann er pro Takt 2*8 fp32-MADD/FMA-Operationen ausführen (256-Bit-fp-SIMD pro Modul). Das entspricht also CPU-seitig 121,6 GFlops @ 3800 MHz bei einfacher Präzision. Somit muss die GPU mindestens 593,4 GFlops beisteuern, um auf 715 GFlops kombiniert zu kommen. Da die GPU gerüchteweise mit maximal 700 MHz taktet, ergeben sich mindestens 424 Streamprozessoren mit einem Durchsatz von jeweils einem fp32-FMA/MADD pro Takt.

Ich hatte ja mal auf 384 SPs spekuliert, die in VLIW4-Konstrukten verbunden werden, analog zu AMDs Vorgehen beim Wechsel von Cypress (1600 SPs) auf Cayman (1536 SP). Aber weniger als 424 SPs in bekannter Bauweise sind nach diesen neuen Zahlen nicht möglich. Sollte es ein VLIW4-Design werden, wären 448 SPs oder 512 SPs wahrscheinlich. In VLIW5-Bauweise würde ich von 480 SPs ausgehen.

/EDIT: Kleine Detailkorrektur, der Grafikchip soll beim Topmodell mit 709 MHz und nicht nur 700 MHz takten. Somit ändert sich die von mir abgeschätzte untere Grenze auf 419 SPs. Ändert aber nix an meinem Fazit (448, 480 oder 512 SPs).

Gleichermaßen kann man auch für die Trinity A6 abschätzen. Das A6-Topmodell könnter dieser Tabelle (http://www.pcgameshardware.de/aid,853050/AMD-Trinity-Neue-Infos-ueber-Taktraten-Cache-und-geplante-Modelle/CPU/News/) nach bei Verwendung von nur einem Bulldozer-Modul mit 3700 MHz CPU-Takt und ebenfalls 709 MHz GPU-Takt kommen. Ergibt bei 480 GFlops kombinierter fp32-Rechenleistung eine untere Grenze von 297 SPs.
Das schnellste A4-Modell hat möglicherweise die 2600 MHz CPU-Takt und 626 MHz GPU-Takt aus der Tabelle. Ergibt bei 335 GFLops kombinierte eine untere Grenze von 234 SPs.
Damit wäre es realistisch, dass A4 und A6 auf demselben Chip basieren. A4 kommt dann beispielsweise mit 240 SPs (VLIW5) oder 256 SPs (VLIW4) und A6 einem Vollausbau von 320 SPs (VLIW4 und VLIW5). Trinity A6 wäre GPU-seitig aufgrund höherer Taktraten (709 MHz vs. 443 MHz) dann immer noch deutlich schneller als Llano A6, was z.B. den großen Unterschied in 3DMark06 erklärt.

AnarchX
2011-11-22, 20:20:09
Aber welcher A8 Desktop Lllano hat nur 415GFLOPs? Der A8-3530MX liegt unter 400 GFLOPs, wenn man ihn aus versehen herangezogen hätte.

Spasstiger
2011-11-22, 20:30:28
Der A8-3530MX hat kombiniert exakt 416 GFLops peak mit einfacher Präzision.
(444*400*2 + 1900*4*4*2) MFlops
Llano hat vier 128-Bit-SIMDs für FP-Operationen, die jeweils vier fp32-FMA/MADD pro Takt ausführen können.

Leonidas
2012-01-05, 10:09:49
Die GFlops-Zahlen in der Grafik stehen wahrscheinlich nicht für die GPU alleine, sondern für die Addition von SP-Rechenleistung der GPU und der CPU. Dafür spricht die relativ hohe GFlops-Angabe beim Llano A4, die von der GPU alleine nicht geleistet werden kann, und der Begriff "CTP" (Composite Theoretical Performance) in der Überschrift. Die CTP wird normalerweise in MTOPs angegeben und ist im Rahmen amerikanischer Ausfuhrgesetze relevant (geht darum, die Exporte von Hochleistungsprozessoren an gewisse Länder wie Nordkorea einzuschränken). In die CTP sind alle "computing elements" eines Rechensystems integriert, im Fall eines Fusion-Prozessors also CPU + IGP. Eventuell wurde in der Grafik der CTP-Begriff missbraucht, um diesen Sachverhalt auszudrücken, auch wenn man sich auf die Floating-Point-Rechenleistung beschränkt, während die eigentliche CTP noch andere Größen beinhaltet: http://www.mosis.com/forms/mosis_forms/ECCN_CTP_Computation.pdf.

Angenommen, diese GFlops-Zahlen gelten für GPU und CPU kombiniert, dann kann man zumindest eine untere Grenze für die Anzahl an Streamprozessoren der Trinity-GPU ermitteln. Trinity A8 wird mit 715 GFlops angegeben, die Taktraten sollten dabei beim schnellsten Modell gerüchteweise 700 MHz für die GPU und 3800 MHz für die CPU betragen. Da ein Trinity A8 auf zwei Bulldozer-Modulen aufbauen wird, kann er pro Takt 2*8 fp32-MADD/FMA-Operationen ausführen (256-Bit-fp-SIMD pro Modul). Das entspricht also CPU-seitig 121,6 GFlops @ 3800 MHz bei einfacher Präzision. Somit muss die GPU mindestens 593,4 GFlops beisteuern, um auf 715 GFlops kombiniert zu kommen. Da die GPU gerüchteweise mit maximal 700 MHz taktet, ergeben sich mindestens 424 Streamprozessoren mit einem Durchsatz von jeweils einem fp32-FMA/MADD pro Takt.

Ich hatte ja mal auf 384 SPs spekuliert, die in VLIW4-Konstrukten verbunden werden, analog zu AMDs Vorgehen beim Wechsel von Cypress (1600 SPs) auf Cayman (1536 SP). Aber weniger als 424 SPs in bekannter Bauweise sind nach diesen neuen Zahlen nicht möglich. Sollte es ein VLIW4-Design werden, wären 448 SPs oder 512 SPs wahrscheinlich. In VLIW5-Bauweise würde ich von 480 SPs ausgehen.

/EDIT: Kleine Detailkorrektur, der Grafikchip soll beim Topmodell mit 709 MHz und nicht nur 700 MHz takten. Somit ändert sich die von mir abgeschätzte untere Grenze auf 419 SPs. Ändert aber nix an meinem Fazit (448, 480 oder 512 SPs).

Gleichermaßen kann man auch für die Trinity A6 abschätzen. Das A6-Topmodell könnter dieser Tabelle (http://www.pcgameshardware.de/aid,853050/AMD-Trinity-Neue-Infos-ueber-Taktraten-Cache-und-geplante-Modelle/CPU/News/) nach bei Verwendung von nur einem Bulldozer-Modul mit 3700 MHz CPU-Takt und ebenfalls 709 MHz GPU-Takt kommen. Ergibt bei 480 GFlops kombinierter fp32-Rechenleistung eine untere Grenze von 297 SPs.
Das schnellste A4-Modell hat möglicherweise die 2600 MHz CPU-Takt und 626 MHz GPU-Takt aus der Tabelle. Ergibt bei 335 GFLops kombinierte eine untere Grenze von 234 SPs.
Damit wäre es realistisch, dass A4 und A6 auf demselben Chip basieren. A4 kommt dann beispielsweise mit 240 SPs (VLIW5) oder 256 SPs (VLIW4) und A6 einem Vollausbau von 320 SPs (VLIW4 und VLIW5). Trinity A6 wäre GPU-seitig aufgrund höherer Taktraten (709 MHz vs. 443 MHz) dann immer noch deutlich schneller als Llano A6, was z.B. den großen Unterschied in 3DMark06 erklärt.



Nachträglich: Eine wirklich schöne Rechnung.

Ironie daran: Auch ohne dieser Rechnung habe ich aus purem Gefühl heraus schon dasselbe geschätzt, wie an dieser News zu sehen.

Spasstiger
2012-05-01, 08:25:55
*ausgrab*
Trotz der schönen Rechnung sind es doch nur die 384 SPs geworden (VLIW4), die mein erstes Bauchgefühl waren: http://www.computerbase.de/news/2012-04/technische-spezifikationen-zu-amds-trinity/.

Knuddelbearli
2012-05-01, 09:30:20
nja die gpu taktet dafür halt mit 800mhz du bist von max 700 ausgegangen

ob mehr sp oder höherer takt ist bei selben verbrauch ja egal ( abnehmender ertrag bei zuviel sp dürfte bei 800 ja noch nicht wirken )

höchstens für OCler schade ^^