PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : China-CPUs: Was erwartet uns die nächsten zehn Jahre?


=Floi=
2019-06-23, 16:17:54
Hi

Werden wir in den nächsten zehn jahren auch in unseren handys und pcs cpus aus china haben?
Ich denke wenn china cpus für sich selbst entwickelt, dann könnten diese auch irgendwann auch frei auf dem weltmarkt verkauft werden. Durch die schieren recourcen traue ich denen auch gute produkte zu und beim preis können sie alles totsubventionieren. :rolleyes:

wie seht ihr das thema?

lumines
2019-06-23, 16:29:38
Die Kirin-SoCs von Huawei sind doch CPUs aus China?

nordic_pegasus
2019-06-23, 16:33:11
Hi

Werden wir in den nächsten zehn jahren auch in unseren handys und pcs cpus aus china haben?


PCs würde ja (zumindest noch auf absehbare Zeit) x86 bedeuten. Hat irgendeine chinesische Firma aktuell Zugriff auf eine x86-Lizenz?

Rolsch
2019-06-23, 17:30:14
Die Chinesen bauen schon lange X86 CPUs:
https://www.heise.de/newsticker/meldung/Ohne-Meltdown-Luecke-Chinesische-x86-Prozessoren-KX-5000-vorgestellt-Angriff-auf-AMDs-ZEN-2-mit-KX-3948635.html

AlterSack
2019-06-23, 19:14:23
Sollte eine chinesische Firma zu gross werden,
würgt der Westen sie ohnehin ab ---> Huawei.
Abgesehen davon verkündete General Hodges, Chef der US-Army in Europa,
dass ein Krieg mit China innerhalb der nächsten zehn Jahre unvermeidlich sei.
...heisst, der Westen will den Krieg, oder besser, Teile der US-Eliten.
Wir hüpfen ohnehin wie die Lemminge hinterher, in den Abgrund.
Also macht euch keine Sorgen woher eure CPUs in zehn Jahren kommen. ;D

MSABK
2019-06-23, 19:33:53
Ist es überhaupt möglich für China CPUs zu entwickeln? Die USA können doch einfach die Lizenzen entziehen. Aktuell wurden ja z.B Hersteller auf die schwarze Liste gesetzt.

Nach Huawei hat die US-Regierung nun fünf Supercomputer-Hersteller aus China auf die schwarze Liste gesetzt, so dass US-Unternehmen mit diesen nicht mehr zusammenarbeiten dürfen. Die Unternehmen und Chinas Supercomputer-Pläne könnten durch dieses Handelsembargo vor dem Aus stehen.

Auch das AMD-Joint-Venture THATIC wurde von der US-Regierung auf die Liste gesperrter Unternehmen gesetzt. Erst Anfang Juni war bekannt geworden, dass sich AMD aus dem Joint Venture mit der Investorengruppe Tianjin Haiguang Advanced Technology Investment Co., Ltd. (THATIC) teilweise zurückziehen möchte, den x86-Technologie-Transfer einschränken wird und keine Zen-2-basierten Prozessoren aus China kommen werden. Diese Pläne werden durch die US-Regierung nun schneller und härter umgesetzt als von AMD beabsichtigt.

https://www.computerbase.de/2019-06/usa-handelsverbot-china-supercomputer-amd-thatic/

Die Kirin-SoCs von Huawei sind doch CPUs aus China?

Huawei ist auf der schwarzen Liste und ARM darf keine Geschäfte mehr mit Huawei machen. Deswegen sehe ich da keine Chance mehr beim Kirin.

Rolsch
2019-06-23, 19:39:48
Ist für China alles nicht relevant, die sind entweder schon vorbei gezogen oder mit allem nötigen bestückt:

https://www.spiegel.de/netzwelt/gadgets/chinas-sunway-taihulight-ist-schnellster-supercomputer-a-1098599.html

ist albern zu glauben dass Arm-Lizenzen oder ein ein -in Asien völlig bedeutungsloser Google Boycott- daran irgendwas ändern.

MSABK
2019-06-23, 19:45:16
Ist für China alles nicht relevant, die sind entweder schon vorbei gezogen oder mit allem nötigen bestückt:

https://www.spiegel.de/netzwelt/gadgets/chinas-sunway-taihulight-ist-schnellster-supercomputer-a-1098599.html

ist albern zu glauben dass Arm-Lizenzen oder ein ein -in Asien völlig bedeutungsloser Google Boycott- daran irgendwas ändern.

Interessant, gibt es genauere Informationen zur CPU? Insbesondere wie das mit den Lizenzen gehandhabt wird.

x-force
2019-06-23, 20:02:43
wenn das teil nicht auf westlichen märkten verkauft werden soll, ist die lizenzfrage scheiß egal

=Floi=
2019-06-23, 21:41:27
Interessant, gibt es genauere Informationen zur CPU? Insbesondere wie das mit den Lizenzen gehandhabt wird.

https://en.wikipedia.org/wiki/Sunway_SW26010


Risc V wäre offen. Mir geht es ja um den weltmarkt.

smalM
2019-06-24, 09:39:28
Abgesehen davon verkündete General Hodges, Chef der US-Army in Europa, dass ein Krieg mit China innerhalb der nächsten zehn Jahre unvermeidlich sei.

Der pensionierte General Hodges hat als Privatperson davor gewarnt, daß sich die USA innerhalb der nächsten 15 Jahre in einem – nicht unvermeidbaren – Krieg mit China befinden könnten. Und es war adressiert an die Europäer, daß sie sich um ihre Sicherheit selbst bemühen müßten.

...heisst, der Westen will den Krieg, oder besser, Teile der US-Eliten.

Du verdrehst seine Aussage völlig.
Aber laß mich raten, das war ja wohl der Sinn der Sache... :freak:

Gipsel
2019-06-24, 10:16:57
Wenn das hier in Richtung PoWi geht, ist ganz schnell dicht.

Leonidas
2019-06-24, 12:04:25
Korrekt. Hier geht es darum, was China technisch tut - und nicht um die politischen Hintergründe. Dafür gibt es andere Foren.

BTT: China macht derzeit:

- Zen-1-Ableger, gedacht eher für den Server-Bereich, Übernahme weiterer Zen-Iterationen derzeit aber auf Eis liegend (THATIC)
- Eigendesigns auf ARM-Basis, was aber wegen der dafür notwendigen ARM-Lizenz latent in Gefahr ist (Huawei Kirin)
- eigene Server-CPU, die aber nicht auf Wirtschaftlichkeit getrimmt ist, da es dort eher um militärische Anwendungen geht (Sunway)
- MIPS-Abwandlungen mit x86-Emulation (Loongson/Godson)
- x86-Design auf Basis früherer VIA-Lizenzen, hängt noch zurück, kann aber langfristig mal was werden (Zhaoxin)

Aus meiner Sicht wird viel getan, wirklich zwingend ist davon nichts. Würde man China konsequent von wesentlicher CPU-Technologie abschneiden, dann haben die nur Sachen, mit denen die ihr Militär beliefern können - aber nichts (sofort greifbares) für PCs und Server. Im Mobile-Segment kann man vielleicht mit gewisser Zeit was reißen, aber bei PC/Server ist der westliche Vorsprung eminent. Da ist es für China in der Tat besser, Technologie einzukaufen als selber zu entwicklen.

Shink
2019-06-24, 12:54:03
Tut sich eigentlich noch etwas in Sachen Loongson? Das Ding wurde ja AFAIR tatsächlich kaufbar verbaut in z.B. exotische Netbooks.

Gipsel
2019-06-24, 13:06:49
- Eigendesigns auf ARM-Basis, was aber wegen der dafür notwendigen ARM-Lizenz latent in Gefahr ist (Huawei Kirin)
Da gibt es aber auch verschiedenen Lizenzen. Zum einen die für einen bestimmten ARM-Kern (z.B. A72) oder anderer Komponenten wie die Grafik ("core licenses"), aber es gibt auch eine "architectural license", womit man das Recht erwirbt, komplett eigenen CPUs zu designen, die das ARM-Instruction-Set beherrschen (es gibt noch eine andere Lizenzform für "semi-custom" Designs). Prominentes Beispiel wären die Apple A6 bis A12 (A4 und A5 haben noch lizensierte Standard-ARM-Kerne enthalten). Huawei hat so eine ARMv8-A architectural license (über seine Tochter HiSilicon). Das könnte bedeuten, daß HiSilicon/Huawei mehr Arbeit in die Entwicklung eigener ARM-Designs stecken muß (eine eigene Variante haben die schon entwickelt, allerdings nicht für den Mobilmarkt), da ihnen neue ARM-Core-Designs (z.B. den zukünftigen [ausgedachten] A84) verwehrt sind (bereits angefangene Designs [wofür man die Lizenzgebühr bereits gezahlt hat] können ja weitergeführt werden).

Schnitzl
2019-06-24, 13:35:08
Korrekt. Hier geht es darum, was China technisch tut - und nicht um die politischen Hintergründe. Dafür gibt es andere Foren.
(...)
Meinem Kenntnisstand ist dieses Thema zu 90% politisch und zu 10% lizenzen zu diskutieren.
Die jüngsten Ereignisse zeigen das sehr deutlich.

Was sich in China tatsächlich technisch tut kann vermutlich hier niemand sagen.

Rabiata
2019-06-24, 14:00:21
BTT: China macht derzeit:

- Zen-1-Ableger, gedacht eher für den Server-Bereich, Übernahme weiterer Zen-Iterationen derzeit aber auf Eis liegend (Zhaoxin)
- Eigendesigns auf ARM-Basis, was aber wegen der dafür notwendigen ARM-Lizenz latent in Gefahr ist (Huawei Kirin)
- eigene Server-CPU, die aber nicht auf Wirtschaftlichkeit getrimmt ist, da es dort eher um militärische Anwendungen geht (Sunway)
- MIPS-Abwandlungen mit x86-Emulation (Loongson/Godson)

Aus meiner Sicht wird viel getan, wirklich zwingend ist davon nichts. Würde man China konsequent von wesentlicher CPU-Technologie abschneiden, dann haben die nur Sachen, mit denen die ihr Militär beliefern können - aber nichts für PCs und Server.
So schlecht sieht das gar nicht aus. Gerade ein Zen1-Ableger wäre nur wenig veraltet. Wenn die Technologie-Belieferung aus dem Westen völlig ausbleibt, könnte ich mir vorstellen daß die Chinesen einfach auf der Zen-1 Basis weiter machen. Bis zur breiten Verfügbarkeit über alle Bereiche würde es vermutlich nochmal ein paar Jahre dauern, aber damit wäre die Technologie immer noch attraktiv für den Binnenmarkt.

HOT
2019-06-24, 14:05:06
Antwort: Das hängt von Amerika ab. Gibts jetzt Isolation für chinesische Unternehmen? Dann geht China den eigenen Weg und wir haben sehr schnell eigene Designs und ISAs. Endet die Isolation? Dann gibts wieder Joint-Ventures mit ARM und AMD(x86)-CPUs. Das KnowHow ist da, die Fertigung wird etwas schwieriger, dafür brauchts weiterhin Partner.

Fusion_Power
2019-06-24, 14:05:21
Wie viel Aufwand bedarf es eigentlich, von 0 auf 100 ne konkurenzfähige x86 CPU zu entwickeln die mit aktuellen Intel und AMD Modellen mithalten könnte?

HOT
2019-06-24, 14:08:38
Brauchen die ja nicht, Zen1 zu kopieren und weiterzuentwickeln reicht doch. Die kennen alle Designs. Wenn man die Lizenzen faktisch entzogen bekommt kann man doch einfach hemmungslos alles nutzen was man da hat.

Loeschzwerg
2019-06-24, 16:08:27
- Zen-1-Ableger, gedacht eher für den Server-Bereich, Übernahme weiterer Zen-Iterationen derzeit aber auf Eis liegend (Zhaoxin)


Zhaoxin hat damit nix zu tun, du meinst das THATIC Joint Venture. Zhaoxin ist das Joint Venture zwischen VIA Technologies und Shanghai Municipal Government.

Zhaoxin finde ich im x86 Bereich recht vielversprechend, es ist genügend Geld vorhanden, es kommt viel hungriger Nachschub aus den dortigen Unis und alle wichtigen Bausteine (CPU, GPU, Chipsatz) kommen aus eigener Hand.

Screemer
2019-06-24, 16:11:14
Die Designs dafür kommen aber doch von centaur aus den Staaten. Würde da der Hahn zugedreht werden könnten die sicherlich auch nicht mehr so einfach das nächste Design aus dem Ärmel schütteln.

Loeschzwerg
2019-06-24, 16:12:35
Das Unternehmen gehört zu 100% VIA, insofern kratzt das vermutlich niemanden. KnowHow Transferieren und das Thema ist erledigt.

Timbaloo
2019-06-24, 16:51:07
Risc V wäre offen. Mir geht es ja um den weltmarkt.
Tja, ich fürchte wir werden die proprietäre Seuche x86/x64 nicht zu Lebzeiten loswerden. Das werden die de-facto Duopolisten intel und AMD (mit Unterstützung der US-Regierung (sorry falls das zu politisch sein sollte)) zu verhindern wissen. Echter Wettbewerb ist hier nicht erwünscht. Bitte gehen sie weiter.

Leonidas
2019-06-24, 17:48:29
Zhaoxin hat damit nix zu tun, du meinst das THATIC Joint Venture. Zhaoxin ist das Joint Venture zwischen VIA Technologies und Shanghai Municipal Government.


Völlig richtig, hab ich verwechselt. Das Zhaoxin ist was extras und gehört entsprechend mit in die Auflistung hinein.

Zossel
2019-06-24, 18:07:28
Wie viel Aufwand bedarf es eigentlich, von 0 auf 100 ne konkurenzfähige x86 CPU zu entwickeln die mit aktuellen Intel und AMD Modellen mithalten könnte?

Dafür braucht es Lizenzen von Intel und AMD. Und die rücken die nicht raus. Ob die Lizenzen von VIA aktuelle X64 Erweiterungen abdecken denke ich nicht.

Brillus
2019-06-24, 18:33:42
Dafür braucht es Lizenzen von Intel und AMD. Und die rücken die nicht raus. Ob die Lizenzen von VIA aktuelle X64 Erweiterungen abdecken denke ich nicht.
Lizenzen musst du auch durchsetzten können wenn jetzt China eonfach sagt egal, können die da auch nichts machen. Kann man auch über das Wettbewerbsrecht machen. Erklärt es zu illegalen Absprachen und gut ist in China sind die Gesetz da sehr dehnbar wenn die Führung das will.

gravitationsfeld
2019-06-24, 18:44:45
Brauchen die ja nicht, Zen1 zu kopieren und weiterzuentwickeln reicht doch. Die kennen alle Designs. Wenn man die Lizenzen faktisch entzogen bekommt kann man doch einfach hemmungslos alles nutzen was man da hat.
Sie haben kein Verilog fuer Zen ausser fuer weniger Bereiche wo sie was aendern koennen. Ihre beste Chance ist Centaur.

Zossel
2019-06-24, 19:12:28
Lizenzen musst du auch durchsetzten können wenn jetzt China eonfach sagt egal, können die da auch nichts machen. Kann man auch über das Wettbewerbsrecht machen. Erklärt es zu illegalen Absprachen und gut ist in China sind die Gesetz da sehr dehnbar wenn die Führung das will.

Das gilt auch umgekehrt, z.b. hält Huawei die meisten 5G-Patente.

mboeller
2019-06-24, 20:22:22
Das gilt auch umgekehrt, z.b. hält Huawei die meisten 5G-Patente.

und dazu gibt es diese Gerüchte/Bestrebungen:

Die USA wollen Huawei verbieten 5G-Lizenzgebühren einzuklagen (https://www.notebookcheck.com/Die-USA-wollen-Huawei-verbieten-5G-Lizenzgebuehren-einzuklagen.425061.0.html)


Wenn dann die Chinesen tit-for-tat spielen wird es haarig.

Leonidas
2019-06-25, 04:06:03
Richtig, aber da wird sich keiner ranwagen. Weil dann schnell gar keine Patente mehr gelten. Ergo geht es nun singulär gegen Huawei - und dort auch nicht gegen das Patent an sich, sondern nur gegen die Lizenzforderungen aus dem Patent. Noch zweifelt niemand die Patente selber an. Ergo kann China nun auch nicht maßlos dagegen verstoßen. Dies wäre sowieso wirtschaftlich schwer zu halten, weil die USA können ihre Patente weltweit durchsetzen, womit ein (potentieller) Freibeuter-Weg die entstehenden Produkte rein auf China beschränken würde. Nicht mal in typischen chinesischen Exportmärkten wäre das absetzbar, wegen weltweiter Patent-Durchsetzung der USA. China wird einen Weg finden müssen, unter Respektierung der US-Patente das ganze auf die Reihe zu bekommen.

Brillus
2019-06-25, 06:08:20
Richtig, aber da wird sich keiner ranwagen. Weil dann schnell gar keine Patente mehr gelten. Ergo geht es nun singulär gegen Huawei - und dort auch nicht gegen das Patent an sich, sondern nur gegen die Lizenzforderungen aus dem Patent. Noch zweifelt niemand die Patente selber an. Ergo kann China nun auch nicht maßlos dagegen verstoßen. Dies wäre sowieso wirtschaftlich schwer zu halten, weil die USA können ihre Patente weltweit durchsetzen, womit ein (potentieller) Freibeuter-Weg die entstehenden Produkte rein auf China beschränken würde. Nicht mal in typischen chinesischen Exportmärkten wäre das absetzbar, wegen weltweiter Patent-Durchsetzung der USA. China wird einen Weg finden müssen, unter Respektierung der US-Patente das ganze auf die Reihe zu bekommen.

Naja, Patent phne recht es durch zu setzen ist gleichbedeutent mit der Aufhebung des Patents.

Leonidas
2019-06-25, 09:10:14
Jein. Es würde dann nur Huawei betreffen - was bedeutet, Huawei kann ohne Sorgen alle westlichen Patente nutzen, kann entsprechende Produkt aber nur an chinesische Firmen mit Endabnehmer in China verkaufen. Das bedeutet extreme Marktlimitierung für Huawei. Und für andere Firmen würden die Patente weiterhin gelten, ergo sind diese angreifbar und könnten in jedem Fall nicht die gleiche Masche abziehen.

Natürlich könnte Huawei die Chance ergreifen und darauf basierend x86 für China kopieren und zur Marktreife führen. Wenn der Handelskrieg irgendwann vorbei ist, müsste der Westen dies dann als praktische Folge akzeptieren. Aber dies ist nur Theorie (mit dem bestmöglichen Ausgang für China). Derzeit ist es trotzdem schwierig bis unmöglich für chinesische Firmen, westliche Patente zu mißachten. Die Endkunden sitzen einfach oftmals außerhalb China und sind somit unter dem westlichen Patente-Diktat.

x-force
2019-06-25, 09:17:09
Richtig, aber da wird sich keiner ranwagen. Weil dann schnell gar keine Patente mehr gelten.

den traum werden wir im kapitalismus leider nicht mehr erleben.

die was wäre wenn patentfrage sollte aber am besten an den passenden ort verschoben werden... aber wenn der chef hier schon einsteigt, kanns ja nicht komplett falsch aufgehoben sein. :confused:

Leonidas
2019-06-25, 12:03:32
Noch ist der Sinn des Threads, CPU-Technik aus China aufzuführen. Was geht und warum es nicht geht, sind nur Nebengeräusche. Ich bin zuerst dran interessiert zu erfahren, an was die Chinesen basteln. Wer kann hierzu mehr sagen? Was ich aufgeführt hatte, war bestimmt nur die Hälfte des Bildes.

Alkibiades
2019-06-26, 00:21:49
Ob die Lizenzen von VIA aktuelle X64 Erweiterungen abdecken denke ich nicht.
doch die aktuellen Zhaoxin-Prozessoren haben x86-64, siehe hier (https://en.wikichip.org/wiki/zhaoxin/microarchitectures/lujiazui)

Natürlich könnte Huawei die Chance ergreifen und darauf basierend x86 für China kopieren und zur Marktreife führen.
Wenn Huwei beginnt, wie von Dir vorgeschlagen, unter Missachtung der Patente x86-Prozessoren zu entwickeln, welcher Auftragsfertiger soll die dann bauen? TSMC und Samsung ganz sicher nicht.
Und sollte mal eine Chinesische Firma das Niveau von den genannten Auftragsfertigern erreichen, besteht noch das Problem, das die ganzen (wichtigen) Halbleiter-Tools aus USA, Europa oder Japan kommen. Ohne Nikon, Canon oder ASML dürfen die Chinesen dann ihre Halbleiter mit Quecksilber-Dampflampen belichten (prä-1997-Technologie, unter wirtschaftliche Aspekte kann man damit 200 nm erreichen)

Leonidas
2019-06-26, 06:20:56
Korrekt gedacht. Ergo ist das ganze tatsächlich nicht so einfach. Wahrscheinlich dürfte die kurzfristige Strategie zu x86 darin liegen, das zu pflegen, was man hat - und nachfolgend auf die Abwahl von Trump zu setzen, ist ja nicht mehr so lange hin.

Loeschzwerg
2019-06-26, 06:41:48
Der VIA CNR (Eden X4 usw.) hat AVX2. Wäre da keine Lizenz vorhanden hätte Intel längst einhaken können.

Thema Fertigung:
Ist nicht so als hätte China mit Huali Microelectronics Corporation (HMLC) nicht auch Möglichkeiten. Aktuell werden dort die KX-5000 SoCs in 28nm gefertigt, KX-6000 mit 16nm läuft über TSMC.

Edit:
Eine etwas ältere Übersicht / Roadmap zu den Fertigungskapazitäten in China:
https://press.trendforce.com/data/attachment/2017/04/10/265602001491808061.png

Zossel
2019-06-26, 07:12:53
Korrekt gedacht. Ergo ist das ganze tatsächlich nicht so einfach. Wahrscheinlich dürfte die kurzfristige Strategie zu x86 darin liegen, das zu pflegen, was man hat - und nachfolgend auf die Abwahl von Trump zu setzen, ist ja nicht mehr so lange hin.

Wenn sich das Kapital zwischen China XOR USA entscheiden muss, wird es da hin gehen wo am meisten zu holen ist.

gregor167
2019-06-26, 22:55:29
Richtig, aber da wird sich keiner ranwagen. Weil dann schnell gar keine Patente mehr gelten. Ergo geht es nun singulär gegen Huawei - und dort auch nicht gegen das Patent an sich, sondern nur gegen die Lizenzforderungen aus dem Patent. Noch zweifelt niemand die Patente selber an. Ergo kann China nun auch nicht maßlos dagegen verstoßen. Dies wäre sowieso wirtschaftlich schwer zu halten, weil die USA können ihre Patente weltweit durchsetzen, womit ein (potentieller) Freibeuter-Weg die entstehenden Produkte rein auf China beschränken würde. Nicht mal in typischen chinesischen Exportmärkten wäre das absetzbar, wegen weltweiter Patent-Durchsetzung der USA. China wird einen Weg finden müssen, unter Respektierung der US-Patente das ganze auf die Reihe zu bekommen.

Ist nicht ganz korrekt. Ein US-Patent gilt nur in den USA, wie auch ein deutsches bur hierzulande.

Es gibt natürlich die Möglichkeit der Nachanmeldung in anderen Ländern. Tot für Huawei wären also nur diejenigen Märkte, in welchen die entsprechenden Patente nationalisiert wurden. Das sind sicherlich einige, aber aus Kosten- und Relevanzgründen sicher nicht alle.

basix
2019-06-27, 07:42:52
Es gibt auch internationale Patente ;) z.B. EU weit. Einige reichen noch weiter (PCT / WIPO Patente)

Leonidas
2019-07-01, 10:18:18
Die meisten Patenten (besonders aus den USA) werden eigentlich weltweit durchgesetzt. Das macht man dann einfach zur Bedingung, wenn Entwicklungsländer irgendwas von UNO oder WTO wollen.

=Floi=
2019-07-01, 10:22:20
Risc V wäre ja frei. Hier aufzubauen und das design breit zu erweitern, wäre wohl am sinnvollsten.

gregor167
2019-07-01, 12:19:09
Es gibt auch internationale Patente ;) z.B. EU weit. Einige reichen noch weiter (PCT / WIPO Patente)

Richtig, es gibt ein europäisches Patent, welches bei vollständiger Benennung in allen dem EPÜ zugehörigen Staaten Gültigkeit hat. Ebenso wie es andere regionale Patentämter, etwa in Afrika die ARIPO und die OAPI, gibt.

Es gibt allerdings keine WIPO oder PCT-Patente, sondern nur internationale PatentANMELDUNGEN. Diese können innerhalb von ca. 3 Jahren nach Erstanmeldungen in etwa 160 Staaten nationalisiert oder regionalisiert und zu dort gültigen, nationalen Patenten umgewandelt werden.

Das ändert nichts daran, dass in jedem Land (oder in jeder Region mit eigenem Patentamt) eigens angemeldet werden muss. Ob Intel das tut, weiß ich nicht. Aber der Aufwand (und die Kosten) ist enorm und üblich ist es, sich nur Schlüsselmärkte auszupicken, im automotive Sektor z.B. Deutschland oder EU, USA, China, Japan.

MSABK
2019-07-02, 19:38:12
Ich weiß, das ist keine News aus China. Aber in Indien wird auch an einer eigenen CPU gearbeitet und es wurde sogar das erste SDK veröffentlicht.

The Indian Institute of Technology (IIT) Madras has released the software development kit (SDK) for its open-source Shakti processor. Shakti is based on the open-source RISC-V instruction set architecture and was funded by the Indian Ministry of Electronics and Information Technology. The institute promised that a development board will also be released soon.

Es scheint wirklich ernste Absichten zu geben.

https://www.tomshardware.com/news/india-shakti-cpu-processors-sdk-risc-v,39781.html

Benutzername
2019-07-02, 20:01:41
Risc V wäre ja frei. Hier aufzubauen und das design breit zu erweitern, wäre wohl am sinnvollsten.

SiFive sieht chancen in dem ganzen hin und her zwischen VRC und VSA.

https://asia.nikkei.com/Business/Startups/US-chip-startup-exploits-trade-war-to-expand-in-China


Und es sind so einige schon auf RISC-V aufgesprungen. western digital will siene flash controller und sowas damit bauen. lowRISC ist ein open source prolekt für ein komplettes SoC. vermutlich unvollständige Liste: https://en.wikipedia.org/wiki/RISC-V#Adopters

edit: gleich zur Quelle: https://riscv.org/members-at-a-glance/

Platin member sind unteranderem nvidia, WD, Alibaba, Google... also da ist schon was hinter, daß das wirklich was werden könnte. Und Rambus ist Mitglied. Die gibt es noch??

Loeschzwerg
2019-07-02, 20:12:56
... also da ist schon was hinter, daß das wirklich was werden könnte.

Was soll denn konkret werden?

Loeschzwerg
2019-07-25, 17:16:59
Alibaba Xuan Tie 910 mit 16 Kernen @ 2.5GHz @ 12nm:
https://www.golem.de/news/alibaba-xuan-tie-910-bisher-schnellster-risc-v-prozessor-hat-16-kerne-1907-142786.html

Pro Takt soll ein Kern grob mit einem Cortex-A72 von ARM vergleichbar sein

---
Die Hardware steht wie immer sehr schnell zur Verfügung, aber die Software... gerade hinsichtlich OS/Heimanwendung.

Benutzername
2019-07-25, 17:31:21
Was soll denn konkret werden?

Zumindest WD liefert schon seine Plattencontroller zum teil mit RISC-V CPUs aus afaik. Die anderen werden da wohl auf Serveranwendungen und Microcontroller machen. Desktop PC ist halt in Wintel Hand.

Loeschzwerg
2019-07-25, 17:35:37
Aber die initiale Frage war ja folgende:

Werden wir in den nächsten zehn jahren auch in unseren handys und pcs cpus aus china haben?

MSABK
2019-07-25, 17:44:19
https://www.computerbase.de/2019-07/arm-prozessor-huawei-server-oekosystem/

Huawei setzt voll auf ARM, denn das Verschreiben auf diese Technologie im Server war noch nie so deutlich. Insgesamt drei Milliarden Yuan/chinesische Renminbi wird das Unternehmen dafür in den kommenden Jahren aufwenden, um das Ökosystem zu stärken und auszubauen.

Hmm, das finde ich jetzt komisch. Ich dachte sie wollten sich von ARM unabhängiger machen?

Benutzername
2019-07-25, 23:32:02
Wenn mna vom Teufel spricht, stellt die Alibaba Tochter Pingtou Ge einen 16 Kerner RISC-V Chip vor.

https://www.golem.de/news/alibaba-xuan-tie-910-bisher-schnellster-risc-v-prozessor-hat-16-kerne-1907-142786.html

16 Kerne, Dualchannel RAM, max 2,6 GHz

Auf der Computing Conference 2018 hatte Alibaba mit Pingtou Ge eine auf AI-Chips und Prozessoren ausgerichtete Unternehmenstochter vorgestellt, nun gibt es das erste Design: Der Xuan Tie 910, zu deutsch schwarzes Eisen, ist eine 16-kernige CPU auf Basis der RISC-V-Architektur. Bisherige Umsetzungen wie der SiFive U74MC haben vier Kerne und sind laut Pingtou Ge pro Takt deutlich langsamer.

Ein Xuan Tie 910 schafft bis zu 2,5 GHz in der Spitze, als Fertigung wird 12 nm angegeben. SiFive wiederum sieht mindestens 1,6 GHz für den U74MC vor, wenn das Design im 28-nm-HP-Verfahren bei TSMC produziert wird. Pingtou Ge zufolge soll ein Kern des Xuan Tie 910 im Coremark pro Takt rund 40 Prozent schneller sein als ein U74-Kern oder ein SweRV-Core von Western Digital.

Offenbar hat Pingtou Ge in seinem Out-of-Order-Kern einen Decoder verbaut, der drei Befehle pro Takt verarbeitet und acht Operationen pro Takt an das Backend weitergibt. Überdies scheint der Xuan Tie 910 ein Dualchannel-Speicherinterface zu verwenden. Pro Takt soll ein Kern grob mit einem Cortex-A72 von ARM vergleichbar sein, der UC74 ähnelt von der Leistung her einem Cortex-A55.

Somit dürfte sich der Xuan Tie 910 für relativ schnelle Systeme eignen, wobei Alibaba das Segment des Internets der Dinge in Verbindung mit künstlicher Intelligenz als Zielbereich nennt - für diesen Zweck wurde Pingtou Ge ja auch gegründet. Alibaba ist nicht der einzige Hersteller, der auf das offene RISC-V setzt, um die eigene Abhängigkeit von ARM und x86-Herstellern wie AMD oder Intel zu verringern: Andere Partner sind unter anderem Nvidia und Western Digital.

Für IoT oder eben 19" Pizzaschachteln (blade server) sollte sich das doch eignen. Oder eben AI Kram in Autos oder sowas.


https://onties.com/china/brother-pingtou-released-the-first-chip-xuantie-910-the-strongest-risc-v-processor-in-the-industry-pingtous-brother-the-first-the-chip-xuan-tie-910-the-strongest-risc-v-processing-technolo/

Sie haben auch weitere pläne:
Xuan Tie 910's performance breakthrough is due to two major technological innovations: the complex out-of-order execution architecture, implemented with 3 Emissions 8, is the industry's first RISC-V process to achieve 2 memory approaches per cycle based on RISC -In extensions More than 50 instructions systematically improve the computer's, storage and multi-core capabilities of RISC-V.

In addition, Pingtou Ge announced the Pu Hui Chip program, the future will open the Black Core 910 IP Core, a global developer can download the FPGA processor code for a free, fast chip prototype and architectural innovations.

Benutzername
2019-07-28, 15:20:19
Alibaba crafts world's 'fastest' 'open-source' RISC-V processor yet: 16 cores, 64-bit, 2.5GHz, 12nm, out-of-order exec

https://www.theregister.co.uk/2019/07/27/alibaba_risc_v_chip/

The Registers Artikel. Geht etwas tiefer rein als heise oder golem. Ist auch der einzige der ansagt, daß es ein 64 Bit Prozessor ist.

Lokadamus
2019-09-30, 21:26:13
Und was braucht man neben der CPU noch?
Ram.
https://www.heise.de/newsticker/meldung/Chipfertigung-China-fertigt-ersten-eigenen-DRAM-in-grossen-Mengen-4543341.html
... Produktionsstart von eigenen DRAM-Chips in China. ... chinesische Firmen lieferten bislang keine nennenswerten Stückzahlen.

mboeller
2019-10-02, 15:43:49
ARM CPU für Desktop und Notebooks incl. eigenem OS:

https://www.heise.de/newsticker/meldung/China-plant-PCs-und-Notebooks-mit-chinesischem-ARM-Chip-FT-2000-4-4544659.html

x-force
2019-10-02, 15:46:25
China-CPUs: Was erwartet uns die nächsten zehn Jahre?

sicherheitslücken und backdoors erwarte ich. aber wann sich diese zeigen werden ist schwerer abzusehen.

Loeschzwerg
2019-10-02, 17:36:29
sicherheitslücken und backdoors erwarte ich.

Was das angeht gibt es eigentlich keine absolut sicheren Consumer Produkte / Chip Designs, die dann zudem noch brauchbare Leistung liefern.

Es gibt nur ein geringeres Übel.

nullpunkt
2019-10-06, 10:56:27
Oftmals werden die Chinesen unterschätzt. Huawei hat einen grossen Teil des Portfolios auf ARM/RISC-V Architekturen umgestellt. Beispiel Switches etc... Ende Jahr kommen da neue Gerätegenerationen, die komplett ohne USA IP auskommen.

Muss man sich auf der Zunge zergehen lassen, da wurde innerhalb von einem Jahr so viel umgebaut, das schaffen die Amis nicht in 10 Jahren. Not macht erfinderisch usw.

Man sollte ein Unternehmen mit alleine 80k Leuten im R+D nicht unterschätzen... Die kann man nicht einfach an die Leine nehmen. Ich persönlich rechne damit, dass die Chinesen innerhalb der nächsten 10 Jahre die Amis um Welten abgezogen haben - technologisch betrachtet. Die Unis sind top, die Leute teilweise entsprechend auch. Auch sollte man das Verhältnis zu Europa nicht unterschätzen, die Chinesen mögen uns sehr. Es gibt bei diversen Unternehmen da unten spezielle Abteilungen, die einzig und alleine dafür da sind, um Produkte Europa-konform zu machen.

Insofern macht auch dem Amigeneral seine Aussage Sinn, es geht weniger darum, ob da ein Krieg mit Waffen ausgefightet wird, es geht eher darum, inwiefern sich der Handelskrieg, in dem wir uns befinden, ausweitet.

MSABK
2019-12-05, 16:18:12
Huawei bringt ein Desktop-Mainboard für ihre ARM Prozessoren.

Thanks to its fruitful collaboration with ARM, Huawei’s HiSilicon CPU division is already working on quad/octa-core Kunpeng desktop processors based on the ARM v8 architecture. Even more so, Huawei intends to provide the supporting motherboards itself. According to Chinese PC hardware site ithome.com, the Kunpeng Desktop Board D920S10 is to offer support for the PCIe 3.0 standard, and Huawei also plans to release advanced server models with PCIe 4.0 support in the coming months. The regular desktop boards also integrate 6x SATA 3.0 connectors and 2x M.2 NVMe slots, plus they support up to 64 GB of RAM in quad-channel DDR4-2400 setups. On the connectivity side, the boards are equipped with a GbE NIC, 4x USB-A 3.0 and 4x USB-A 2.0 ports.


https://www.notebookcheck.net/Huawei-will-be-making-desktop-PC-motherboards-for-its-Kunpeng-920-ARMv8-CPUs.445953.0.html

Benutzername
2019-12-05, 16:30:42
Aber die initiale Frage war ja folgende:

Zitat von =Floi= Beitrag anzeigen
Werden wir in den nächsten zehn jahren auch in unseren handys und pcs cpus aus china haben?

Je nach dem wie man zur Taiwanfrage steht benutzen wir doch heute schon chinesische CPUs. Mediatek ist aus Taiwan. ;)

----------------------------
Huawaei hat jetzt auch ein erste Schlaufon vorgestellt ohne Chips aus den USA wegen der Sanktionspolitik der USA. Sind halt nicht unersetzlich. War halt nur das beste Angebot bisher.

https://www.heise.de/newsticker/meldung/Huawei-Das-Mate-30-hat-keine-Teile-aus-den-USA-4603516.html

MSABK
2019-12-05, 16:33:41
https://www.heise.de/newsticker/meldung/Huawei-Das-Mate-30-hat-keine-Teile-aus-den-USA-4603516.html

Das finde ich echt cool. Leider hat Google und Facebook ein Monopol und sind nicht zu ersetzen.

Gauß
2019-12-05, 16:45:22
Das finde ich echt cool. Leider hat Google und Facebook ein Monopol und sind nicht zu ersetzen.Jaja, wirklich frustrierend wie das imperialistische Google und Facebook uns von den Errungenschaften der CCP gesteuerten IT-Industrie abhaelt.

vspukvqxTSg

Loeschzwerg
2019-12-05, 17:41:49
Mediatek ist aus Taiwan. ;)

Ich dachte da eigentlich eher an eine eigene Architektur und nicht an ein Lizenzprodukt ala ARM Core XYZ :)

Aber klar, je nach Definition stimmt das schon heute.

Wörns
2019-12-30, 10:39:12
Der chinesische MIPS Prozessor Godson ist auf 28nm fdSOI portiert worden und wurde offiziell released.
Chinesisch, aber übersetzbar: Loongson 3A4000 (https://user.guancha.cn/main/content?id=216217&s=fwzwyzzwzbt)
Er wird anscheinend von STMicro gefertigt und soll in seiner nächsten Inkarnation in 12nm kommen, vermutlich bulk, denn von STM kenne ich keinen 12nm fdSOI Prozess. Oder er wird dann von Globalfoundries in 12nm FDX gefertigt, halte ich aber für unwahrscheinlich.
Hier noch eine Beschreibung von TomsHardware (https://www.tomshardware.com/news/loongson-cpus-catching-amd).
MfG

Wörns
2019-12-30, 11:28:39
Nachtrag:
Der Loongson 3A4000 wird mit der Performance von Excavator verglichen.
Da der Loongson als MIPS Prozessor afaik X86 emuliert, stellt sich die Frage, ob der Vergleich sich auf X86 gegen emuliertes X86 bezieht oder auf z.B. angepasste Linux Versionen, die jeweils nativ unterstützt werden.
MfG

Screemer
2019-12-30, 11:37:13
Ersteres wäre schön ziemlich krass.

Wörns
2019-12-30, 21:56:01
Merkwürdig ist die Aussage von Tom's Hardware, der Chip wäre zu 100% in China entstanden. Gleichzeitig soll er von STMicroelectronics gefertigt worden sein.
Afaik hat STM keine Fertigung in China. FD-SOI Wafer kann man in China bei Simgui in 8'' beziehen, aber wer soll die Fertigung übernehmen? Wenn nicht STM, dann fehlt die MIPS Lizenz, sofern ich das richtig verstanden habe. Sonst könnte es ja auch SMIC sein.
MfG

y33H@
2019-12-30, 22:04:28
Ist würde sagen, das ist Unfug ... denn MIPS gehört Wave Computing aus den USA als Lizenzgeber und STMicroelectronics als Auftragsfertiger ist französisch/italienisch ... nur die IP für den Core, die kommt sicherlich aus China.

Wörns
2019-12-31, 12:20:32
Was genau meinst du, was Unfug ist?
Die Aussage, dass der Chip gänzlich made in China ist? Würde ich auch nur bedingt so sehen...
Oder dass sie überhaupt eine MIPS Lizenz benötigen?
Oder dass sie die von STM durch die Fertigung quasi übernehmen können?
Oder dass STM den Chip gefertigt hat? Da weiß ich auch nicht, ob das nicht vielleicht nur ein "Abschreibefehler" ist, weil STM der erste Fertiger war, der fdSOI überhaupt eingesetzt hat.
In China fertigt STM jedenfalls nicht.
MfG

konkretor
2020-01-01, 10:13:05
Neuer Stoff

https://www.golem.de/news/loongson-3a4000-3b4000-chinesische-cpu-schafft-doppelte-leistung-1912-145782.html

BoMbY
2020-02-27, 16:26:16
Testing a Chinese x86 CPU: A Deep Dive into Zen-based Hygon Dhyana Processors (https://www.anandtech.com/show/15493/hygon-dhyana-reviewed-chinese-x86-cpus-amd)

Opprobrium
2020-02-27, 16:48:49
Testing a Chinese x86 CPU: A Deep Dive into Zen-based Hygon Dhyana Processors (https://www.anandtech.com/show/15493/hygon-dhyana-reviewed-chinese-x86-cpus-amd)

Hihi. "The one benchmark where it did really well was Corona..." (Seite 4, Windows Benchmarks, letzter Satz)

Lehdro
2020-02-27, 21:22:51
Hihi. "The one benchmark where it did really well was Corona..." (Seite 4, Windows Benchmarks, letzter Satz)
:freak:

Die Performance der CPUs ist aber auch überall und nirgendwo - da muss noch viel dran gefeilt werden, denn die Rohdaten sehen vielversprechender aus als die schlussendliche Leistung.

Wörns
2020-10-30, 19:13:06
Der Loongson Kern GS464 soll so gut wie der erste ZEN Kern von AMD sein und wird weiter entwickelt. Der Tapeout in SMICs 12nm Prozess ist in diesem Quartal erfolgt.
Original Chinesisch: Klick (https://ee.ofweek.com/2020-10/ART-8500-2816-30467092_2.html)
Hoffentlich klappt diese Übersetzung ins englische: Klick (https://translate.google.com/translate?hl=de&sl=auto&tl=en&u=https%3A%2F%2Fee.ofweek.com%2F2020-10%2FART-8500-2816-30467092_2.html)
MfG

y33H@
2020-10-30, 22:30:10
Der Loongson 3A4000/3B4000 ist ja schon ein GS464, der 3A5000/3C4000 stellt offenbar einen Port von 28 nm TSMC auf 12 nm SMIC dar und soll höher takten - 2,5 GHz statt 2 GHz.

Wörns
2020-10-30, 23:05:13
Fragt sich nur, woher die MIPS Lizenz kommt. Bei 28nm fdSOI kam die wohl vom Fertiger STM.
MfG

Rooter
2020-10-30, 23:56:15
Der Loongson Kern GS464 soll so gut wie der erste ZEN Kern von AMD seinSind also nur noch 3,5 Jahre hinterher*.
2030 bekommen wir dann vielleicht konkurrenzfähige CPUs aus China. :)

(*: Nicht sarkastisch sondern ernst gemeint)

MfG
Rooter

konkretor
2021-01-19, 15:26:32
China bruzelt schon an etwas neuem

http://www.iluvatar.com.cn/newsinfo/ekc0rtawlshmlpae1psfta/


https://www.golem.de/news/big-island-china-hat-erste-eigene-7-nm-ggpu-2101-153509.html

ChaosTM
2021-01-19, 16:02:50
Ohne eine Lizenz dieses Leistungsniveau zu erreichen ist schon was. Spannend !

vinacis_vivids
2021-01-19, 16:36:03
Das sind die theoretischen Werte. Um die Leistung auch wirklich auf die Straße zu bringen, braucht es schon noch die passende Infrastruktur.

Nvidia A100 - 312 Tflop/s - 826mm² - 54 Mrd. Tr.
AMD Instinct MI100 - 185 Tflop/s ~ 750mm² - 50Mrd. Tr.
Tianshu Zhixin - 147 Tflop/s - 550-650mm² ?? - 40-45Mrd. Tr.??

Die 550-650mm² Die zu fertigen ist in zwei Jahren natürlich super, im Vergleich zu der Weltspitze auch kein Ding der Unmöglichkeit. In Anbetracht der mittleren Größe ist es sehr pragmatisch zu sehen für China. Hier wird wieder mit der schieren Masse die anderen überholt.

y33H@
2021-01-19, 21:12:19
24 Milliarden Transistoren sind's.

davidzo
2021-01-20, 10:47:38
Das sind die theoretischen Werte. Um die Leistung auch wirklich auf die Straße zu bringen, braucht es schon noch die passende Infrastruktur.

Nvidia A100 - 312 Tflop/s - 826mm² - 54 Mrd. Tr.
AMD Instinct MI100 - 185 Tflop/s ~ 750mm² - 50Mrd. Tr.
Tianshu Zhixin - 147 Tflop/s - 550-650mm² ?? - 40-45Mrd. Tr.??

Die 550-650mm² Die zu fertigen ist in zwei Jahren natürlich super, im Vergleich zu der Weltspitze auch kein Ding der Unmöglichkeit. In Anbetracht der mittleren Größe ist es sehr pragmatisch zu sehen für China. Hier wird wieder mit der schieren Masse die anderen überholt.

FP16 ist aber auch genau die Paradedisziplin von A100. Da kommt dann noch sparsity dazu und schon sind die Anwendungen nochmal doppelt so schnell.

Für was wurde "Big Island" denn primär gebaut? Nachher ist die FP32 rate 1:1 die von FP16? Möglicherweise ist es wie bei MI100, die sind auch nicht in erster Linie für FP16 gedacht, sondern eher für HPC 64bit (DP) und schlagen da mit Abstand einen A100.

vinacis_vivids
2021-01-20, 11:27:35
Big Island ist für das Verteidigungsministerium um da Staatssimulationen zu trainieren. Für den Fall, dass ein Vorfall passieren könnte. Es ist vermutlich (durchaus wahrscheinlich) für militärische, politische und soziale Simulationen & Trainings. Dazu gehört eben u.a. Grenzschutz, Abhörmaßnahmen und Blockierung von unerwünschten Informationen.

Für diese eher einfachen Übungen reichen fp16 halbe Präzision vollkommen aus, dafür reicht auch das know-how der schnell ausgebildeten Chinesen im Staatsapparat aus.

fp64 ist zwar interessant, aber zu "teuer" für die Chinesen, weil es man dieses know-how eben nicht mehr so einfach kaufen kann. Vielleicht tüfteln die im Verborgenen an eine Art "outer-space" Projekt für die reichen und mächtigen, da brauchst du mit Sicherheit fp64.

Aber: Es soll ja wirklich Leute geben, sie niemals ihr know-how, historisch bedingt, an die Chinesen verkaufen wollen.

Skysnake
2021-01-20, 13:42:35
Was ein bullshit.... wenn man fp16 implementiert hat ist es kein Ding auch FP64 oder fp128 zu implementieren. Im Zweifel ist das nicht mehr als den Wert in zwei Varisblen ändern...

vinacis_vivids
2021-01-20, 13:52:05
So ein bs was du da schreibst. Am fp64 hängt ne ganz andere Infrastruktur und ganz andere usecases.

Skysnake
2021-01-20, 15:15:44
Wieviele FP16 und FP64 VHDL Implementierungen hast du denn schon gesehen?

konkretor
2021-02-10, 10:50:40
Habe noch etwas gefunden https://twitter.com/coreteks/status/1359418753843425281?s=20



https://coreteks.tech/articles/index.php/2021/02/10/big-island-gpu-a-brief-architecture-overview/

vinacis_vivids
2021-02-10, 13:13:12
Wieviele FP16 und FP64 VHDL Implementierungen hast du denn schon gesehen?

Danke für diese Frage.

Einfaches Beispiel:
fp16 ist bereits seit Vega uArch in den Games angekommen. Die Implementierung mit halber Präzision spart Speicherplatz und Rechenzeit.
fp16 habe ich schon Anfang der 90er gesehen und damit gespielt, da war ich 5 Jahre alt.

fp32 ist dominierend und sehr gängig in modernen 3D-Spielen.

fp64 ist interessant wenn du Strahlungswellen berechnen willst, um das Alter eines Sterns im Universum zu bestimmen bzw. die Halbwertzeit eine Atoms zu messen um evtl. Anteile eine Elements im Gestein zu bestimmen.

So gesehen habe ich schon einige fp16 und fp64 Implementierungen gesehen. Mehr fp16 als fp64.

Wie siehst denn bei dir aus?
Wie viele Implementierungen hast du gesehen?
An welchen hast du denn mitgewirkt und mitgearbeitet?

konkretor
2021-02-11, 06:38:39
https://www.nextplatform.com/2021/02/10/a-sneak-peek-at-chinas-sunway-exascale-supercomputer/

Skysnake
2021-02-12, 20:32:36
...
So gesehen habe ich schon einige fp16 und fp64 Implementierungen gesehen. Mehr fp16 als fp64.

Nein nicht so gesehen. Die Frage war nicht wieviel Hardware mit FP Units hast du gesehen/benutzt, sondern wieviele VHDL Implementierungen von FP Units hast du schon gesehen.

Nur damit du weißt wovon ich rede https://de.m.wikipedia.org/wiki/Very_High_Speed_Integrated_Circuit_Hardware_Description_Language



Wie siehst denn bei dir aus?

Wenn's nach dem geht was du meinst, dann raten das bei mir arm, Power, ia64, AMD64, vliw amd, NVIDIA von Tesla bis Volta, von XeonPhi, SX und Sparc64.


Wie viele Implementierungen hast du gesehen?
An welchen hast du denn mitgewirkt und mitgearbeitet?
In der Vorlesung hatten wir den Hardwareaufbau von FP, eine Kommilitonin hat ne Ieee konforme FPU implementiert in Verilog inklusive Testbench zur Verifikation. Die Gabe ich mir teilweise angeschaut und mit ihr drüber diskutiert und dann habe ich diverse paper über Teilkomponenten von FPUs gelesen, weil ich ähnliche Probleme zu lösen hatte.

Zudem habe ich mal bei nem Timing closure von placement and Route geholfen für nen Teil einer FP fähigen unit.

Reicht das?

konkretor
2021-02-19, 11:38:46
Hier noch nen Artikel von Golem

https://www.golem.de/news/sunway-exascale-china-erlaeutert-1-exaflops-supercomputer-2102-154327.html

konkretor
2021-02-21, 12:53:10
Haben wir auch einen Thread für CPU´s aus Russland?

https://www.golem.de/news/mcst-elbrus-die-zukunft-von-russlands-eigenen-cpus-2102-154320.html

Auf die Desktop Teile bin ich mal gespannt

y33H@
2021-02-21, 16:02:02
Es gibt nen uralten:

https://www.forum-3dcenter.org/vbulletin/showthread.php?p=269551

Rabiata
2021-03-13, 18:17:42
So ein bs was du da schreibst. Am fp64 hängt ne ganz andere Infrastruktur und ganz andere usecases.
Programmiertechnisch ist der Weg von fp16 zu fp64 nicht schwer, Du mußt halt die Variablen umdefinieren und damit leben daß dein Programm jetzt mehr Speicher braucht und langsamer läuft.

Umgekehrt ist schwerer. Wenn Du mit fp64 gearbeitet hast und jetzt mit fp32 oder gar fp16 auskommen willst, mußt du deinen Code auf die Auswirkungen der größeren Rundungsfehler abklopfen.
Außerdem gibt es vielleicht den einen oder anderen Punkt, an dem es mit dem kleineren Wertebereich Überläufe geben kann => Laufzeitfehler.

Simon Moon
2021-03-17, 10:44:13
aths hat hier mal einen sehr ausführlichen Artikel zu den ganzen Fixpoint und Floating-Point Formaten gemacht:
http://alt.3dcenter.org/artikel/fp_format/

Der Aufbau einer FP Zahl ist halt ganz anders als der von Integern. Mit int kann man einfach das Register verdoppeln und hat dann die doppelte Breite oder zwei Mal die normale Breite. Mit FP wird es dann wohl schon anspruchsvoller eine FP64 ALU in 2 * FP32 oder FP16 Berechnungen aufuteilen, aber da gab es dann nicht mal irgendwelche NV Chips welche das konnten?

konkretor
2021-04-19, 12:33:04
Golem hat neues Futter

https://www.golem.de/news/loongarch-china-hat-eigene-cpu-befehlssatz-architektur-2104-155830.html

Edit:

https://www.heise.de/news/LoongArch-China-hat-eigenen-CPU-Befehlssatz-fertig-entwickelt-6019624.html

Wörns
2021-04-19, 13:44:22
Interessant. Bleibt nur die Frage offen, wo sie in 12nm fertigen wollen.
MfG

Benutzername
2021-04-19, 20:10:46
Interessant. Bleibt nur die Frage offen, wo sie in 12nm fertigen wollen.
MfG
Taiwan, Dresden, Korea oder auch in Shenzhen. dort steht seit 2019 eine Fabrik für 14 und 8 nm. 12 nm ist sowieso 14nm+. In Shanghai ist eine für 12/14 nm geplant. Bei Peking wird auch gebaut.

https://en.wikipedia.org/wiki/List_of_semiconductor_fabrication_plants


Für die Ironie könnten sie ja auch Erstkunde bei intel werden. ;D

Fusion_Power
2021-04-19, 20:21:44
Eventuell meinte er, wo denn überhaupt noch Kapazitäten frei wären um neue Chips zu fertigen. So wie der Markt im Augenblick aussieht scheint ja jeliche Chipfertigung extremst ausgelastet zu sein, weltweit.

CrazyIvan
2021-04-19, 21:00:23
Sollte AMD für das IOD den Prozess wechseln, dann hat GF mehr als genug frei.

Wörns
2021-04-20, 12:18:30
Ich meinte schon, wo die das in China fertigen wollen.
Es ist ja ein nationales Projekt eines staatlichen Instituts, von der IP anderer Architekturen unabhängig zu sein. Da liegt es auch nahe, im eigenen Lande fertigen zu wollen.

Klar können die überall fertigen. Wahrscheinlich werden sie sich einfach den günstigsten Anbieter suchen. Denn zunächst ist es wohl noch ein Forschungsprojekt, dessen Früchte vermutlich noch nicht marktreif sind. Da brauchen sie noch keine großen Volumina.

Aber wenn sie damit groß rauskommen und in der Folge als Land China von den anderen Architekturen unabhängig werden wollen, muss die neue Architektur auch auf einem modernen Prozess laufen, der idealerweise auch in China gefertigt wird.
MfG

y33H@
2021-07-24, 12:57:23
Gibt neue Looongson-CPUs, denn 3A5000 für Desktop/Laptop und den 3C5000 für Server:

https://www.golem.de/news/loongson-3a5000-chinesische-quadcore-cpu-mit-eigenem-befehlssatz-2107-158393.html

76275 76276

konkretor
2021-07-26, 16:29:33
Looongson also den würde ich gerne mal in nem Desktop testen mit Linux im Alltag

vinacis_vivids
2021-09-16, 18:15:02
https://www.handelsblatt.com/meinung/kolumnen/asia-technomics/asia-techonomics-vom-hoffnungstraeger-zum-pleitefall-der-fall-tsinghua-unigroup-zeigt-wie-schwer-die-chipaufholjagd-fuer-china-ist/27611172.html?ticket=ST-1598671-SdHRDukXxDifokWexvQv-ap1

Tsinghua Unigroup ist pleite.

Der Weg zu China`s eigener Chipfertigung ist noch sehr sehr weit weg. Es fehlt einfach das Know-How.

Benutzername
2021-09-17, 00:10:27
Gibt neue Looongson-CPUs, denn 3A5000 für Desktop/Laptop und den 3C5000 für Server:

https://www.golem.de/news/loongson-3a5000-chinesische-quadcore-cpu-mit-eigenem-befehlssatz-2107-158393.html

76275 76276

Nohcein wenig mehr zu den Loongson 3A5000 CPUs

https://hexus.net/tech/news/cpu/148149-first-benchmarks-chinas-loongson-3a5000-cpu-surface/

https://www.phoronix.com/scan.php?page=news_item&px=Loongson-3A5000-Benchmark


Scheint wohl schnell genug für viele gewöhnliche AUfgaben zu sein (Internetschreibmaschine), aber LArabel von Phoronix sschreibt ja selbst, daß das sehr langsame Ergebnisse für die Phoronix suite sind. Und das bei einem 2,5 GHz Prozessor in 12 nm (welche Foundry eigentlich?). Schneller als die alten MIPS Teile con Loongson, aber die waren ja auch in größeren Strukturen gefertigt. Da sind ja die Genossen ZhaoXhin schon schneller. Und wer weiss wer in China demnächst mal mit einer RISC-V CPU um die Ecke kommt.

konkretor
2021-09-17, 11:53:47
Also in China direkt von SMIC die können aktuell nur 14 nm

12 nm können TSMC/Glofo / Samsung

https://en.wikichip.org/wiki/technology_node


hier noch die ISA vom Loongson


https://loongson.github.io/LoongArch-Documentation/LoongArch-Vol1-EN.html

vinacis_vivids
2021-09-20, 12:34:39
https://wccftech.com/china-domestically-produced-gpus-now-offer-performance-of-an-nvidia-geforce-gtx-1080-graphics-card-jm9-series-gpu-tapes-out/

https://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/News/China-Konkurrenz-JM9-GPU-GTX-1080-1379730/

Eckdaten:
GPU - JM9271
GPU: > 1800Mhz GPU-CLK
MEM: 512 GB/s Bandbreite
MEM: 16GB HBM? Speicher
Watt: ~ 200W Verbrauch
Rechenleistung: ~ 8000 GFLOPS fp32
Fertigung: 28nm?

Leistungsmäßig bei ~ Vega64 & GTX1080 einzuordnen.

Die 16GB HBM VRAM erscheinen mir viel zu viel für diese Leistungsklasse, aber in China stehen die Leute auf großen Speicher. Oder der Kompressionsalgorythmus ist einfach noch nicht so effizient, weshalb China mehr Platz/Speicher verbraucht.

Bei 28nm Fertigung ist der Chip vermutlich riesig und verbraucht viel Material für die Kühlung.

Wörns
2021-11-02, 17:28:57
Ein Artikel über den Loongson 3A5000 und dessen Innenleben, das wohl teils MIPS und teils RISC-V ist.
The Register:
Latest Loongson chip is another step in China's long road to semiconductor freedom (https://www.theregister.com/2021/11/02/china_loongson_mips/)
MfG

y33H@
2021-11-19, 15:37:15
Nicht direkt CPUs, aber Prozessoren im Allgemeinen für Supercomputer:

https://scr3.golem.de/screenshots/2111/China-Exaflops-Supercomputer/thumb620/China-Exaflops-Supercomputer-04.png

https://www.golem.de/news/top500-china-hat-das-exaflops-supercomputer-rennen-gewonnen-2111-161211.html

EDIT

LOL, die Kommentare zu Loongson sind ja geil:
Add some basic documentation for LoongArch. LoongArch is a new RISC ISA,
which is a bit like MIPS or RISC-V. You keep saying "not MIPS", and yet all I see is a blind copy of the
MIPS code.

Ich hatte schon in meiner News gesagt, Loongson spricht von einem GS464V-Design mit MIPS64-Technik ^^ steht sogar auf dem IHS ...

Felixxz2
2021-11-20, 09:33:01
https://www.computerbase.de/2021-11/exaflops-supercomputer-chinas-oceanlight-schlaegt-mit-390-kern-cpus-die-top-500/

Hier auch ein Artikel zum ersten ExaFlop Computer aus China. Klingt für mich irgendwie ziemlich schräg, eine 390 Core CPU mit AVX 512 Verschnitt in einem, vermutlich, älteren Prozess soll doppelt so effizient sein wie Fugaku?

Skysnake
2021-11-20, 10:58:02
Schaubdie an wie gering die memory Bandbreite ist und Interconnect ist da auch nicht bei.

Also kann man nicht einfach so vergleichen

=Floi=
2021-11-20, 12:04:59
Wenn man es mit den taktraten nicht übertreibt, halte ich das schon für möglich. Die chinesen gleichen den taktnachteil dann mit masse aus.
Die neuen qualcomm haben noch immer nur 1,8-2ghz auf den little cores.


Wäre mal interessant, ob die hier westliches personal eingekauft haben.

Felixxz2
2021-11-20, 12:27:28
Also vielleicht auch einfach ein Blender um ne möglichst große Flop Zahl draufzuschreiben, die in der Praxis aber nicht ausgenutzt werden kann?

Troyan
2021-11-20, 12:40:08
Das ist AMDs MI200. China erreicht 74% der theoretischen Rechenleistung und ist somit deutlich besser. MI200 liegt bei <50% und Frontier wird wohl irgendwo bei 750 Petaflops Linpack landen und somit deutlich langsamer als China.

Also so schlecht sind die Prozessoren jetzt nicht.

Felixxz2
2021-11-20, 15:20:13
Woher hast du die Werte von MI200?

Und die Frage ist ja dann wie sie das gebaut haben. Vor allem in welchem Prozess die gefertigt sind und wie die 390 Cores organisiert sind.

Troyan
2021-11-20, 15:56:57
AMD hat eigene Benchmarks gegen A100 veröffentlicht: https://www.amd.com/en/graphics/server-accelerators-benchmarks

In HPL werden 42,27 TFLOPs erreicht und somit ca. 44% der maximalen Rechenleistung. HPL ist Linpack.

y33H@
2021-11-20, 16:06:49
Das mit den 390 Cores stimmt nicht, es 384 ^^ ein jeder SW26010 Pro hat 14 Teraflops und 307 GByte/s ... die MI250X hat 48 Teraflops bei 3280 GByte/s - das ist schon ein massiv besseres Verhältnis, jupp. Gerade wenn da nicht nur Linpack läuft ...

Troyan
2021-11-20, 16:22:11
Bei MI200 sind es 22 TFLOPs und 1,6TB/s. Oder eben 44 TFLOPs und 400GB/s.

y33H@
2021-11-20, 16:28:45
Wie kommst du auf diese Werte? Die MI250 non-X hat 45 Teraflops Vector FP64 und 3280 GByte/s theoretisch.

Troyan
2021-11-20, 16:30:55
Die beiden GCDs kommunizieren nur mit 400GB/s. Daher sind es keine 3,28TB/s an Bandbreite.

y33H@
2021-11-20, 16:34:01
Ah, jez kann ich dir folgen =) kenne leider die unter-Mode-Bandbreite der SW26010 Pro nicht

Troyan
2021-11-20, 16:45:05
Und wie gesagt, so schlecht können die Prozessoren nicht, wenn man eine Effizienz von 74% in Linpack erreicht. A100 liegt bei 78%. Selbst wenn Anwendungen deutlich schlechter laufen, AMD ist MI200 auf einem kompletten anderen Level mit knapp ~33% der realen Rechenleistung.

Felixxz2
2021-11-20, 17:28:10
MI200 sind für das OS zwei GPUs, wieso sollte die Inter-Die Kommunikation die Speicherbandbreite limitieren? Das ist viel mehr eine der großen Stärken, IF-Interconnect mit Epyc zusammen.
Verstehe auch nicht wieso 44 TFLOPs die Hälfte von 45 TFLOP/s FP64 Vector sind...

Ist aber sowieso völlig OT, meine Frage war vielmehr ob a) die Werte realistisch sind (das sind ja inofizielle Werte) und b) wenn sie das sind, was der technische Hintergrund ist.

Denn wenn das so stimmt, sind das ja ziemlich starke Dinger.

Skysnake
2021-11-20, 17:32:10
Also vielleicht auch einfach ein Blender um ne möglichst große Flop Zahl draufzuschreiben, die in der Praxis aber nicht ausgenutzt werden kann?

Kann man so nicht einfach sagen. GPUs sind ja teils recht ineffizient weil Sie viele Threads brauchen um die Latenzen zu verstecken. Zudem ist halt die Frage wie es mit Granularität der Zugriffe und Branching aussieht Usw usf. Sprich das ist kein einfaches Thema. Und man sieht ja auch,dass die Maschinen bei realen Anwendungen gar nicht so schlecht performen. Wobei ich keine Ahnung habe wie "nett" die Probleme sind.

Programmierbarkeit ist auch ein Thema. Super effiziente Architektur die aber schwer/aufwändig zu programmieren ist ist auch ein Problem, denn nur die Hero runs bekommen teils extremen Support,aber nicht jeder.

Ein weiteres Thema ist halt mit den Threads/Parallelität wie viel man braucht um das zu nutzen. Je nachdem fangen dann Caches viel auf.

UND ganz wichtig ist auch bekommt man überhaupt die Memorybandbreite realisiert???? Bei NVIDIA stieg z.b. sehr lange zwar die Bandbreite der Karte aber nicht die Bandbreite pro Thread. Ich meine man hat Faktor 3 oder war es 12??? Mehr an Threads als Alus. Keine Ahnung ob das mit Volta und Ampere noch so ist.


Man kann aber wohl nicht einfach sagen, das es stunt Maschinen für Linpack/Top500 sind.

Das zeigen schon die Bell Papers.

AffenJack
2021-11-20, 17:34:59
Das mit den 390 Cores stimmt nicht, es 384 ^^ ein jeder SW26010 Pro hat 14 Teraflops und 307 GByte/s ... die MI250X hat 48 Teraflops bei 3280 GByte/s - das ist schon ein massiv besseres Verhältnis, jupp. Gerade wenn da nicht nur Linpack läuft ...

Es sind 96 Tflops bei 3280 GB/s für Linpack. Linpack nutzt Matrix FP64, wie man auch an den Werten von 15 TFlops für A100 in AMDs Benches sieht.

Also 34GByte/s pro Tflops MI200 vs 22 GByte/s pro Tflops bei SW26010 Pro. Ist zwar noch ein deutlicher Unterschied, aber nun nicht so massiv und zumindest in Linpack kann MI200 seine therethische Leistung überhaupt nicht nutzen.
Wie wird RPeak eigentlich berechnet in den Top500. Das ist doch der theorethische Wert, der müsste dann auch mit Matrix FP64 berechnet sein oder?

Für echte Probleme wäre wohl HPCG interessanter als HPL oder? Da haben die chinesischen Supercomputer bisher aber ziemlich abgekackt.

Skysnake
2021-11-20, 17:38:10
Die beiden GCDs kommunizieren nur mit 400GB/s. Daher sind es keine 3,28TB/s an Bandbreite.

Das ist bullshit, oder rechnest du bei einem 2 CPU System auch nur die Bandbreite zwischen den CPUs? Oder bei nem Cluster nur die Internode Bandbreite?

Sorry, aber es sind einfach zwei Numa Domains.

Skysnake
2021-11-20, 17:42:44
.
Wie wird RPeak eigentlich berechnet in den Top500. Das ist doch der theorethische Wert, der müsste dann auch mit Matrix FP64 berechnet sein oder?

Dafür gibt es leider keine verbindliche Regel was dazu führt das zick Rechenweisen auf der Top500 sind. Ich bekomme da teils das Kotzen weil Peak teils ziemlich gefaked wird um ne bessere Effizienz zu bekommen..


Für echte Probleme wäre wohl HPCG interessanter als HPL oder? Da haben die chinesischen Supercomputer bisher aber ziemlich abgekackt.
Jaein. HPCG ist am Ende ein Fancy Stream. Das ist schon auch wichtig, aber HPL auch. Es gibt in vielen Codes Phasen in denen HPL eher repräsentativ ist und dann auch Phasen in denen HPCG besser passt

y33H@
2021-11-20, 21:11:20
Es sind 96 Tflops bei 3280 GB/s für Linpack. Linpack nutzt Matrix FP64, wie man auch an den Werten von 15 TFlops für A100 in AMDs Benches sieht. Nutzt Linpack denn auch Matrix FP64 bei der MI250? Weil 42,26 Teraflops von theoretisch 90,5 Teraflops ist echt nicht pralle angesichts von 15,33 Teraflops vs 19,5 Teraflops bei der A100.

basix
2021-11-21, 11:11:58
Vermutlich schon. Bei der Gegenüberstellung nutzte A100 ebenfalls Matrix-Operationen. Wäre dann ja irgendwie komisch/dämlich, wenn AMD für ihre eigene GPU dann nur Vector nutzen würde.

Bei MI200 scheint die Bandbreite und/oder Grösse der Caches die Performance zu limitieren. Mich erstaunt das jetzt nicht. Interessant wird mMn dann aber, wie das bei Vector only aussieht. Gibt das HPL her? Kann man beides ausmessen? Ich nehme an, dass es da draussen deutlich mehr Vector FP64 als Matrix FP64 Code gibt.

AffenJack
2021-11-21, 12:12:20
Nutzt Linpack denn auch Matrix FP64 bei der MI250? Weil 42,26 Teraflops von theoretisch 90,5 Teraflops ist echt nicht pralle angesichts von 15,33 Teraflops vs 19,5 Teraflops bei der A100.

Sie nutzen eigene AMD optimierungen in HPL, es wäre wie basix schon schreibt sehr merkwürdig, wenn man dann nicht Matrix FP64 nutzen könnte, wo man diese bei Nvidia nutzt. Höchstens wenn es gerade keine Softwaremöglichkeit gibt Matrix FP64 bei AMD anzusprechen, das wäre aber noch schlimmer.

Deswegen hatte ich ja auch gefragt, was man für RPeak nimmt. Nimmt man bei A100 jetzt Matrix und bei CDNA2 Vektor, dann wäre das schon irgendwie dämlich. Aber wenn das stimmt, wasi Skysnake schreibt kann das durchaus passieren.

Man muss einfach sehen, dass CDNA2 den FP64 Durchsatz verdoppelt und bei Matrix FP64 sogar vervierfacht bei gleichen Register, Caches etc. wie das Whitepaper zeigt. Nur die L2 Geschwindigkeit hat man verdoppelt. Da kann man die Geschwindigkeit nur in Spezialfällen ausnutzen, sonst müsste man sich fragen, wieso CDNA1 viel zu große Caches hat, wenn CDNA2 doch nur die Hälfte/Gflop braucht.

Troyan
2021-11-21, 12:21:18
Das ist bullshit, oder rechnest du bei einem 2 CPU System auch nur die Bandbreite zwischen den CPUs? Oder bei nem Cluster nur die Internode Bandbreite?

Sorry, aber es sind einfach zwei Numa Domains.

Na, dann erkläre doch mal, wieso der HBM mit 1,6 TB/s angebunden ist, wenn 400GB/s vollkommen ausreichend wären.

MI250X besteht aus zwei GCDs verbunden über 400GB/s. Ich rechne auch nicht die Bandbreite zwischen verschiedene Blades zusammen, wenn die per 100mb/s LAN angebunden wären.

Fakt ist, eine MI250X OAM Karte hat keine 97TFLOPs TensorFP64 mit 3,2 TB/s Bandbreite. Das ist falsch. Es sind 97 TFLOPs mit 400GB/s.

Skysnake
2021-11-21, 12:31:52
Oh man.... kann es ihm bitte jemand freundlich erklären?

AffenJack
2021-11-21, 12:37:53
Na, dann erkläre doch mal, wieso der HBM mit 1,6 TB/s angebunden ist, wenn 400GB/s vollkommen ausreichend wären.

MI250X besteht aus zwei GCDs verbunden über 400GB/s. Ich rechne auch nicht die Bandbreite zwischen verschiedene Blades zusammen, wenn die per 100mb/s LAN angebunden wären.

Fakt ist, eine MI250X OAM Karte hat keine 97TFLOPs TensorFP64 mit 3,2 TB/s Bandbreite. Das ist falsch. Es sind 97 TFLOPs mit 400GB/s.

Wie kommst du auf 97 Tflops mit 400Gb/s? Niemand rechnet den Interconnect als Bandbreite. Auch bei Dual-GPUs hat das nie jemand getan. Am Ende muss man es eher als zwei einzelne GPUs mit je 49TFlops und 1,6 TB/s betrachten. Der einzige Unterschied ist, dass sie auf einem Sockel sind, aber sie könnten genauso beide auf einem PCB sein. Ändert nix daran, dass jedes GCD 1,6 Tflops/s Bandbreite hat.

Troyan
2021-11-21, 12:47:45
Weil die heutigen Probleme so riesig sind, dass die sie nicht mehr lokal gelöst werden können. Welche Bandbreite hat eine OAM Karte, wenn der Datensatz 128GB beträgt und GCD1 auf Informationen im HBM von GCD0 zugreifen muss? Richtig 400GB/s.

Exascale bedeutet die Skalierung von Problemen über das komplette Rechenzentrum.

Felixxz2
2021-11-21, 12:56:17
Und rechnest du dann in üblichen HPC Clustern mit nV Karten auch mit dem Speed des Interconnects über PCIe/nVLink/Mellanox etc. und nicht die Speicherbandbreite?

Hoffentlich nicht. Aber ist weiterhin komplett OT.

davidzo
2021-11-21, 13:55:44
Weil die heutigen Probleme so riesig sind, dass die sie nicht mehr lokal gelöst werden können. Welche Bandbreite hat eine OAM Karte, wenn der Datensatz 128GB beträgt und GCD1 auf Informationen im HBM von GCD0 zugreifen muss? Richtig 400GB/s.

Exascale bedeutet die Skalierung von Problemen über das komplette Rechenzentrum.

Wenn der Datensatz 128gb beträgt, können zumindest auf die ersten 64GB mit 1,6TB/s zugegriffen werden bevor es offchip geht. Auf 128gb kann also im Durchschnitt mit 1tb/s zugegriffen werden, bzw. sogar schneller weil es vier weitere IFlinks gibt und also auch bandbreite auf anderen Packages und von der cpu genutzt werden kann.

Je größer der lokale Ram, aber auch Cache ist, desto weniger spielt die off-chip Bandbreite eine Rolle und desto weniger Energie verbraucht die Anbindung. Mehr Energiebudget für die Alus. Was übrigens genau der Anwendungsfall von GPU beschleunigern ist: perfekt parallelisierbare Compute-workloads. Rein Speicherbandbreitenlastige Workloads ohne viel compute sind selten und laufen auch bereits gut genug auf einer CPU mit 8ch DDR4 und einem tief gestaffelten cache-system, oder eben in Teillast auf der GPU.

Man kann AMDs Verdopplung des VRAMs pro Chip gegenüber Mi-100 also auch als preemtive Move gegen Ponte Vecchio verstehen. Bei Compute ist CDNA2 ohnehin höher angesetzt, aber dem rambocache und dem Xe-Link fabric kann man mit 128gb pro Karte effektiv auch etwas entgegensetzen.

Skysnake
2021-11-21, 13:59:36
Weil die heutigen Probleme so riesig sind, dass die sie nicht mehr lokal gelöst werden können. Welche Bandbreite hat eine OAM Karte, wenn der Datensatz 128GB beträgt und GCD1 auf Informationen im HBM von GCD0 zugreifen muss? Richtig 400GB/s.

Exascale bedeutet die Skalierung von Problemen über das komplette Rechenzentrum.

Das hat 1. Nichts mit Exascale zu tun und 2. Wird schon immer die Gesamtbandbreite gerechnet. Die notwendige Bandbreite für den Datenaustausch ist immer niedriger als die für die Berechnung im eigenen Problembereich bei hinreichend gutartigen Problemen.

Und alle Probleme die nicht derartig gutartig sind würde eh nie jemand auf ne GPU packen. Also Beispielsweise große Datenbanken.

Man kann Ihnen wenn dann vorwerfen, dass die das einfach zusammenzählen statt zu sagen es sind 2x45TF und 2x 1.6TB Bandbreite. Das wäre wohl ganz richtig, da die GPU wohl auch als zwei devices sichtbar ist.

Aber dann beschweren dich bitte auch bei NVIDIA über die Angaben der Bandbreiten in den DGX Systemen.

mksn7
2021-11-22, 13:58:03
Jaein. HPCG ist am Ende ein Fancy Stream. Das ist schon auch wichtig, aber HPL auch. Es gibt in vielen Codes Phasen in denen HPL eher repräsentativ ist und dann auch Phasen in denen HPCG besser passt

Letztendlich dürfte er aber für eine deutlich größere Gruppe von Applikationen repräsentativ sein als der HPL.


Warum ist die Effizienz kleiner als 100%? Hätten CDNA2 keine tensor cores, wäre die Effizienz höher. Aber so hat man halt eine höheres Ppeak, aber hat drum rum nicht genug aufgebohrt. Ein wichtiger Faktor hier ratio FMA/load. Eine A100 lädt einen halben FP64 warp pro Takt und SM, kann aber ein FMA pro Takt und SM, ich brauch also mindestens ein 2:1 ratio um an peak ran zu kommen . Wenn ich meine Matrix Multiplikation schlecht programmiere (Wert A und B laden, und dann sum += A*B rechnen), hab ich nur ein 1:2 ratio und nur 1/4 der möglichen Performance. Das geht natürlich besser, ich kann jeden Wert A und B mehrmals aus Registern verwenden, aber dann brauche ich mehr Register.

Jetzt hat CDNA schon mit Vector FP64 den doppelten Durchsatz pro Takt und CU im vgl. zu Volta, und vermutlich (ich schließe von meinen Messungen auf MI100) nur den halben load Durchsatz, müsste also allein für Vektor FP64 ein 8:1 ratio FMA/load benötigen. Mit Matrix FP64 dann sogar 16:1. Wenn ich das nicht gerade völlig falsch denke, brauch ich dafür ein 16x16 tile, was 512 32bit Register entspricht, was das Limit von 256 Registern pro thread (das ist bei CDNA auch so, oder?) sprengt.

Also meine These ist: Man kann gar nicht genug reuse aus den Registern raus bekommen, um mit der niedrigen L1 Bandbreite die gigantische Rechenleistung zu füttern. Da kann aber auch ein Denkfehler drin sein, und bei den konkreten Raten bin ich mir auch nicht sicher.

Skysnake
2021-11-23, 09:07:12
Ob HPL oder HPCG repräsentativer ist hängt doch ganz allein von deinem Problem ab. Und das ändert sich meist auch innerhalb eines Problems.

Schau mal, ich habe mir Applikationen berufswegen auf unterschiedlichen Architekturen angeschaut. Du hast oft, das große Teile schneller werden, aber dann ist da diese eine beschissene Funktion oder zwei, die dir wieder alles zunichte macht, weil Sie so fucking viel langsamer ist. Deswegen bringt es auch absolut nichts sich hin zu stellen und nur einzelne Funktionen/Bereiche zu vergleichen. Das Einzige was relevant ist ist time to solution.

Das ist alles ein extrem weites Feld in dem man sich super schnell verliert. Und sagen wir es mal so. HPL könnte oft wichtiger sein, wenn die Leute sich die arithmetische Intensität des Problems und der realen Umsetzung anschauen würden. Da wird nämlich oft sehr oft sogar viel zu viel auf der Straße liegen gelassen.

Und zudem muss man Bedenken, das man nicht floss und Bytes 1:1 rechnen darf im Austausch für nem beliebigen Chip sondern eher so ich verliere 10-20 Flops pro Bit bzw Byte. Bin mir da nicht mehr sicher beim Faktor...

Und da merkt man dann oft, das einem mehr Bandbreite unterm Strich über alle Probleme auch nicht schneller ans Ziel bringen würde.

mksn7
2021-11-23, 13:37:54
Und sagen wir es mal so. HPL könnte oft wichtiger sein, wenn die Leute sich die arithmetische Intensität des Problems und der realen Umsetzung anschauen würden. Da wird nämlich oft sehr oft sogar viel zu viel auf der Straße liegen gelassen.


Ich verstehe das so: Auch sehr schlecht optimierte Codes können oft die Speicherbandbreite voll ausnutzen. Aber nur sehr gut optimierte Codes kommen auch nur in die Nähe von Ppeak. Da stimme ich voll zu.



Und da merkt man dann oft, das einem mehr Bandbreite unterm Strich über alle Probleme auch nicht schneller ans Ziel bringen würde.
[/QUOTE]

Deswegen würde ich genau das Gegenteil behaupten, eine Verdopplung der Speicherbandbreite würde im Schnitt über viele HPC Applikationen einen wesentlich größeren Unterschied machen als eine Verdoppelung von Ppeak.

Fusion_Power
2021-11-23, 16:02:36
Hatte ich heute in einer Newsletter vom Dragonmbox-Shop (https://dragonbox.de/de/minipcs-mit-linux/phytium-d2000-armv8-mini-pc-vorbestellung.html):

Phytium D2000 ARMv8 Mini PC

https://heise.cloudimg.io/v7/_www-heise-de_/imgs/71/3/2/1/4/8/5/5/phytium-d2000-armv8-mini-pc-vorbestellung-767e354097a39d7e.jpg?q=75&width=665

Dragonbox will einen Mini-PC rund um die chinesische Phytium-CPU D2000 in den deutschen Handel bringen – sofern die Nachfrage hoch genug ist. (https://www.heise.de/news/Phytium-D2000-Mini-PC-mit-chinesischem-Achtkern-Prozessor-und-Radeon-GPU-6267566.html?hg=1&hgi=2&hgf=false)

Chinesische (Desktop)ARM CPUs sind für mich böhmische Dörfer aber interessantes Produkt denk ich mal. Kommt halt drauf an was man mit einem Linux-ARM-Desktop PC anfangen will und kann. Immerhin soll eine AMD RX 550 verbaut sein, keine Ahnung wie die sich treibertechnisch unter Linux schlägt aber vermutlich immer noch besser als ne simple iGPU.
Bin echt mal gespannt wie sich so ein Gerät in der Praxis schlägt.

Loeschzwerg
2021-11-23, 17:31:45
Bestellst du dir so ein Kistchen? Ich bin ehrlich gesagt schon sehr versucht mir just-for-fun so ein Teil zu organisieren, der Raspberry Pi ist einfach zu langsam und alt ^^ Hier erhoffe ich mir durchaus akzeptable Desktop Leistung.

https://www.reddit.com/r/arm/comments/qfa495/running_serious_sam_3_bfe_steam_on_arm_pc_phytium/hi0jeo4/

7-Zip [64] 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=en_US.UTF-8,Utf16=on,HugeFiles=on,64 bits,8 CPUs LE)

LE
CPU Freq: - - - - - - - - -

RAM size: 15913 MB, # CPU hardware threads: 8
RAM usage: 1765 MB, # Benchmark threads: 8

Compressing | Decompressing
Dict Speed Usage R/U Rating | Speed Usage R/U Rating
KiB/s % MIPS MIPS | KiB/s % MIPS MIPS

22: 15379 705 2123 14961 | 216738 783 2360 18487
23: 14905 718 2116 15187 | 213100 785 2348 18441
24: 13976 710 2117 15028 | 208184 784 2332 18272
25: 14031 700 2289 16021 | 204295 785 2317 18181
---------------------------------- | ------------------------------
Avr: 708 2161 15299 | 784 2339 18345
Tot: 746 2250 16822


Das sind zwar keine gigantischen Werte, aber doch deutlich über dem was man sonst so an SBCs bekommt.

Edit:
Hier gibt es Werte im Geekbench v5:
https://browser.geekbench.com/v5/cpu/search?q=Phytium

~Goldmont Plus im SingleCore

Skysnake
2021-11-23, 17:44:34
Ich verstehe das so: Auch sehr schlecht optimierte Codes können oft die Speicherbandbreite voll ausnutzen. Aber nur sehr gut optimierte Codes kommen auch nur in die Nähe von Ppeak. Da stimme ich voll zu.

Ne nicht wirklich. Unoptimierte Codes nutzen weder die Memory noch die S
ALU Leistung moderner CPUs aus. Wobei unoptimiert auf verdammt viele Codes zutrifft, denn viel zu wenig Leute analysieren ihre Codes richtig. Wer keine roofline analysis seines Codes gemacht hat weiß einfach nicht ob sein Code wirklich gut optimiert ist oder ob da größere Schnitzer drin sind.

Klar, wenn ich die Core counter auslesen und da massig Flops sehe, dann kann ich relativ sicher sein, dass der Code was macht, aber das ist eher selten der Fall.



Deswegen würde ich genau das Gegenteil behaupten, eine Verdopplung der Speicherbandbreite würde im Schnitt über viele HPC Applikationen einen wesentlich größeren Unterschied machen als eine Verdoppelung von Ppeak.
1. Würdest du nicht compute und Speicherbandbreit verdoppeln, sondern eher so Compute verdoppeln oder Speicherbandbreit um 20% steigern.

2. Wenn du Compute gleich lässt und memory Bandbreite verdoppelst wird dein Code im Zweifel kein Stück schneller, wenn sich die Latenzen des Speichers nicht gleichzeitig mit verbessern.

Wie gesagt, glauben tut man in der Kirche und die Performance misst man. Ansonsten kommt nur viel bullshit raus.

Und das auch bei Leuten die seit Jahren/Jahrzehnten auf ihren Codes rum hämmern...

Fusion_Power
2021-11-23, 17:53:23
Bestellst du dir so ein Kistchen? Ich bin ehrlich gesagt schon sehr versucht mir just-for-fun so ein Teil zu organisieren, der Raspberry Pi ist einfach zu langsam und alt ^^ Hier erhoffe ich mir durchaus akzeptable Desktop Leistung.

https://www.reddit.com/r/arm/comments/qfa495/running_serious_sam_3_bfe_steam_on_arm_pc_phytium/hi0jeo4/

Das sind zwar keine gigantischen Werte, aber doch deutlich über dem was man sonst so an SBCs bekommt.

Ich? Näh, ich brauch sowas nicht. Obwohl ich kompakten Mini-Desktop-Systemen durchaus zugeneigt bin würde ich da derzeit noch auf x86 setzen, nicht auf ARM. Und auch nicht auf Linux.

Im "Pyra" Forum gibts schon länger nen Thread (https://pyra-handheld.com/boards/threads/phytium-based-arm-pc.99580/) zu der Kiste, (hatte ich ganz vergessen) der ptitSeb hat sich dem Ding mal angenommen, er ist ein guter coder, von ihm stammt z.B. "Box86". Er hat auch Bilder vom geöffneten Gerät (https://pyra-handheld.com/boards/threads/phytium-based-arm-pc.99580/page-2#post-1701032) gezeigt, 2 kleine Lüfter drinne, leider nicht leise wie ich eben erfahren habe. Also ehr weniger geeignet fürn stillen Büro PC. Hätte man besser lösen können.
Immerhin, Factorio soll recht gut drauf laufen.

Loeschzwerg
2021-11-23, 17:59:57
Danke für den Link, da erfährt man schon etwas mehr. Lautstärke wäre mir relativ egal, ich knabbere da eher am Preis.

mksn7
2021-11-23, 18:19:20
Wie gesagt, glauben tut man in der Kirche und die Performance misst man. Ansonsten kommt nur viel bullshit raus.


So einen Spruch kannst du dir auch sparen. Ich schreibe "glaube", weil ich keine Messungen über eine repräsentative Menge an Applikationen gemacht habe, und da zuverlässige Zahlen haben. Ich schreibe "glaube" weil ich nicht so arrogant bin, meine Erfahrung und Intuition als absolute, allgemeingültige Wahrheit darzustellen.

In meiner Laufbahn sind mir jedenfalls schon viele HPC codes untergekommen, die die Speicherbandbreite ganz easy ausnutzen. Gerade auch schlechte codes. Aber nichts was in die Nähe von Ppeak kommt, ohne dass da jemand viel Zeit und Mühe reingesteckt hat. Aber wie gesagt, ich hab keine repräsentative Studie gemacht, daher alles nur anekdotisch.

Skysnake
2021-11-23, 19:05:53
Das war auch nicht so gemeint. Oder kennst du den Spruch "preoptimisation ist the root of all evil" nicht? Der spricht am Ende die gleiche Problematik an. Die Leute glauben, das etwas ein Problem ist und optimieren an was Rum, was am Ende aber nur für 1% der Laufzeit zuständig ist.

Und btw sich rein auf Memory Bandbreite zu verlassen ist nicht geschickt. Ich hatte schon viele Codes gesehen, wo dann aus einer cacheline nur ein einziger Wert verwendet wurde... klar das man so jedes Memory Subsystem ans Limit bringt. Cache Bloking eingeführt und plötzlich war eher arithmetik Leistung das Problem.

Ich war wie gesagt auch schon öfters sehr überrascht was man findet wenn man wirklich hinschaut ich hatte z.b. mal nen Fortran Code, da war der overhead von nem Funktionsaufruf wegen fehlendem Inlineing bei 3-5% der Gesamtlaufzeit...

Der Teil vom Code hat die CPU auch echt richtig effizient genutzt. Aber er hat halt quasi nichts sinnvolles gemacht...

Oder nen C++ Code der bei jedem Pups nen Objekt erzeugt hat in ner inneren loop. Das würde nach der Optimierung meine ich um Faktoren schneller.

Auf größeren skalen ist dann Systemnoise auch nicht mehr vernachlässigbar, oder congestion im Netz.

Oder mach mal nen HPL Lauf auf nem 1k node System. Uniformität ist da echt nen Killer Wert.

Jetzt verstanden, was ich mit "glauben" meinte?

Und bezüglich reprensentativ. Was bringt es einem wenn 80% der Codes sich wie XY verhalten, Code Z aber für 80% der Laufzeit verantwortlich ist und sich eben nicht so verhält. Richtig. Es bringt einem gar nichts.

Und daher werden die Systeme auch eher diverser, weil sie so groß inzwischen sind, das sich das durch Haus lohnt.

mksn7
2021-11-24, 09:04:29
Das war auch nicht so gemeint. Oder kennst du den Spruch "preoptimisation ist the root of all evil" nicht? Der spricht am Ende die gleiche Problematik an. Die Leute glauben, das etwas ein Problem ist und optimieren an was Rum, was am Ende aber nur für 1% der Laufzeit zuständig ist.

Ich war wie gesagt auch schon öfters sehr überrascht was man findet wenn man wirklich hinschaut ich hatte z.b. mal nen Fortran Code, da war der overhead von nem Funktionsaufruf wegen fehlendem Inlineing bei 3-5% der Gesamtlaufzeit...

Der Teil vom Code hat die CPU auch echt richtig effizient genutzt. Aber er hat halt quasi nichts sinnvolles gemacht...

Oder nen C++ Code der bei jedem Pups nen Objekt erzeugt hat in ner inneren loop. Das würde nach der Optimierung meine ich um Faktoren schneller.


Das ist natürlich richtig. Es gibt genug Codes die weder noch auslasten können. Allokieren/Deallokieren in einer hochfrequenten Schleife ist ein Klassiker, der mir auch immer wieder begegnet. Und fehlendes inlining eines trivialen Konstruktors auch. Ich nenne solche Dinger performance bugs. Manche bottle necks sind dem Algorithmus geschuldet, aber sowas ... muss halt nicht sein.


Und btw sich rein auf Memory Bandbreite zu verlassen ist nicht geschickt. Ich hatte schon viele Codes gesehen, wo dann aus einer cacheline nur ein einziger Wert verwendet wurde... klar das man so jedes Memory Subsystem ans Limit bringt. Cache Bloking eingeführt und plötzlich war eher arithmetik Leistung das Problem.


Unter anderem wegen solcher Dinge bleibe ich bei meiner These dass Speicherbandbreite das knappere Gut ist. Es ist leicht, Fehler zu machen die zu ineffizienter Nutzung der Speicherbandbreite führen (einzelner Wert aus einer cache line), und es braucht Arbeit und Wissen (cache blocking) um die arithmetische Intensität zu erhöhen, und mehr von den arithmetischen Ressourcen auszunutzen.

Aber wie du schon sagst, es gibt viele Wege es zu verkacken, und wir brauchen uns wirklich nicht drum zu streiten welche eine Zahl die Leistungsfähigkeit eines Clusters korrekt angibt. Genau deswegen wurde der HPCG ja eingeführt, damit es nicht mehr nur eine einzelne Zahl ist.


Das ist der Grund für meine These, dass mehr Speicherbandbreite mehr Codes hilft als mehr Arithmetik. Wenn mans naiv macht,

Skysnake
2021-11-24, 20:09:52
Jaein, wie gesagt die Leute verpacken es am laufenden Band wie du sagst und es gibt genug Möglichkeiten dazu. Vor allem bei C++ mit all seinen fancy Funktionen bewegt man sich in einem Minenfeld. Im Prinzip darf man halt fast keines der fancy Konstrukte nutzen, weil das schnell den Compiler killt und damit auch die Performance.

Wie gesagt, Speicherbandbreite ist teuer und den Leuten gehört auf die Finger gebaut wenn Sie sie verschwenden. An sich dürfte kein Code auf nem großen System laufen ohne das roofline Model für jede genutzte Funktion erstellt zu haben...

Einfach mehr Bandbreite hinwerfen führt nur zu noch weniger Disziplin bei den Leuten. Aber hey, wir müssten für Optimierungen halt mal Geld und auch nen Dr. bewerkstelligen. Dann würde sich da auch was tun.

Ansonsten. Ich finde es ne Schande, dass die Leute sich nicht teils einfach mit Stift und Papier hinsetzen und schauen ob die Arithmetische Intensität des Algorithmus zu dem passt, was die CPU macht. Da würde man soooo viele Fehler finden... aber nein, wird alles viel zu wenig gemacht. Kotzt mich schon echt an als Jemand, der das gemacht hat und kann, aber keinen Job außerhalb von irgendwelchen 2 Jahresprojekten mit E13 gefunden hätte. Wer will denn so was auf Dauer machen wenn man Familie hat?

amdfanuwe
2021-11-24, 22:17:01
Ja, schon erschreckend wie Theorie und Praxis beim Programmieren auseinanderklaffen. Bin froh den Shit nicht mehr mitmachen zu müssen.

mksn7
2021-11-25, 12:47:39
Ja, schon erschreckend wie Theorie und Praxis beim Programmieren auseinanderklaffen. Bin froh den Shit nicht mehr mitmachen zu müssen.


Mir macht das Spaß... Sich da wirklich reinzufuchsen worans liegt.

amdfanuwe
2021-11-25, 14:30:48
Nur bekommt man dafür im normalfall keine Zeit. Wenns halbwegs stabil läuft gehts raus an den Kunden. Und das ist deann unbefriedigend und macht keinen Spaß mehr.

y33H@
2021-12-15, 08:37:30
Bestellst du dir so ein Kistchen?Wir kriegen ein Muster, sobald die Dinger verfügbar sind =)

Loeschzwerg
2021-12-15, 10:44:26
Top =) Mein Budget ging für etwas anderes mit VSA100 drauf... ich kann das alte Zeug einfach nicht lassen -.-*

Egal wie, mit BOX86/64 solltest du genügend zu testen haben, die Entwicklung geht da auch schnell voran.

y33H@
2021-12-21, 13:58:44
Haben wir auch einen Thread für CPUs aus Russland?

https://www.golem.de/news/mcst-elbrus-die-zukunft-von-russlands-eigenen-cpus-2102-154320.html

Auf die Desktop Teile bin ich mal gespannt
Gibt was Neues von Baikal Electronics:

https://www.golem.de/news/baikal-be-s1000x-russischer-48-kern-arm-chip-laeuft-2112-161934.html

https://scr3.golem.de/screenshots/2112/Baikal-S-Baikal-L/thumb620/Baikal-S-09.png

konkretor
2022-02-26, 14:27:11
Latest Batch Of LoongArch Patches Posted For The Linux Kernel

https://www.phoronix.com/scan.php?page=news_item&px=LoongArch-Linux-v6

Wörns
2022-05-20, 16:08:16
Laut The Register denkt (https://www.theregister.com/2022/05/19/export_bans_prompt_russia_to/?td=rt-3a) man in Russland über den Einsatz der Zhaoxin Prozessoren nach.
(Bitte keine Politik Diskussion daraus ableiten.)
MfG

konkretor
2022-06-09, 08:42:51
https://wccftech.com/china-domestic-chip-manufacturer-loongson-targets-amds-zen-3-powered-ryzen-with-its-next-gen-cpus-by-2023/


Hier mehr Infos

https://www.eet-china.com/mp/a137262.html

konkretor
2022-06-10, 09:31:53
https://www.golem.de/news/loongson-3c5000-3d6000-3e7000-chinesische-16-kern-cpu-soll-amds-zen-3-erreichen-2206-165973.html

konkretor
2023-07-16, 20:07:18
https://wccftech.com/chinese-gpu-maker-receives-investment-develop-opencl-cuda-compatible-chips-to-tackle-nvidia/

Hier gibt es alle Infos direkt vom Hersteller

https://www.denglinai.com/?products_13/83.html


Goldwasser ;D

Ailuros
2023-07-28, 09:58:43
Schon lange nicht mehr ueber Longsoon gelesen; gut dass China noch daran arbeitet.

Fuer Goldwasser interessant. Entschuldigt die womoeglich bloede Frage aber was meinen die genau mit CUDA hardware accelleration capabilitities? Hat sich die Firma noch eine zusaetzliche (ueber die andere bin ich mir schon ziemlich sicher LOL) Lizenz von NVIDIA gekauft?

konkretor
2023-10-18, 16:57:28
Jemand mehr Infos? Das Design soll wohl auf Sparc/OpenPower basieren



https://wccftech.com/chinese-cpu-maker-phytium-next-gen-architecture-3-ghz-chip-on-par-4-ghz-amd-zen-3/

chithanh
2023-11-27, 14:34:47
Das Design soll wohl auf Sparc/OpenPower basieren
Nein, Phytium hat früher OpenSPARC gemacht, aber jetzt ARM.
HeXin macht OpenPower (gerade neu sind deren HX-C2000 Testchips rausgekommen, und sie arbeiten an Mainline-Kernel-Unterstützung (https://patchwork.kernel.org/project/kvm/patch/20231117075215.647-1-ke.zhao@shingroup.cn/)).
LoongSon macht post-MIPS (LoongArch).
SunWay macht post-Alpha.
Zhaoxin macht x86.

Nuon
2023-11-29, 18:14:48
Hiermit eröffne ich einen allgemeinen Thread für chinesische CPUs. :wink:

Loongson holt zu (low End) Intel auf:

https://www.igorslab.de/loongson-3a6000-chinesische-cpu-macht-intel-konkurrenz/

Die Loongson 3A6000 CPU @2.5 GHz (4 Core 8 Threads) liefert im SPEC CPU 2006 ähnliche Leistungen wie eine Core i5-14600K CPU @2.5GHz.

chithanh
2023-11-29, 21:16:08
Da es ab demnächst auch Computer mit China-CPUs normal im Handel geben wird (zumindest regional und wahrscheinlich auch bei den gängigen Online-Plattformen), ist es denke ich gut einen Spekulationsthread und einen Thread für offizielle Produktreleases zu haben.

joe kongo
2023-11-29, 21:38:40
Beachtlich, da wird sich Intel und AMD in den kommenden Jahren warm anziehen dürfen. Das die China CPU dabei auch noch deutlich weniger Strom verbraucht ist jetzt schon ein Armutszeugnis für die Alteingesessenen.

basix
2023-11-29, 22:06:40
Was hier überall fehlt: Wie viele Cores/Threads vs. die Konkurrenz. Es erscheint mir einigermassen unwahrscheinlich, dass man Raptor Lake IPC erreicht.

Aber wenn ich anhand der Grafiken raten müsste (bei 2.5 GHz):
- ST = 14600K @ 2.5 GHz (SpecCPU 2006 -> Uralt)
- MT = ~10100 @ ~3...4 GHz (je nach Test)

y33H@
2023-11-30, 00:20:09
Halte ich beides für zweifelhaft, gerade mit Blick auf EUV.

Loeschzwerg
2023-11-30, 07:24:29
Steht doch im Text ^^

Um sicherzustellen, dass ein fairer Vergleich möglich ist, wurde der Loongson 3A6000 bei einer Taktfrequenz von 2,5 GHz mit dem Core i3-10100 und dem Core i5-14600K verglichen.

---

Mit der Leistung lässt sich schon ganz gut arbeiten und durch den Alltag kommen, gerade weil auch ein entsprechend angepasstes Linux zum Einsatz kommt.

In China gibt es Fertig-PCs mit 3A6000 nun schon seit ein paar Wochen zu kaufen, für 3000-3300 Yuan (~385-425€). Boards selber kosten sogar nur 500 Yuan, das ist echt günstig.

=Floi=
2023-11-30, 07:59:19
Was könnte den chip dort so schnell machen?
4/8 gegen 6/20 ist schon kurios.

Loeschzwerg
2023-11-30, 08:38:02
單核 -> Singlecore
全核 -> "Fullcore" aka Multicore

Bedeutet man hat 4C/8T (10100 vs 3A5000 vs 3A6000) und Singlecore verglichen, nicht gegen 6/20 des 14600K.

chithanh
2023-11-30, 13:04:28
Boards selber kosten sogar nur 500 Yuan, das ist echt günstig.Wo denn? Wenn ich die Taobao-Listings richtig deute, dann kostet die UOS Professional Lizenz 500 CNY aber die Boards mehr so Richtung 1500 CNY.

Loeschzwerg
2023-11-30, 13:49:18
Hier:
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=86183&stc=1&d=1701348451

Ob die Anzeige (trotz Auswahl für Mainboard only) bei Taoabo so stimmt weiß allerdings nichts. Wobei selbst 1500 Yuan jetzt nicht so schlimm wären.

konkretor
2023-11-30, 17:12:00
golem hat das etwas aufbereitet


https://www.golem.de/news/loongson-3a6000-chinas-neuste-desktop-cpu-glaenzt-in-ipc-benchmarks-2311-179897.html

chithanh
2023-12-01, 01:19:59
Ob die Anzeige (trotz Auswahl für Mainboard only) bei Taoabo so stimmt weiß allerdings nichts.

Das hatte ich auch gefunden aber da wird mir für jede Auswahl 500 CNY angezeigt. Vermutlich ist das das günstigste Produkt und die Preisaktualisierung klappt nicht wenn man ein anderes wählt.

Leonidas
2023-12-01, 10:14:08
Um einen einfachen Office-PC hinzustellen und damit Arbeitsfähigkeit zu sichern, reicht es. Und es ist die Ausgangslage für mehr. Aber natürlich sind sie trotzdem noch weit vom westlichen Performance-Niveau entfernt - etwas anderes wäre auf 12nm auch nicht zu erwarten. Performance mit Augenzudrücken wie Core i3-10100:
https://www.3dcenter.org/news/news-des-30-november-2023

Der_Korken
2023-12-01, 11:07:08
Ist genaueres bekannt wie gut der Fertigungsprozess ist? Also im Vergleich zu Intel 14nm oder GloFo 12/14nm? Damit man die 50W besser einordnen kann.

basix
2023-12-01, 12:30:10
Soll ein 12nm Prozess sein. Im Vergleich zum 10100 ist das also nicht schlecht, der ist ebenfalls um 50W rum unterwegs

konkretor
2023-12-02, 15:20:51
Für Office reicht doch das Asus Board aus. Sollte es lieferbar sein in China muss ich wohl ne Bestellung aufgeben.

Was ich die letzten Jahre aus China schon organisiert habe, stimmt mich traurig, da bei uns nur noch Einheitsbrei gibt

Loeschzwerg
2024-03-14, 10:21:39
Loongson 3A6000: A Star among Chinese CPUs
https://chipsandcheese.com/2024/03/13/loongson-3a6000-a-star-among-chinese-cpus/

Eine Detailanalyse von Chips&Cheese zum Loongson 3A6000. Kann sich durchaus sehen lassen der LA664 Kern.