PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Kennst du UTF-8?


urbi
2006-03-18, 14:52:09
Hi!
Wie viele PC-User bin ich täglich im IRC. Mir fällt immer wieder auf, wie wenig Leute im Quakenet UTF-8 haben, bzw. wissen was es ist. Jetzt wüsste ich gerne wie die Situtation hier im Forum ausschaut.

Falls ihr mit dem Begriff UTF-8 nichts anfangen könnt, hat ein Freund von mir eine recht ordentliche Zusammenfassung geschrieben: Hier klicken. (http://php-tech.de/utf8_seite.php)

(Die Umfrage solltet ihr am besten machen, bevor ihr euch über den oben angegebenen Link informiert. )

aCiD
2006-03-18, 14:56:58
Irgendwie find ich das unsinnig, wozu soll ich mit Koreanern und Russen kommunizieren? Ich mein das bringt mir nicht viel, auch wenn damit auf jeden Fall schon mal ne Hürde weniger da ist, aber ich wüsste trotzdem nicht wofür das gut sein sollte......^^

Btw. hab ich UTF-8 vorher noch nie gehört und öhm..nun da ich es kenne find ich es...für mich nutzlos^^


Greetz
aCiD

extasyinseln
2006-03-18, 14:57:24
[X] NÖ, nutze es nicht

die antwort fehlt mir im poll :rolleyes:

drexsack
2006-03-18, 14:58:14
Kenn ich nicht, will ich nicht, brauch ich nicht.

The7thGuest
2006-03-18, 14:58:31
Was wohl auch daran liegen könnte, das Mirc bis einschließlich 6.16 kein UTF-8 unterstützt...

extasyinseln
2006-03-18, 15:01:31
Kenn ich nicht, will ich nicht, brauch ich nicht.


ack ! :D

darph
2006-03-18, 15:05:07
IRC ist mir ja egal.

Aber daß die allermeisten Programme (ACDsee und quasi jedes Brennprogramm) noch immer nicht mit Unicode-Support kompiliert werden (gerade bei Brennprogrammen kann ich das nicht nachvollziehen, unterstützt der Joliet Standard Unicode doch schon seit Ewigkeiten), kotzt mich einfach an. In Zeiten der Internationalisierung sollte es doch möglich sein, ein multilinguales System zu basteln und es auch zu unterstützen.

Miranda kann Unicode (y) (Die Aussage im verlinkten Text ist übrigens falsch. Die neueren Builds und alle wichtigeren Plugins gibt's mittlerweile mit Unicode Support)
Notepad++ kann Unicode (y)
Beinahe alles Neuere von Microsoft kann Unicode (y)
Winamp und MPC können Unicode (y)

Darüber hinaus sieht's aber in der Windows Welt reichlich mager aus. Da sind die Linuxer dank einer schon immer internationalen Gemeinschaft deutlich weiter. ;(

Hardwaretoaster
2006-03-18, 15:12:11
es ist noch ein weiterer Fehler in der verlinkten Datei:
Bei XHTMl macht man einen einzelnen Tag mit "/>" zu, bei html reicht ein">", das ist gerade vertauscht.

Spearhead
2006-03-18, 15:15:59
ich benutze normalerweise im chat nicht utf-8 weil in den Channeln in denen ich bin noch iso-15 am verbreitetsten ist. Auf dem PC an sich nutze ich es aber schon, soweit möglich.

govou
2006-03-18, 15:20:26
Natürlich. Aber nicht nur im IRC, sondern auch wenn es um Webseiten geht.

papachrischi
2006-03-18, 15:37:09
WTF? Ich nutze keinen IRC. :biggrin:

Phillemann
2006-03-18, 15:45:02
es ist noch ein weiterer Fehler in der verlinkten Datei:
Bei XHTMl macht man einen einzelnen Tag mit "/>" zu, bei html reicht ein">", das ist gerade vertauscht.

Verstehe ich nicht, ich habe oben doch XHTML angegeben und die Einzel-Tags entsprechend mit einem / abgeschlossen.

darph: Ich bin dem nachgegangen und habe hier mal Miranda installiert, es ist aber - zumindest standardmaessig - im IRC auf ISO-8859 eingestellt. Wie kann ich den Zeichensatz auf UTF-8 umstellen? Oder brauche ich dafuer ein anderes IRC-Plugin?

Hardwaretoaster
2006-03-18, 16:01:01
Hm, ja, die Formulierung ist ein bisschen schwammig in HTML nutzen, erst mit "wenn ihr nicht gerade xhtml [...]" wird das wieder klar.

Binaermensch
2006-03-18, 16:27:33
Ich kenne Unicode/UTF-8, und propagiere schon seit geraumer Zeit seine Verwendung. Alles andere ist Steinzeit.

Mein Gedankengang zu dem Thema:
- Bringt seine Verwendung Nachteile mit sich? Eventuell etwas höherer Speicherplatzverbrauch. Who cares, in Zeiten von zig Megabit-Flatrates?
- Bringt seine Verwendung Vorteile mit sich? Kommt auf den User an.

Wenn man ständig nur im deutschsprachigen Internet unterwegs ist, werden die Vorteile vergleichsweise gering ausfallen. Ist man jedoch zumindest teilweise international unterwegs, werden die Vorteile zunehmend größer. Man denke nur an die Probleme die es alleine in diesem Forum gab, als das €-Zeichen eingeführt wurde. Jeder benutzte nen anderen Zeichensatz, jeder codierte das €-Zeichen auf andere Art und Weise, weshalb plötzlich bei einem sehr großen Teil der Forennutzer nur mehr Fragezeichen oder kleine quadratische Boxen stattdessen zu sehen waren.

Zwar hat sich diese Problematik in der Zwischenzeit glücklicherweise gelegt, jedoch hat es die Unzulänglichkeiten der Benützung zig verschiedener Zeichensätze ziemlich gut veranschaulicht.


Zusammenfassend kann man sagen: Unicode gibt es genau aus dem Grund, aus dem es auch Internationale Maschinenbaunormen (ISO) gibt: Der Kompatibilität wegen.

(Nicht umsonst wurde Unicode von der International Standardization Organisation „miterfunden”)


edit: Seht ihr auch diesen Anzeigefehler? Kommt ja wie gerufen.
Zum Zeitpunkt des Schreibens sah mein Post so aus:
http://maas-neotek.de/gepostet/unicode_1.png

Jetzt wird er bei mir so angezeigt:
http://maas-neotek.de/gepostet/unicode_2.png

Mit Unicode wäre das nicht passiert.

darph
2006-03-18, 16:52:45
Wie kann ich den Zeichensatz auf UTF-8 umstellen? Oder brauche ich dafuer ein anderes IRC-Plugin?
Was IRC angeht: Keine Ahnung. Aber ich kann bestätigen, daß es für MSN, jabber, JabberGmail, ICQ und QQ Unicode Builds gibt. Die Clists gibt's auch mit Unicode, sowie die meisten Srmms und es gibt sogar eine History+.

Die meisten Plugins kommen doppelt - einmal mit und einmal ohne Unicode-Support kompiliert, damit es auch auf 98er Windows läuft. Eventuell mußt du das entsprechend andere Plugin laden.

IRC basiert ja einerseits auf der irc.dll und der chat.dll, welche die GUI bereit stellt. Letztere ist hier als Unicode-Build vorhanden. Wenn das so läuft, wie ich mir das vorstelle, sollte es der irc.dll egal sein, in welchem Format die Zeichen hin und her geschaufelt werden. Besorg dir einfach mal die neueste Nightly.

darph
2006-03-18, 16:56:11
- Bringt seine Verwendung Nachteile mit sich? Nicht die geringsten.
Nunja, unter Umständen wird die Datei größer. Mithin ja dann doppelt so groß. Unter Umständen.

Ein weiterer Nachteil ist die Abwärtskompatibilität zu beispielsweise Win98, das durchaus noch Verbreitung hat. Natürlich stellt sich die Frage, ob es wirklich nötig ist, dazu noch Kompatibilität aufrecht zu erhalten oder ob man totgesagt nicht einfach ruhen lassen sollte...

HellHorse
2006-03-18, 17:00:42
Ich kenne Unicode/UTF-8, und propagiere schon seit geraumer Zeit seine Verwendung. Alles andere ist Steinzeit.
[x] :up:
(ausser natürlich in DNS-Addressen, da ist Unicode pöse und es muss ACSII sein)

Binaermensch
2006-03-18, 17:02:17
Nunja, unter Umständen wird die Datei größer. Mithin ja dann doppelt so groß. Unter Umständen.Stimmt. Zwar muss ich gestehen das bewusst verschwiegen zu haben (ob ein Textfile 100 oder 200kiB groß ist, ist mir ziemlich egal), jedoch war „nicht die geringsten” vielleicht doch etwas übertrieben.

Habe den Satz entsprechend geändert.

Ein weiterer Nachteil ist die Abwärtskompatibilität zu beispielsweise Win98, das durchaus noch Verbreitung hat. Natürlich stellt sich die Frage, ob es wirklich nötig ist, dazu noch Kompatibilität aufrecht zu erhalten oder ob man totgesagt nicht einfach ruhen lassen sollte...Ich bin nicht davon ausgegangen, dass Win98 heute wirklich noch benutzt wird. Du scheinst besser informiert zu sein. Mein Fehler.

Sephiroth
2006-03-18, 17:33:37
Was bringt UTF-8 in einem Chat, wo meist ohnehin englisch gesprochen wird oder ISO-8859-1(5) oder die Windows Codepage 1252 reicht?
Aber ein wohl noch viel größer Grund ist wohl der, daß mIRC erst mit der neuen Version 6.17 UTF-8 unterstützt und auch Trillian erst mit der Version 3.0.

Meiner Meinung nach macht UTF-8 in einem Chat nur sehr sehr selten Sinn!

Schnappi
2006-03-18, 17:44:22
Meine Website ist mit UTF-8 gecodet :uhippie:

Controller Khan
2006-03-18, 19:51:21
Unicode ist sicher sinnvoll, nur wieviel Programme können es und seit wann ?

Zu Windows 98 Kompatibilität.

Windows 98 ist noch ziemlich verbreitet, insbesondere bei denen, die nicht alle paar Jahre einen neuen Rechner kaufen.

Hacki_P3D
2006-03-18, 20:17:15
benutze es auch, bei Datenbanken (DB2)

clm[k1]
2006-03-18, 20:58:10
Was bringt UTF-8 in einem Chat, wo meist ohnehin englisch gesprochen wird oder ISO-8859-1(5) oder die Windows Codepage 1252 reicht?
Aber ein wohl noch viel größer Grund ist wohl der, daß mIRC erst mit der neuen Version 6.17 UTF-8 unterstützt und auch Trillian erst mit der Version 3.0.

Meiner Meinung nach macht UTF-8 in einem Chat nur sehr sehr selten Sinn!
Und was ist, wenn in einem Chat nicht englisch geschrieben wird? Dann siehst du eventuell statt Umlauten nur Zeichensalat.


clm[k1]

PHuV
2006-03-18, 21:32:32
Ich kenne Unicode/UTF-8, und propagiere schon seit geraumer Zeit seine Verwendung. Alles andere ist Steinzeit.
Zusammenfassend kann man sagen: Unicode gibt es genau aus dem Grund, aus dem es auch Internationale Maschinenbaunormen (ISO) gibt: Der Kompatibilität wegen.
:

Mit Unicode wäre das nicht passiert.[/I][/COLOR]

Tja, dann erinnere ich nur mal dran, daß es mittlerweile Unicode in zig Versionen gibt, zudem noch ein UCS2/UCS4, was auch wieder nicht ganz kompatibel ist usw.

Und ich arbeite in einer Branche, wo mit Hilfe von Datenübertragung von Nachrichten (Bestellungen, Lieferscheine, Rechnungen etc.) viel kommuniziert wird, und da macht es sehr wohl einen Unterschied, ob die Daten 5 oder 10 MB (Unicode 16) oder 20 MB (Unicode 32) haben.

UTF-8 halte ich hier noch für das kleinere Übel.

hyperterminal
2006-03-18, 21:36:58
Ich kenne UTF-8, benutze es aber nur selten, da ich eine Tastatur mit us-amerikanischen Tastaturlayout besitze und deshalb sowieso nur Zeichen verwenden kann, die im ISO-8859-1 Zeichensatz enthalten sind.

darph
2006-03-18, 22:20:42
Ich kenne UTF-8, benutze es aber nur selten, da ich eine Tastatur mit us-amerikanischen Tastaturlayout besitze und deshalb sowieso nur Zeichen verwenden kann, die im ISO-8859-1 Zeichensatz enthalten sind.
Öhm... das betrifft aber doch bestenfalls die kleinen Aufkleberchen auf den Plastikköpfen der Tasten.

Sowohl unter Linux als auch unter Windows kannst du das Eingabegebietsschema jederzeit ändern. Zwar ist dann die Belegung einer Taste nicht unbedingt konsistent mit ihrer Beschriftung, aber prinzipiell sollte es überhaupt kein Problem sein, das Tastaturlayout auf Deutsch oder Chinesisch oder whatever umzustellen.

Wer sowas öfters macht, profitiert natürlich enorm von dieser tollen und wohl sündhaft teuren russischen OLED-Tastatur... :)

HellHorse
2006-03-19, 01:24:23
Ich kenne UTF-8, benutze es aber nur selten, da ich eine Tastatur mit us-amerikanischen Tastaturlayout besitze und deshalb sowieso nur Zeichen verwenden kann, die im ISO-8859-1 Zeichensatz enthalten sind.
Also solange du nur ASCII verwendenst, kannst du das auch als UTF-8 resp ISO-8859-1 verkaufen. Das ist ja der ganze Scherz hinter UTF-8, dass ASCII eben nicht grösser wird.

HellHorse
2006-03-19, 01:29:09
Und ich arbeite in einer Branche, wo mit Hilfe von Datenübertragung von Nachrichten (Bestellungen, Lieferscheine, Rechnungen etc.) viel kommuniziert wird, und da macht es sehr wohl einen Unterschied, ob die Daten 5 oder 10 MB (Unicode 16) oder 20 MB (Unicode 32) haben.

UTF-8 halte ich hier noch für das kleinere Übel.
Yay, und dann gibt es von UTF-16/32 natürlich immer noch LE und BE Varianten :ugly:

Zudem muss jeder XML Parser UTF-8 beherrschen, alles andere ist optional.

GloomY
2006-03-19, 09:32:32
Stimmt. Zwar muss ich gestehen das bewusst verschwiegen zu haben (ob ein Textfile 100 oder 200kiB groß ist, ist mir ziemlich egal), jedoch war „nicht die geringsten” vielleicht doch etwas übertrieben.Gerade bei UTF-8 sollte es doch fast nichts ausmachen. Die meisten Zeichen in einem Text sind doch aus dem 7-Bit ASCII Alphabet und die werden in UTF-8 genauso mit nur einem Byte codiert. Nur bei einigen wenigen Zeichen wie Umlauten oder dem Euro-Zeichen muss man aus diesem Bereich heraus und damit für diese wenigen Zeichen zwei statt einem Byte verwenden.

Es sei denn man benutzt natürlich gänzlich ein anderes Alphabet (z.B. kyrillisch). Aber selbst dann sind z.B. die Ziffern, Satzzeichen uvm. immer noch aus dem 7-Bit ASCII-Alphabet und damit nur ein Byte groß.

Auf eine echte Verdoppelung der Größe wird es daher nie hinauslaufen.

edit: Hab' nicht gesehen, dass Hellhorse das ja auch schon geschrieben hat...
(ausser natürlich in DNS-Addressen, da ist Unicode pöse und es muss ACSII sein)Hmm, reine Verständnisfrage (ich kenne mich da überhupt nicht aus): Wie werden dann Umlautdomains übertragen?

Pompos
2006-03-19, 10:29:58
Kenne es und benutze es aber nur für Webseiten, was leider auch schon ein Pain-in-the-Ass ist. Ich würde es auch gern für meine Musik nutzen, aber irgendwie wirds da etwas kompliziert mit UTF und ID3.... naja wat solls.

Thodin
2006-03-19, 11:58:42
[x] kenne es, brauche es aber nicht

joa, viel mehr gibt es dazu nicht zu sagen