UniCode ist ein universeller Zeichensatz, der Zeichen aus allen Sprachen dieser Welt enthält (bzw. enthalten kann).

Begriffe:

Mini-HowTo

Font für X11

Wenn man keinen Unicode-Font installiert hat, zeigt z.B. Mozilla bei unbekannten Zeichen nur Kästchen mit jeweils 4 Hexzahlen an.

Abhilfe:

# Debian enthält den Font ttf-freefont, der viele Tausend Unicode-Zeichen enthält
apt-get install ttf-freefont

Des weiteren muss noch locale umgestellt werden: LANG=de_DE.UTF-8

Mozilla

Preferences > Appearance > Fonts, Fonts for Unicode:

Test

http://www.alanwood.net/unicode/unicode_samples.html - bei z.B. cyrillic und greek sollten dann entspr. Schriftzeichen erscheinen. Eine weitere gute Seite mit Beispielen ist http://www.columbia.edu/kermit/utf8.html

Mit ttf-freefont erscheinen dort die wichtigsten Zeichen der wichtigsten Sprachen - aber obwohl dieser Font einige tausend Zeichen enthält, bleiben auf der Testseite doch noch einige "Hex-Kästchen".

Fragen und Antworten

Frage: Wie ist denn der Stand beim Unicode-Support? Inwieweit gibts Unterstützung vom Betriebssystem, welche Anwendungen funktionieren damit? (Euro-Symbol, gleichzeitige Verwendung von osteuropäischen, türkischen und spanischen Zeichen in einem Text, etc.)

Distributionen:

Anwendungen: Standardmäßig werden alle neueren GNOME- / GTK-Programme wie z.B. GRip oder easytag für das Dateisystem utf-8, was zu Problemen führt, wenn der Rest des Systems noch ISO-8859-15 nutzt: es werden keine Umlaute und andere Sonderzeichen angezeigt. Daher kann man den Parameter G_FILENAME_ENCODING=@locale setzen (entweder systemweit in /etc/enviroment oder per User in ~/.xsession).

Editoren

Programmiersprachen:

Betriebssystem:

Generell:

Tools:

Migration von Dateien

Zuerstmal sollte man alle Dateinamen migrieren, das geht am Besten mit convmv:

convmv -f iso-8859-15 -t utf-8 -r .

Beim mount kann ebenfalls mitgeteilt werden, wie die Dateinamen kodiert sind (z.b.: mount -t vfat -o utf8 ... ).

Die Konvertierung von Dateiinhalten ist schwieriger, prinzipiell kann und sollte man nur Dateien konvertieren, die ausschließlich Text beinhalten und keine Binärdaten.

UniCode (zuletzt geändert am 2007-12-23 22:49:44 durch localhost)