[archimedes] Re: Frage wegen Omniclient, Dateinamen und -typen

  • From: Alexander Ausserstorfer <bavariasound@xxxxxxxxxxxxxxx>
  • To: archimedes@xxxxxxxxxxxxx
  • Date: Tue, 28 Nov 2017 01:22:26 +0100

Am 27.11.2017 um 20:11 schrieb Carlos Michael Santillan:

ASCII hat 7 Bit und damit 128 mögliche Zeichen. Einige davon sind
Steuerzeichen. Das Problem ist das Latin1 und UTF-8 nicht kompatible
sind. Mal von den ASCII Zeichen abgesehen. ISO 8859-1 hat 8 Bit/255
Zeichen und UTF-8 kann bis zu 32 Bit haben.

"Kein Mensch verlangt, dass die Software arabische, hebräische oder
was-weiß-ich-sonst-noch-was für Schriftzeichen können soll." Hauptsache
deutsch ist drin und die Araber, Franzosen, Juden und
was-weiß-du-sonst-noch-wer sind ja zum Glück keine Menschen. ;-(

Die Franzosen nutzen lateinische Buchstaben als Grundlage, und deren
"Zeichen" sind ebenfalls problemlos in einem aus 256 Bytes bestehenden
Zeichensatz unterzubringen, wie uns der Standard-Zeichensatz von RISC OS
zeigt. Daher hatte ich die Franzosen _nicht_ ausgeschlossen. Zumal
Frankreich meine zweite Heimat ist (Québec die dritte).

Man fing mit sieben Bit an. Die meisten Rechner arbeiten heute aber
vermutlich eher mit Bytes, bestehend aus 8 Bit.

Wenn man noch mehr verschiedene Zeichen in dem _gleichen_ Zeichensatz
unterbringen möchte, muss man natürlich die Anzahl der Bits für ein
Zeichen erhöhen, was aber zu einem erhöhten Speicherbedarf führt. Für
mich klingt es vernünftiger, wenn man hier mit _verschiedenen_
Zeichensätzen arbeitet und den entsprechenden je nach Bedarf verwendet.

Wie gesagt: das, was man im Deutschen an Zeichen braucht, lässt sich
problemlos in 8 Bit codieren. Warum soll man dann mehr hernehmen wie in
UTF-8, wo es doch gar nicht notwendig ist? Das ist der Punkt, den ich
nicht verstehe.

A.

-- 
http://home.chiemgau-net.de/ausserstorfer/

Attachment: 0x35E1F654.asc
Description: application/pgp-keys

Attachment: signature.asc
Description: OpenPGP digital signature

Other related posts: