[SKRIVA] Svenska oden och aventyr, i arans och hjaltarnas sprak

Nå, mitt testmeddelande såg OK ut, i alla fall för mig.
  Som bekant hade jag tidigare en del strul med det, vilket föranledde några 
kommentarer. Jag råkade troligen ut för något spyware (eller liknande 
Elakhetsprogram) eller någon Oönskad Uppdatering. Antingen har Hotmail 
uppdaterat sitt system eller så har jag råkat ut för någon uppdatering av 
Explorer (lätt hänt; Microsoft frågar ibland "Vill du uppdatera?" och klickar 
man fel råkar man ut för Eländet - jag brukar normalt vara försiktig med att 
acceptera s k "uppdateringar"!).
  Jag fick en massa konstigheter i mitt Hotmail samtidigt. I adressfältet dök 
det upp en pennsymbol med innebörden "klicka här för att redigera adressen", 
vilket jag inte sett förut, och jag fick "auto completion" på en massa 
E-adresser som jag inte haft förut. (Och jag kunde konstatera att det inte var 
Windows' addressbok som stod för dessa, så det är möjligen själva hotmailet som 
börjat med det.) Tecknen "i datorn" var det aldrig problem med - skrev jag 
något i en ordbehandlare var det precis som vanligt - utan det var något mellan 
datorn och nätet. (Troligen felkodning i en mail header-post, som talar om för 
omvärlden hur det jag skickar skall teckentolkas.)
  Det här med främmande språks tecken har alltid varit ett jätteproblem i 
datorvärlden. En kort historik:
 
* Före PC:n hade de s k stordatorerna (alltså stora skåp som upptar ett 
mellanstort rum) olika standarder för hur tecken skulle skrivas. En vanlig 
standard kallades t ex EBCDIC. Amerikanerna tog sig sedan samman och skapade en 
teckentabell kallas ASCII (American Standard Code for Information Interchange). 
Där "mappades" varje tecken till en tabell definierad av sju bitar (varje 
tecken är ju en sträng av bitar, vanligen sju, åtta eller 16 bitar, det senare 
i s k Unicode). Tyvärr glömde man i ASCII att skapa utrymme för en massa 
icke-engelska tecken (och det fanns kanske inte plats för det heller).
 
* För de allra första PC:arna körde man en "om-mappning", kan vi kalla det, där 
vissa mindre använda ASCII-tecken fick representera svenska tecken. Då fick vi 
de berömda s k måsvingarna (krullparenteser, hakparenteser m m). Vi snackar nu 
om de allra tidigaste DOS-versionerna, typ DOS 1.0 och 1.1, så där 1982-83. Det 
var litet före min tid (fick min första PC 1985) men jag råkade ofta ut för 
applikationer som inte tålde IBM PC:s svenska PC-tecken. Man fick skriva saa 
haer foer att det skulle foerstaas. (Ty applikationerna tålde oftast inte 
"måsvingarna". Programmens kompilatorer hade förinställt att enbart tåla 
engelska alfabetets A-Z.)
 
* PC:n kunde hantera åtta bitar, så IBM upprättade en åttabitars teckentabell 
som hade plats för svenska tecken och en del andra västeuropeiska dito. Det 
brukade kallas IBM-ASCII. Gamla DOS-program kräver IBM-ASCII. Kör man vad som 
numera i praktiken är DOS-emulering under Windows hanteras detta dock 
automatiskt, via översättning. (Fram till ungefär Win 98 eller ME körde man 
dock i praktiken DOS "rent"; Windows var ett pålägg ovanför DOS.)

* Och det var ju bra, men mycket av resten av världen gillade inte IBM:s 
PC-ASCII, som förresten inte kunde hantera riktigt alla språk (tonvikten var 
Västeuropa), så när Windows kom bytte man teckensystem ytterligare en gång (har 
för mig att det kallas ISO-8859, i alla fall för språk baserade på latinska 
tecken) som kunde klara litet fler språk men förstås inte var kompatibelt med 
PC-ASCII. (Vid textimport från PC-ASCII fick man grekiska sigma, isländska 
tecken osv...) Och Macintosh körde något eget (som jag inte riktigt vet var det 
var).
 
* Så kom Internet, och nätet var länge definitionsmässigt *sjubitsbaserat*! Det 
betyder  att man för E-mail m m borde skicka s k måsvingar (riktig ur-ASCII). 
Och gjorde man inte det så "trunkerades" (den skars bort) den åttonde biten, 
och resultatet kunde bli litet av varje... Därför satt jag själv långt in på 
90-talet och skickade mina E-mail 7-bitsbaserat.
 
* Men nätet fick med tiden allt mer transparens för åttabitars-tecken. Ofta 
fungerade ISO-nuffra-standarden från bl a Windows. Problemet var att det inte 
alltid funkade, så någon smartskalle fick för sig att introducera något kallat 
QP (Quoted Printable; ingick bl a i MIME) som betydde att om ett tecken var 
åttabitars, skrevs det om till en ström av tre sjubitstecken. (Och det var det 
ni fick se mina svenska tecken som, i mail från morgonen.)
 
* Och som det inte var nog, noterade någon att åtta bitar (även om de kan 
läggas i en rad olika tabeller) inte räcker till mer än 256 tecken (eller flera 
tabeller med 256 tecken var). Kinesiska har många fler tecken, och koreanska, 
och så finns matematiska tecken, osv. Så man kom på Unicode, där tecken 
representeras av 16 bitar och det finns plats för ca 65 000 tecken - större 
delen av kinesiska tecknena t ex. Jag tror t o m att vikingarnas futhark är 
mappad någonstans i Unicode-rymden...
 
Jag vet inte om jag fick exakt alla detaljer korrekt i denna snabbgenomgång, ty 
teckengenerering i datorvärlden är ett intrikat och rörigt ämne. Men jag tror 
ni ser tendensen i historiken: datorers teckenhantering är och har alltid varit 
en maximal huvudvärk. Det är mycket mer komplicerat än många tror, och sker 
bara något litet fel någonstans får man ut rappakalja. I denna genomgång har 
jag, om jag minns rätt, berört EBCDIC, ASCII, PC-ASCII, ISO-nuffra, Mac, QP, 
Unicode... *
  Det i stort sett enda som fungerar, för det mesta, är ASCII - och det skall 
då egentligen vara ur-ASCII på 7 bitar. (Men går man till en kinesisk hemsida, 
får man ändo trots alla goda intentioner oftast strängar av "skräptecken". 
Eller man kan få se kinesiska tecken, om man råkat ut för någon 
Unicode-uppdatering av sitt system.)
  Så det så.
 
--Ahrvid
 
* Och när vi får kontakt med utomjordingarna, kommer SETI-projektet inte att 
begripa det, för ET kommer att ha sin egen teckentabell... (Kanske ESCII, 
Extraterrestial Standard Code for Information Interchange.)

--
ahrvid@xxxxxxxxxxx / Gå med i SKRIVA - för författande, sf, fantasy, kultur 
(skriva-request@xxxxxxxxxxxxx, subj: subscribe) YXSKAFTBUD, GE VÅR WCZONMÖ 
IQ-HJÄLP! (DN NoN 00.02.07)                                        
_________________________________________________________________
Show them the way! Add maps and directions to your party invites. 
http://www.microsoft.com/windows/windowslive/products/events.aspx-----
SKRIVA - sf, fantasy och skräck  *  Äldsta svenska skrivarlistan
grundad 1997 * Info http://www.skriva.bravewriting.com eller skriva-
request@xxxxxxxxxxxxx för listkommandon (ex subject: subscribe).

Other related posts:

  • » [SKRIVA] Svenska oden och aventyr, i arans och hjaltarnas sprak - Ahrvid Engholm